Click

Огляд найцікавіших нейромереж осені 2023 - зими 2024: створюємо відео, навчаємо провідних іноземних мов

Partners24
By -
0
    Бум на нейромережі, незважаючи на затишшя, нікуди не зник. Як і раніше з'являються нові, цікаві ІІ-сервіси, що полегшують роботу та творчість у різних сферах. У статті розповідаємо про новинки цієї осені, які стануть у пригоді при створенні різних креативів — не тільки в арбітражі , а й у творчому житті. 

    HeyGen - якісні дипфейки іноземними мовами HeyGen - генеративна нейромережа від компанії OpenAI для розпізнавання у відео мовлення та перекладу її іншою мовою. Це не основна функція сервісу, але саме завдяки ній HeyGen став популярним.


    Заснована кілька років тому Джошуа Сюй та Уейном Ляном, платформа під назвою Movio призначалася для створення відео з AI-аватарами та накладеними голосами. Ця концепція збереглася, лише пізніше додали інструменти озвучування текстів різними мовами, розпізнавання голосу та створення дипфейків із збереженням міміки персонажа. У вересні 2023 року вже під назвою HeyGen розробники представили розширену за функціоналом бета-версію. 

Особливості HeyGen 

  • Створення відео під різні завдання – рекламу, презентації, навчальні, ролики для соцмереж; 
  • Вибір аватара для ролика з запропонованих варіантів 100+ рас, віку та іміджів. Під кожен аватар розроблені унікальні емоції, міміка та жести; 
  • Вибір більш ніж 50 голосів із перекладом на популярні мови та діалекти. Серед доступних мов: англійська, французька, німецька, іспанська, італійська, голландська, португальська, китайська, японська та хінді. 
Можливості перекладу та озвучування російською поки немає, але з російської на інші мови перекладати можна. 

Також користувачі отримують такі можливості:

  • Налаштування швидкості, тональності та голосової інтонації з додатковим вибором пауз та наголосів у мові; 
  • Підбір фону з колекції HeyGen або використання власного завантаженого з комп'ютера;

  • Додавання музики — власної чи обраної у бібліотеці сервісу;
  • Додавання логотипів, титрів, водяних знаків та інших креативних деталей, що унікалізують відео; Збереження відео, у тому числі в HD-якості з роздільною здатністю 1080 пікселів.
  • Отримання посилання для сайту або шерингу в соцмережах.

Як працювати з HeyGen 

    Почати роботу з відео можна безкоштовно, натиснувши кнопку «Try HeyGen for Free», після чого потрібно створити емейл-акаунт або авторизуватися за допомогою Google, Facebook* або системи єдиного входу Single Sign-On.
Інтерфейс дашборда HeyGen простий і нехитрий, всі назви меню інтуїтивно зрозумілі навіть для людини, що погано володіє англійською. У верхній частині розташовуються чотири активні меню, за допомогою яких можна створити аватар або згенерувати відеокреатив - Instant Avatar, Photo Avatar, Template, AI Script.

    Основна робота з відео ведеться у меню Template. При натисканні на команду на екрані з'являється форма для створення горизонтального/вертикального відео. Одночасно можна вибрати формат ролика - рекламний, презентаційний, новинний, комерційний і таке інше. Після вибору основних налаштувань сервіс перенаправляє у вбудований відеоредактор для роботи з конкретним роликом. Тут можна вибирати варіанти перекладу, завантажувати власні аудіоскрипти, додавати паузи та користуватися іншими способами монтажу, у тому числі за допомогою ІІ.
    Перевага HeyGen у тому, що тут є безліч додаткових інструментів роботи з голосом та візуалом. Наприклад, команда Clone voice дозволяє дублювати власний голос на всі основні мови AI-сервісу. Функціонал TalkingPhoto допомагає "оживляти" статичні фото, що зручно при створенні анімованих аватарів. Також HeyGen дає можливість за допомогою хмарної платформи Zapier інтегрувати створювані креативи з сотнями додатків, систем, соціальних мереж, CRM тощо. 

Тарифи HeyGen 

    Безкоштовна версія сервісу дозволяє працювати з двома роликами по 30 секунд або одним роликом тривалістю в 59 секунд. На це є два умовні кредити, кожен кредит – хвилина згенерованого відео. Плани Creator та Business пропонують різну кількість щомісячних кредитів – від 15 до 300 за різними цінами. Найдешевший варіант використання 15 кредитів плану Creator коштуватиме $24 на місяць, дорогий — 300 кредитів плану Business — $720 щомісяця. При виборі річного тарифу діє знижка 20%. У HeyGen є також індивідуальна пропозиція Enterprise із кастомізованим набором інструментів.

    При оплаті сервісу знадобиться картка іноземного банку, російські картки не підтримуються. 

Переваги та недоліки HeyGen До плюсів сервісу належать: 

  • Легкість монтажу. Розібратися з налаштуваннями при створенні відео може будь-яка людина, яка мінімально володіє англійською мовою. 
  • Висока якість креативів. На виході користувачі отримують відеоролики з чистим звуком та гарною дикцією ведучого; 
  • Пристойна варіативність налаштувань. Велика кількість налаштованих шаблонів дикторів з різними характеристиками голосів і фонів дозволяють робити професійні відео. 

Серед мінусів користувачі зазначають: 

  • Відносну механістичність голосів. З використанням шаблонів помітна легка голосова штучність, особливо у довгих роликах; 
  • Відсутність детального промальовування емоцій на обличчях. При уважному розгляданні осіб користувачі відзначають статичність міміки, що призводить до беземоційності окремих епізодах; 
  • Довге очікування на результати. Процес генерації роликів навіть на платних тарифах може тривати до кількох годин. Це спричинено, швидше за все, піковими навантаженнями серверів. 

Висновок 

    HeyGen досить швидко стала популярною нейромережею. Особливо її оцінили блогери та любителі незвичайних креативів. Однак багатьох людей відлякує прайс на використання: $24 на місяць на генерацію 15 хвилин відео - це витрати для звичайних користувачів.

Шедеврум - малюємо та складаємо тексти разом з Яндексом

    Шедеврум від Яндекса у вигляді прототипу з'явився ще у квітні 2023 року. У перші місяці після презентації було багато критики на адресу сервісу. Однак нейромережа постійно оновлювалася, і осінній реліз представляє Шедеврум як повноцінний інструмент для створення зображень, тексту та відео. Безкоштовний AI від Яндекса працює на основі технології каскадної дифузії: створює базове зображення і потім поступово додає на нього деталі згідно з заданим промптом. На виході виходять чотири різні зображення на вибір. 
    З моменту запуску Шедеврум замислювався як велике співтовариство користувачів, які можуть створювати контент, а й публікувати його у спільній стрічці. При цьому людям пропонувалося оцінювати та коментувати креативи, підписуватись один на одного. Таким чином, нейромережа від Яндекса фактично будує соціальну мережу навколо свого ІІ. 
    Влітку 2023 року до Шедеврума підключили YandexGPT — мовну модель, яка генерує текст на запит. У серпні нейромережа «навчилася» склеювати кілька зображень у відеороликах. Особливості Шедеврум від Яндекса Для створення власних креативів програму Шедеврум необхідно завантажити з Google Play або AppStore. У браузері можна лише переглядати чужі зображення та лайкати їх.

Як виглядає програма при запиті 


    Додаток дозволяє генерувати картинки з роздільною здатністю 1024х1024, самостійно встановити бажану роздільну здатність і співвідношення сторін не вийде. Однак у вікні введення промпту є підказки, що модифікують, — «професійне фото», «реалістично», «яскраве освітлення», «в стилі Далі» і так далі. Мовна модель YandexGPT при генерації тексту працює так само, як і в сервісі Аліса, тільки в нейромережі Шедеврум обов'язково з'являється ще й заголовок. Відразу пропонується на вибір кілька генерованих під текстовий запит зображень.
    При створенні відео можна генерувати короткий ролик завдовжки 4 секунди з частотою 24 fps. У процесі створення Шедеврум просить описати основну ідею та пропонує 4 кадри на вибір. Одночасно користувач повинен визначитися з типом анімації, який "оживить" кадр - таймлапс, наближення, панорама, політ, підйом, обертання або поступове змінення малюнка. Інструменти створення відео зараз, втім, доступні невеликій кількості активних користувачів нейромережі. Весь створюваний контент з'являється у загальній стрічці, будь-яку картинку, зокрема чужу, можна зберегти, натиснувши на трикрапку і вибравши відповідний пункт. Як і в будь-якій іншій нейромережі, у Шедеврум є обмеження. 
    Заборонені при генерації промпти із зазначенням конкретних особистостей, згадування політики чи релігії, а також еротика, насильство та жорстокість. Для генерації тексту нейромережі потрібно трохи більше 5-10 секунд, зображення формуються протягом хвилини. Як запустити Шедеврум Після завантаження програми на пристрій потрібно увійти в нього під обліковим записом Яндекс. На головній сторінці з'явиться загальна стрічка постів із опублікованими креативами інших користувачів. 
    Всі записи можна відсортувати за датою чи популярністю, в режимі передплати відображаються лише пости авторів, на яких оформлена передплата. Для створення креативу потрібно натиснути кнопку з «+» у нижній частині програми, після чого вибрати пункт «зображення» або «текст». У вікні нейромережа пропонує написати запит для зображення або тексту. При натисканні на запитання з'являються підказки, які можна гортати пальцем вліво.

    Якщо отриманий креатив не подобається, можна натиснути на кнопку «Перегенерувати» і уточнити запит у поле редактора промпту. Невдалі зображення видаляються під час натискання на піктограму «Кошик». 

Переваги та недоліки Шедеврум 


До плюсів популярної нейромережі від Яндекса належить: 

  • Доступність та простота в роботі. Інтерфейс сервісу максимально спрощений і зрозумілий навіть тим, хто ніколи не скористався технологіями AI. Додаткова перевага в підказках, що з'являються на екрані при створенні ілюстрації або тексту; 
  • Створене ком'юніті навколо нейромережі. Спробу перетворення Шедеврума на соцмережу можна вважати вдалою — люди із задоволенням займаються творчістю, лайкаючи та коментуючи роботи один одного; 
  • Безкоштовність сервісу. Всі інструменти Шедевруму доступні безкоштовно без жодних обмежень. 


Недоліки Шедевруму: 

  • Помилки під час генерації. Як і будь-яка інша нейромережа, технологія від Яндекса видає некоректні в деталях зображення; 
  • Слабка промальовування деталей. За сильної деталізації промптів зростає ризик помилок. Це стосується не лише зображень з кінцівками, а й, наприклад, написів;
  • Перекіс у бік абстракції. Шедеврум непогано генерує абстрактно-сюрреалістичні чи мальовані зображення, але з реалізмом нерідко виникають проблеми. 

    Висновки Соціально-творче замах Шедеврума непоганий: сервіс пропонує людям соцмережу з можливістю генерації креативів у трьох форматах. Але об'єктивно: поки що AI від Яндекса відстає як одержувані зображення від російськомовного аналога Kandinsky від Сбера і тим більше від найпопулярнішого Midjourney. Проте це єдиний на осінь 2023 багатопрофільний ІІ-сервіс в Рунеті з досить простим інструментарієм.



Створюємо короткометражки разом із Runway Gen-2 Runway Gen-2 - 

це нейромережа для генерації відео від розробників популярної Stable Diffusion, сервісу, що дозволяє генерувати якісні зображення різних форматів, у тому числі реалістичні. 

Перша версія AI-відеоплатформи дозволяла перетворювати вихідні зображення та завантажені ролики, в оновленій версії можна створювати відео з текстового запиту з нуля. 

Особливості Runway Gen-2 

Сервіс дає можливість створювати професійні, іноді реалістичні ролики. З додаткових функцій можна вибрати накладання маски, додавання стилізації під шаблон, що задається. Серед інструментів також є розкадрування, рендеринг та кастомізація. 

Особливість сервісу в тому, що згенеровані відео на безкоштовному тарифі не перевищують 4 секунд за тривалістю, а самі запити не можуть бути довшими за 320 символів. На платних тарифах довжина відео зростає до 15 секунд. 

Користуватися Runway Gen-2 можна як у браузерній версії, так і в програмі під iOS . Як користуватися Runway Gen-2 У браузерній версії для реєстрації потрібно натиснути Try runway for free, після чого створити обліковий запис або авторизуватися через Google, Apple -аккаунт або Single Sign-On.

Як користуватися Runway Gen-2 

    У браузерній версії для реєстрації потрібно натиснути Try runway for free, після чого створити обліковий запис або авторизуватися через Google, Apple -аккаунт або Single Sign-On. 


    Інтерфейс дашборду інтуїтивно простий та зрозумілий. Зліва розташована панель інструментів, серед яких меню для створення відео, зображень та 3D-об'єктів. У центральній частині зібрано кілька кнопок з основними інструментами – генерації ролика із завантаженої картинки-референсу, відео чи текстового промпту. Популярні інструменти також винесені на окрему панель з іконками. 
    У нижній частині екрана у розділі Discover and Remix розміщені розташовані плиткою приклади роликів, що надихають.

    Для створення відео потрібно вибрати меню "Start with Image" або "Start with Text", після чого необхідно ввести в поле "Text" запит. У полі «Image» вибирається зображення для референсу, а через меню «Image+Description» до ілюстрації-референсу додається текстовий опис. 


    При натисканні на іконку додаткових налаштувань відкриваються команди: Seed - Число, що визначає випадковість генерації в одному стилі. Номери успішно згенерованих відео можна зберігати для повторення у майбутньому; Interpolate — інструмент згладжування кадрів відео для збільшення плавності; Upscale — функція покращення роздільної здатності відео для більшої чіткості та деталізації; Remove watermark - зняття утермарки на готовому відео. У налаштуваннях Runway Gen-2 також є інструменти детального редагування: Inpainting – видаляє з відео непотрібні об'єкти; Remove Background – працює з фоном відео. 

Тарифи Runway Gen-2 

    У безкоштовній версії сервіс пропонує 125 кредитів для трьох проектів загальним розміром до 5 Гб без можливості видалення вотермарок. Одна секунда генерації дорівнює 5 кредитів. Тариф «Standard» вартістю $12 на місяць або $144 на рік відкриває додаткові можливості: 625 кредитів для необмеженої кількості проектів із загальним розміром відео до 100 Гб.


Тариф "Pro" вартістю $28 на місяць або $336 щорічно відкриває ще більше можливостей - 2 250 кредитів при завантаженні відео на 500 Гб, а також ряд додаткових опцій при редагуванні та експорті роликів. Тариф «Unlimited» за ціною $76 на місяць і $912 на рік дозволяє зняти всі обмеження в редагуванні, бонусом даються щомісяця поновлювані 2 250 кредитів. 

Переваги та недоліки Runway Gen-2 

До плюсів нейромережі належить: 

  • Простота та зручність роботи. Інтерфейс ІІ-сервісу інтуїтивно зрозумілий усім, хто мінімально володіє англійською мовою, а доступ до інструментів відкритий як через бічне меню, так і через інтерактивні кнопки дашборду; 
  • Багато інструментів для редагування. Runway Gen-2 пропонує пристойний набір корисних опцій для генерації роликів як з текстового запиту, так і завантажених референсів-ілюстрацій або власних відео; 
  • Непогана якість готового матеріалу. Вміле використання промптів, референсів та тонких налаштувань дозволяє створювати повноцінні ролики — не лише розважальні, а й рекламні, презентаційні та інші. 

Серед мінусів Runway Gen-2 користувачі відзначають: 

  • Проблеми із деталізацією. Незважаючи на загальну високу якість відео, що генерується, виникають складності з промальовуванням окремих деталей інтер'єру і складних, багатопланових дій; 
  • Проблеми в промальовуванні кінцівок. Є складнощі і з деталізацією людських кінцівок. Також іноді у роликах генеруються зайві, не прописані в промпті, об'єкти чи дублі персонажів. 

Висновок 

    Щоб використовувати Runway Gen-2 повноцінно, потрібно перейти хоч би на стандартний тариф. Це дозволить більш менш вільно експериментувати з відео, отримуючи в результаті наближений до задуму варіант ролика. У цілому нині, обслуговування вже реалізованому функціоналу виглядає солідно.


Tags:

Post a Comment

0Comments

Post a Comment (0)