Стрімінгова компанія Netflix розробила нову модель штучного інтелекту під назвою VOID (Video Object and Interaction Deletion), яка дозволяє змінювати сцени у відео вже після завершення зйомок.

Читайте также: Artemis II на підльоті до Місяця: екіпаж тестує скафандри й готується до обльоту земного супутника

Про це повідомляє Business Today із посиланням на офіційну сторінку VOID.

У Netflix стверджують, що модель перевершує існуючі інструменти редагування відео, зокрема Runway, ProPainter і DiffuEraser. За результатами тестування за участі 25 людей, варіанти, згенеровані VOID, обирали приблизно у 65% випадків.

Як працює модель

VOID базується на архітектурі vision-language model (VLM), яка аналізує як візуальні елементи, так і контекст сцени. Після цього система генерує результати, які розробники описують як «фізично правдоподібні».

Технологія дає змогу видаляти об’єкти з кадру та відтворювати сцену так, ніби їх там ніколи не було. На відміну від традиційних інструментів монтажу, модель не просто «затирає» об’єкти, а аналізує взаємодії між ними та перебудовує сцену відповідно до нових умов.

Читайте также: MEGOGO BOOKS запустила доставку книжок до США та Канади

Наприклад, якщо у відео є сцена зіткнення автомобіля з вантажівкою, VOID може прибрати вантажівку і згенерувати альтернативний варіант, у якому аварії не відбувалося. Аналогічно, якщо людина стрибає у воду, модель здатна видалити її та відтворити поверхню води без бризок.

Модель розробили дослідники Netflix у співпраці з академічними партнерами. Компанія вже відкрила доступ до VOID на платформі Hugging Face для розробників і креаторів.

Читайте также: Швеція передасть Україні системи ППО Tridon Mk2 на €400 млн

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *