Стрімінгова компанія Netflix розробила нову модель штучного інтелекту під назвою VOID (Video Object and Interaction Deletion), яка дозволяє змінювати сцени у відео вже після завершення зйомок.
Читайте также: Artemis II на підльоті до Місяця: екіпаж тестує скафандри й готується до обльоту земного супутника
Про це повідомляє Business Today із посиланням на офіційну сторінку VOID.
У Netflix стверджують, що модель перевершує існуючі інструменти редагування відео, зокрема Runway, ProPainter і DiffuEraser. За результатами тестування за участі 25 людей, варіанти, згенеровані VOID, обирали приблизно у 65% випадків.
Як працює модель
VOID базується на архітектурі vision-language model (VLM), яка аналізує як візуальні елементи, так і контекст сцени. Після цього система генерує результати, які розробники описують як «фізично правдоподібні».
Технологія дає змогу видаляти об’єкти з кадру та відтворювати сцену так, ніби їх там ніколи не було. На відміну від традиційних інструментів монтажу, модель не просто «затирає» об’єкти, а аналізує взаємодії між ними та перебудовує сцену відповідно до нових умов.
Читайте также: MEGOGO BOOKS запустила доставку книжок до США та Канади
Наприклад, якщо у відео є сцена зіткнення автомобіля з вантажівкою, VOID може прибрати вантажівку і згенерувати альтернативний варіант, у якому аварії не відбувалося. Аналогічно, якщо людина стрибає у воду, модель здатна видалити її та відтворити поверхню води без бризок.
Модель розробили дослідники Netflix у співпраці з академічними партнерами. Компанія вже відкрила доступ до VOID на платформі Hugging Face для розробників і креаторів.
Читайте также: Швеція передасть Україні системи ППО Tridon Mk2 на €400 млн
