Foto: Freepik

Co Movie Gen nabízí?

Meta ve své zprávě ukázala několik příkladů videí vytvořených pomocí Movie Genu. Jedním z nich je radostný hrošík plovoucí pod vodou, zatímco další ukázka obsahuje tučňáky oblečené ve viktoriánském stylu, i když ne úplně přesně vzhledem k historickým reáliím. Ještě jiný příklad zobrazuje DJku hrající vedle geparda, který je příliš zaujatý hudbou, aby si všiml potenciálního nebezpečí.

Movie Gen zvládá nejen generování videí, ale také jejich úpravy na základě textového zadání. Dokáže například vytvořit video na základě obrázku, nebo přidat zvuky a hudbu do již existujícího záznamu. Tento prvek představuje významný posun oproti konkurenci, která se zatím soustředila hlavně na samotné generování vizuálních efektů bez možnosti další práce s vytvořeným obsahem.

Srovnání s konkurencí

Generování videí pomocí umělé inteligence se v poslední době stává horkým trendem v technologickém světě. Společnosti jako Microsoft a OpenAI se snaží vyvinout vlastní nástroje pro tvorbu videí, jako jsou VASA-1 a Sora. OpenAI slibovala realistická videa již od února, ale zatím tento nástroj nebyl plně uveden do provozu. Movie Gen od Meta však nabízí výhody, jako je například schopnost editovat již existující videa a přidávat k nim generovaný zvuk, což posouvá hranice toho, co je možné v oblasti AI generace obsahu.

Meta ve svých příkladech demonstrovala také schopnost Movie Genu zachovat původní obsah videa, zatímco do něj přidává nové prvky, jako jsou různé scenérie nebo kostýmy postav. Navíc Meta ukázala, jak lze například vložit fotografie lidí do generovaných filmů, čímž se rozšiřuje možnost práce s vizuálními a zvukovými efekty.

Zvuková a hudební generace

Meta již dříve představila modely pro generování hudby a zvuků, ale Movie Gen jde ještě dále. Jeho 13miliardový parametrický model dokáže přidávat zvukové efekty a soundtracky přímo do videí. Například zadáním textu „šustění listí a praskání větví“ lze vytvořit realistický zvuk doprovázející hada proplétajícího se lesem. Aktuálně je zvuková generace omezena na 45 sekund, což není dostatečné pro celé filmy, ale Meta slibuje, že v budoucnu bude tuto schopnost dále rozšiřovat.

Budoucnost generování videí pomocí AI

Movie Gen je stále ve fázi vývoje a zatím není dostupný veřejnosti. Chris Cox, produktový ředitel společnosti Meta, uvedl, že tento nástroj je zatím příliš nákladný a doba generování je příliš dlouhá na to, aby mohl být uvolněn pro širokou veřejnost. Meta pracuje na optimalizaci a vylepšování tohoto nástroje, což by mělo v budoucnu přinést rychlejší a cenově dostupnější řešení.

Podle interního dokumentu Meta je Movie Gen tvořen několika základními modely, z nichž největší má 30 miliard parametrů a maximální kontextovou délku 73 000 video tokenů. Zvuková generace je řešena 13miliardovým modelem, který zvládá jak přenos videa do zvuku, tak text-to-audio.

Etické otázky a tréninková data

Ačkoli Meta patří mezi málo firem, které stále zveřejňují data o svých AI nástrojích, stále není zcela jasné, odkud Movie Gen čerpá tréninková data. Existují spekulace, že Meta může používat videa nahraná uživateli Facebooku nebo fotografie pořízené chytrými brýlemi Meta Ray-Ban. To vyvolává otázky týkající se ochrany soukromí a práv uživatelů.

Na druhé straně Meta spolupracuje s filmaři a producenty, aby vyvinula model, který by byl užitečný i pro profesionální filmový průmysl. Už nyní se šíří zprávy o tom, že některé hollywoodské produkce navazují spolupráci s AI firmami. Například nezávislé studio A24 spolupracuje s venture kapitálovými firmami, které jsou napojeny na OpenAI, a Meta vede jednání s hvězdami jako Judi Dench nebo Awkwafina ohledně použití jejich hlasů v budoucích AI projektech.

Závěr

Generování videí pomocí umělé inteligence je technologií, která může zásadně změnit způsob, jakým vznikají filmy a vizuální obsah. Movie Gen od Meta je nástrojem, který posouvá hranice toho, co je možné v této oblasti dosáhnout. Ačkoli je stále ve vývoji, jeho potenciál pro profesionální filmaře i amatéry je nepopiratelný. Výzvy však stále zůstávají, ať už jde o technické překážky, nebo etické otázky ohledně použití tréninkových dat a ochrany soukromí uživatelů.

Zdroj: Gizmodo.com (odkaz)