OpenAI přichází s modelem, který je schopen převádět textové popisy (prompty) na „složité scény s více postavami, specifickými typy pohybu“ a dalšími detaily, které oživují vaši imaginaci. Sora, jak tento model nazvali, umožňuje tvorbu realistických a zároveň kreativních videí z čistě textových pokynů. Představte si, že máte možnost vytvořit fotorealistické video trvající až minutu, a to vše založené na několika málo větách.
Audio na Spotify
Kromě toho Sora nabízí možnost generování videa z pevného obrázku, doplnění chybějících snímků v existujícím videu, nebo dokonce jeho prodloužení. Ačkoliv se mohou objevit určité nedostatky, jako je nepřesná simulace fyziky v komplexních scénách, ukázky videí ukazují, že výsledky jsou velmi působivé.
Tato inovace přichází v době, kdy se schopnosti AI překládat slova na obrazy stále více rozvíjejí, a video začíná nabírat na důležitosti. S příchodem Soray se OpenAI staví do řady s dalšími významnými hráči v této oblasti, jako jsou Runway, Pika a Google's Lumiere, každý s vlastními impozantními modely.
V současnosti je Sora dostupná pouze pro vybranou skupinu testovacích uživatelů, aby se posoudily potenciální rizika a škody. OpenAI také spolupracuje s vizuálními umělci, designéry a filmaři, aby získala cennou zpětnou vazbu.
Na závěr je důležité poznamenat, že s rostoucí schopností AI vytvářet fotorealistická videa se zvyšuje i odpovědnost za rozlišení mezi skutečnými a uměle vytvořenými obsahy. OpenAI se snaží čelit těmto výzvám, například přidáním vodoznaků, které ovšem mohou být odstraněny.