Sora: video generátor od openAI

OpenAI přichází s modelem, který je schopen převádět textové popisy (prompty) na „složité scény s více postavami, specifickými typy pohybu“ a dalšími detaily, které oživují vaši imaginaci. Sora, jak tento model nazvali, umožňuje tvorbu realistických a zároveň kreativních videí z čistě textových pokynů. Představte si, že máte možnost vytvořit fotorealistické video trvající až minutu, a to vše založené na několika málo větách.

Audio na Spotify


Sora se vyznačuje schopností generovat „složité scény s více postavami, specifickými typy pohybu a přesnými detaily předmětu a pozadí.“ To, jak model chápe existenci objektů ve fyzickém světě a jak dokáže interpretovat rekvizity a generovat postavy vyjadřující živé emoce, je opravdu ohromující.

Kromě toho Sora nabízí možnost generování videa z pevného obrázku, doplnění chybějících snímků v existujícím videu, nebo dokonce jeho prodloužení. Ačkoliv se mohou objevit určité nedostatky, jako je nepřesná simulace fyziky v komplexních scénách, ukázky videí ukazují, že výsledky jsou velmi působivé.

Tato inovace přichází v době, kdy se schopnosti AI překládat slova na obrazy stále více rozvíjejí, a video začíná nabírat na důležitosti. S příchodem Soray se OpenAI staví do řady s dalšími významnými hráči v této oblasti, jako jsou Runway, Pika a Google's Lumiere, každý s vlastními impozantními modely.

V současnosti je Sora dostupná pouze pro vybranou skupinu testovacích uživatelů, aby se posoudily potenciální rizika a škody. OpenAI také spolupracuje s vizuálními umělci, designéry a filmaři, aby získala cennou zpětnou vazbu.

Na závěr je důležité poznamenat, že s rostoucí schopností AI vytvářet fotorealistická videa se zvyšuje i odpovědnost za rozlišení mezi skutečnými a uměle vytvořenými obsahy. OpenAI se snaží čelit těmto výzvám, například přidáním vodoznaků, které ovšem mohou být odstraněny.