- #Umelá inteligencia
- 3 min.
- 19.12.2024
Google vytiahol eso z rukáva, jeho AI generuje neuveriteľne realistické videá
Preteky technologických spoločností vo vývoji AI modelov sú v plnom prúde. Na nedávne sprístupnenie modelu Sora od spoločnosti OpenAI reaguje Google predstavením nového modelu Veo 2.
Druhá generácia modelu zameraného na generovanie videí dosahuje podľa Google „najmodernejšie výsledky v porovnaní s poprednými modelmi“. Vylepšenia sa okrem toho dočkal aj model Imagen pre generovanie obrázkov.
Google urobil v rámci vývoja modelu Veo veľký pokrok v schopnosti modelu rozumieť fyzike, ľudskému pochybu a choreografii. Spoločnosť uvádza, že Veo 2 už prakticky netrpí žiadnymi halucináciami, čo vo svete umelej inteligencie a konkrétne AI videí znamená zväčša nesprávne vyobrazenie rúk a jednotlivých prstov alebo tvárí, na ktorých sa vyskytujú neprirodzené chyby.
Veo 2 navyše umožňuje generovať videá aj na základe špecifických parametrov. Používatelia si pri tvorbe videí môžu zvoliť žáner, filmový efekt a optiku kamery, aby výsledné videá dosahovali špecifický vizuál. Videá navyše môžu mať maximálnu dĺžku do 1 minúty a 4K UHD rozlíšenie. Pre porovnanie, Sora od OpenAI dokáže v rámci 200-dolárového predplatného generovať videá len vo Full HD rozlíšení s dĺžkou len 20 sekúnd.
Výsledné videá samozrejme obsahujú neviditeľný vodoznak SynthID, ktorý umožňuje kompatibilnému softvéru zobraziť pri ňom dôveryhodnú informáciu, že sa jedná o tvorbu umelej inteligencie.
Veo 2 je už aktuálne k dispozícii vybraným používateľom vo vybraných krajinách prostredníctvom platformy Google Labs. Zoznam používateľov, ktorí majú k modelu prístup, sa má postupne rozširovať, pričom Google zároveň sľubuje, že schopnosti modelu budúci rok implementuje aj do platformy YouTube Shorts a niektorých ďalších z jeho produktov.
Vylepšenia sa dočkal aj model Imagen 3 určený na generovanie obrázkov, ktorý v novej verzii podľa Google generuje jasnejšie obrázky s lepšou kompozíciou. Model po novom tiež dokáže generovať obrázky so širšou paletou štýlov s väčšou presnosťou dodržania zadania, „od fotorealizmu po impresionizmu, od abstrakčného umenia po anime“, uvádza Google.
Imagen 3 je už taktiež dostupný prostredníctvom platformy Google Labs, resp. ImageFX vo viac ako 100 krajinách sveta. Žiaľ, Slovensko medzi ne zatiaľ nepatrí. Rovnako to platí aj pre nový nástroj zvaný Whisk, ktorý umožňuje skombinovať objekt, scénu a štýl do jedného nového obrázka, ktorý možno ešte ďalej pomocou textových požiadaviek bližšie špecifikovať. Whish je zatiaľ v experimentálnej verzii dostupný len v Spojených štátoch.