OpenAI lansează un nou model de generare video, denumit Sora. Compania de inteligență artificială spune că Sora poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text
OpenAI a prezentat noul său modelul de inteligență artificială text-to-video, „Sora”. Compania spune că Sora „poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text”. Modelul text-to-video le permite utilizatorilor să creeze videoclipuri fotorealiste de până la un minut – totul pe baza unor instrucțiuni scrise, relatează theverge.com
Sora este capabil să creeze „scene complexe cu mai multe personaje, tipuri specifice de mișcare și detalii precise ale subiectului și ale fundalului”, potrivit postării introductive de pe blogul OpenAI. De asemenea, compania notează că modelul poate înțelege modul în care obiectele „există în lumea fizică”, precum și „să interpreteze cu acuratețe recuzita și să genereze personaje convingătoare care exprimă emoții vibrante”.
Șablonul poate, de asemenea, să genereze un videoclip dintr-o imagine statică, precum și să completeze cadrele lipsă dintr-un videoclip existent sau să îl extindă.
Demonstrațiile generate de Sora incluse în postarea de pe blogul OpenAI includ o scenă aeriană din California în timpul goanei după aur, un videoclip care pare a fi fost filmat din interiorul unui tren din Tokyo și multe altele. Multe dintre ele prezintă unele semne revelatoare de inteligență artificială – cum ar fi o podea care se mișcă suspect de mult într-un videoclip dintr-un muzeu – iar OpenAI spune că modelul „poate avea probleme în a simula cu acuratețe fizica unei scene complexe”, dar rezultatele sunt în general destul de impresionante.
În urmă cu câțiva ani, generatoarele text-imagine, precum Midjourney, se aflau în fruntea capacității modelelor de a transforma cuvintele în imagini. Dar, recent, video a început să se îmbunătățească într-un ritm remarcabil: companii precum Runway și Pika și-au dezvăluit propriile modele impresionante de transformare a textului în video, iar Lumiere de la Google pare a fi unul dintre principalii concurenți ai OpenAI și în acest spațiu. Similar cu Sora, Lumiere le oferă utilizatorilor instrumente de transformare a textului în video și le permite, de asemenea, să creeze videoclipuri pornind de la o imagine fixă.
Urmărește mai jos producțiile video ale G4Media:
Donează lunar pentru susținerea proiectului G4Media
Donează suma dorită pentru susținerea proiectului G4Media
CONT LEI: RO89RZBR0000060019874867
Deschis la Raiffeisen Bank
1 comentariu