OpenAI lansează un nou model de generare video, denumit Sora. Compania de inteligență artificială spune că Sora poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text

OpenAI a prezentat noul său modelul de inteligență artificială text-to-video, „Sora”. Compania spune că Sora „poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text”. Modelul text-to-video le permite utilizatorilor să creeze videoclipuri fotorealiste de până la un minut – totul pe baza unor instrucțiuni scrise, relatează theverge.com

Sora este capabil să creeze „scene complexe cu mai multe personaje, tipuri specifice de mișcare și detalii precise ale subiectului și ale fundalului”, potrivit postării introductive de pe blogul OpenAI. De asemenea, compania notează că modelul poate înțelege modul în care obiectele „există în lumea fizică”, precum și „să interpreteze cu acuratețe recuzita și să genereze personaje convingătoare care exprimă emoții vibrante”.

Șablonul poate, de asemenea, să genereze un videoclip dintr-o imagine statică, precum și să completeze cadrele lipsă dintr-un videoclip existent sau să îl extindă.

Demonstrațiile generate de Sora incluse în postarea de pe blogul OpenAI includ o scenă aeriană din California în timpul goanei după aur, un videoclip care pare a fi fost filmat din interiorul unui tren din Tokyo și multe altele. Multe dintre ele prezintă unele semne revelatoare de inteligență artificială – cum ar fi o podea care se mișcă suspect de mult într-un videoclip dintr-un muzeu – iar OpenAI spune că modelul „poate avea probleme în a simula cu acuratețe fizica unei scene complexe”, dar rezultatele sunt în general destul de impresionante.

În urmă cu câțiva ani, generatoarele text-imagine, precum Midjourney, se aflau în fruntea capacității modelelor de a transforma cuvintele în imagini. Dar, recent, video a început să se îmbunătățească într-un ritm remarcabil: companii precum Runway și Pika și-au dezvăluit propriile modele impresionante de transformare a textului în video, iar Lumiere de la Google pare a fi unul dintre principalii concurenți ai OpenAI și în acest spațiu. Similar cu Sora, Lumiere le oferă utilizatorilor instrumente de transformare a textului în video și le permite, de asemenea, să creeze videoclipuri pornind de la o imagine fixă.

G4Media.ro

G4Media.ro

OpenAI lansează un nou model de generare video, denumit Sora. Compania de inteligență artificială spune că Sora poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text

Urmărește mai jos producțiile video ale G4Media:

Donează lunar pentru susținerea proiectului G4Media

Donează suma dorită pentru susținerea proiectului G4Media

Citește și...

Un tată sud-coreean folosește inteligența artificială generativă pentru a se juca cu copilul său de cinci ani

STUDIU: Aproape jumătate dintre utilizatorii români de internet, cu vârste peste 18 ani, din mediul urban folosesc inteligenţa artificială în activităţile lor zilnice

Microsoft intenționează să cheltuiască 80 de miliarde de dolari pe centre de date bazate pe Inteligență Artificială în anul fiscal 2025

1 comentariu