Copilot4D: Un start up american folosește inteligența artificală generativă pentru a prezice mișcările în trafic
Waabi, o comapnie americană care se ocupă de mașini cu conducere autonomă, folosește un model generativ de inteligență artificială pentru a ajuta la prezicerea mișcării vehiculelor, a anunțat astăzi compania, scrie MIT Technology Review.
Noul sistem, numit Copilot4D, a fost antrenat pe baza unor cantități mari de date provenite de la senzorii lidar (light detection and ranging), care folosesc lumina pentru a detecta distanța la care se află obiectele. Dacă solicitați modelului o situație, cum ar fi un șofer care intră imprudent pe o autostradă cu viteză mare, acesta prezice cum se vor mișca vehiculele din jur, apoi generează o reprezentare de 5 până la 10 secunde în viitor (arătând, poate, un carambol).
Anunțul de astăzi se referă la versiunea inițială a Copilot4D, dar Raquel Urtasun, CEO-ul Waabi, spune că o versiune mai avansată și interpretabilă este implementată în flota de testare a camioanelor autonome Waabi din Texas, care ajută software-ul de conducere să decidă cum să reacționeze.
În timp ce conducerea autonomă se bazează de mult timp pe învățarea automată pentru a planifica rutele și a detecta obiecte, unele companii și cercetători pariază acum pe faptul că inteligența artificială generativă – modele care preiau date din mediul înconjurător și generează predicții – va contribui la aducerea autonomiei în etapa următoare. Wayve, un concurent al Waabi, a lansat anul trecut un model comparabil care este antrenat pe baza înregistrărilor video pe care vehiculele sale le colectează.
Modelul Waabi funcționează într-un mod similar cu generatoarele de imagini sau de clipuri video, cum ar fi DALL-E și Sora de la OpenAI. Acesta preia serii de date lidar, care vizualizează o hartă 3D a împrejurimilor mașinii, și le împarte în bucăți, similar cu modul în care generatoarele de imagini împart fotografiile în pixeli. Pe baza datelor sale de instruire, Copilot4D prezice apoi modul în care se vor deplasa toate punctele de date.
Această operațiune continuă îi permite să genereze previziuni cu 5-10 secunde în viitor.
Waabi este una dintre puținele companii de conducere autonomă, între care se numără și concurenții săi, Wayve și Ghost, care își descriu abordarea ca fiind „AI-first”. Pentru Urtasun, acest lucru înseamnă proiectarea unui sistem care învață din date, mai degrabă decât a unuia care trebuie să fie învățat reacții la situații specifice. Cohorta mizează pe faptul că metodele lor ar putea necesita mai puține ore de testare pe șosea a mașinilor care se conduc singure, un subiect încărcat în urma unui accident din octombrie 2023 în care un robotaxi Cruise a târât un pieton în San Francisco.
Waabi se diferențiază de concurenții săi prin faptul că construiește un model generativ pentru lidar, mai degrabă decât pentru camere.
„Dacă vrei să fii un jucător de nivel 4, lidar este o necesitate”, spune Urtasun, referindu-se la nivelul de automatizare în care mașina nu are nevoie de atenția unui om pentru a conduce în siguranță. Camerele foto fac o treabă bună în a arăta ceea ce vede mașina, dar nu sunt la fel de pricepute în măsurarea distanțelor sau în înțelegerea geometriei împrejurimilor mașinii, spune ea.
Deși modelul Waabi poate genera videoclipuri care arată ce va vedea o mașină prin intermediul senzorilor LIDAR, aceste videoclipuri nu vor fi folosite ca instruire în simulatorul de conducere al companiei, pe care aceasta îl folosește pentru a construi și testa modelul său de conducere. Asta pentru a se asigura că orice halucinații care apar din Copilot4D nu sunt predate în simulator.
Tehnologia de bază nu este nouă, spune Bernard Adam Lange, un doctorand de la Stanford care a construit și cercetat modele similare, dar este pentru prima dată când a văzut un model LIDAR generativ părăsind limitele unui laborator de cercetare și fiind extins pentru utilizare comercială. Un astfel de model ar ajuta, în general, ca „creierul” oricărui vehicul autonom să fie capabil să raționeze mai rapid și mai precis, spune el.
„Scara este cea care este revelatoare”, spune el. „Speranța este ca aceste modele să poată fi utilizate în sarcinile din aval”, cum ar fi detectarea obiectelor și prezicerea locului în care oamenii sau lucrurile s-ar putea mișca în continuare.
Copilot4D poate estima doar până la un anumit punct în viitor, iar modelele de predicție a mișcării în general se degradează cu cât li se cere să se proiecteze mai departe. Urtasun spune că modelul trebuie să își imagineze ce se va întâmpla cu 5 până la 10 secunde înainte pentru majoritatea deciziilor de conducere, deși testele de referință evidențiate de Waabi se bazează pe previziuni de 3 secunde. Chris Gerdes, co-director al Centrului pentru cercetare în domeniul auto de la Stanford, spune că acest parametru va fi esențial pentru a determina cât de util este modelul în luarea deciziilor.
„Dacă previziunile de 5 secunde sunt solide, dar cele de 10 secunde sunt abia utilizabile, există o serie de situații în care acest lucru nu ar fi suficient pe șosea”, spune el.
Noul model readuce în discuție o întrebare care se răspândește în lumea inteligenței artificiale generative: dacă este bine sau nu să facem modelele open-source. Eliberarea Copilot4D ar permite cercetătorilor academici, care se luptă cu accesul la seturi mari de date, să tragă cu ochiul sub capotă la modul în care este realizat, să evalueze în mod independent siguranța și, potențial, să avanseze în acest domeniu. De asemenea, ar face același lucru pentru concurenții Waabi. Waabi a publicat o lucrare care detaliază crearea modelului, dar nu a publicat codul, iar Urtasun nu este sigur că o va face.
„Vrem ca mediul academic să aibă și el un cuvânt de spus în viitorul autoconducerii”, spune ea, adăugând că modelele open-source sunt mai de încredere. „Dar trebuie, de asemenea, să fim puțin atenți pe măsură ce ne dezvoltăm tehnologia, astfel încât să nu dezvăluim totul concurenților noștri.”
Urmărește mai jos producțiile video ale G4Media:
Donează lunar pentru susținerea proiectului G4Media
Donează suma dorită pentru susținerea proiectului G4Media
CONT LEI: RO89RZBR0000060019874867
Deschis la Raiffeisen Bank