Amazon se grăbește să „transplanteze creierul” asistentului vocal Alexa cu AI generativă

Amazon se pregătește să relanseze asistentul său digital vocal Alexa ca un „agent” de inteligență artificială care poate îndeplini sarcini practice, în timp ce grupul tehnologic se grăbește să rezolve provocările care au afectat revizuirea AI a sistemului, relatează Financial Times (FT).

Compania de 2,4 miliarde de dolari a încercat în ultimii doi ani să reproiecteze Alexa, sistemul său conversațional încorporat în 500 de milioane de dispozitive de consum din întreaga lume, astfel încât „creierul” software-ului să fie „transplantat” cu AI generativă.

Rohit Prasad, care conduce echipa de inteligență generală artificială (AGI) de la Amazon, a declarat pentru Financial Times că asistentul vocal mai trebuie să depășească câteva obstacole tehnice înainte de lansare.

Printre acestea se numără rezolvarea problemei „halucinațiilor” sau a răspunsurilor fabricate, viteza sa de răspuns sau „latența” și fiabilitatea.

„Halucinațiile trebuie să fie aproape de zero”, a declarat Prasad. „Este încă o problemă deschisă în industrie, dar lucrăm extrem de mult la ea”.

Viziunea liderilor Amazon este de a transforma Alexa, care în prezent este încă utilizată pentru un set restrâns de sarcini simple, cum ar fi redarea muzicii și setarea alarmelor, într-un produs „agentic” care acționează ca un concierge personalizat.

Acest lucru ar putea include orice, de la sugerarea de restaurante la configurarea luminilor din dormitor în funcție de ciclurile de somn ale unei persoane. Reproiectarea Alexa a fost în curs de desfășurare de la lansarea ChatGPT a OpenAI, susținută de Microsoft, la sfârșitul anului 2022.

În timp ce Microsoft, Google, Meta și alții au integrat rapid inteligența artificială generativă în platformele lor de calcul și și-au îmbunătățit serviciile software, criticii s-au întrebat dacă Amazon își poate rezolva luptele tehnice și organizaționale la timp pentru a concura cu rivalii săi.

Potrivit mai multor angajați care au lucrat în echipele de asistenți vocali ai Amazon în ultimii ani, efortul său a fost presărat cu complicații și urmează ani de cercetare și dezvoltare în domeniul IA. Mai mulți foști angajați au declarat că așteptarea îndelungată pentru o lansare s-a datorat în mare parte dificultăților neașteptate implicate în comutarea și combinarea algoritmilor mai simpli și predefiniți pe care a fost construit Alexa, cu modele lingvistice mari mai puternice, dar imprevizibile.

Ca răspuns, Amazon a declarat că „lucrează din greu pentru a permite o asistență și mai proactivă și mai capabilă” a asistentului său vocal. Compania a adăugat că o implementare tehnică de această amploare, într-un serviciu live și într-o suită de dispozitive utilizate de clienți din întreaga lume, a fost fără precedent și nu la fel de simplă ca suprapunerea unui LLM pe serviciul Alexa.

Prasad, fostul arhitect șef al Alexa, a declarat că lansarea de luna trecută a modelelor Amazon Nova interne ale companiei – conduse de echipa sa AGI – a fost parțial motivată de nevoile specifice de viteză, cost și fiabilitate optime, pentru a ajuta aplicațiile AI, cum ar fi Alexa, „să ajungă la ultima milă, ceea ce este foarte greu”. Pentru a funcționa ca un agent, „creierul” lui Alexa trebuie să poată apela sute de software și servicii terțe, a spus Prasad.

„Uneori subestimăm cât de multe servicii sunt integrate în Alexa, și este un număr masiv. Aceste aplicații primesc miliarde de solicitări pe săptămână, așa că atunci când încerci să faci să se întâmple acțiuni fiabile la viteză . . . trebuie să poți face acest lucru într-un mod foarte rentabil”, a adăugat el.

Complexitatea provine din faptul că utilizatorii Alexa se așteaptă la răspunsuri rapide, precum și la niveluri extrem de ridicate de acuratețe. Astfel de calități sunt în contradicție cu natura probabilistică inerentă a AI-ului generativ de astăzi, un software statistic care prezice cuvinte pe baza vorbelor și a modelelor lingvistice.

Unii dintre foștii angajați subliniază, de asemenea, dificultățile de a păstra atributele inițiale ale asistentului, inclusiv coerența și funcționalitatea acestuia, în timp ce îi conferă noi caracteristici generative, cum ar fi creativitatea și dialogul fluent. Din cauza naturii mai personalizate și mai vorbărețe a LLM-urilor, compania intenționează, de asemenea, să angajeze experți pentru a modela personalitatea, vocea și dicția AI-ului, astfel încât acesta să rămână familiar pentru utilizatorii Alexa, potrivit unei persoane familiarizate cu această chestiune, citată de FT.

Un fost membru senior al echipei Alexa a declarat că, în timp ce LLM-urile au fost foarte sofisticate, acestea vin cu riscuri, cum ar fi producerea de răspunsuri care sunt „complet inventate uneori”. „La scara la care operează Amazon, acest lucru s-ar putea întâmpla de un număr mare de ori pe zi”, au spus ei, deteriorându-i marca și reputația.

În iunie, Mihail Eric, un fost cercetător în machine learning la Alexa și membru fondator al „echipei sale de modelare conversațională”, a declarat public că Amazon a „scăpat mingea” în lupta pentru a deveni „liderul de piață fără echivoc în IA conversațională” cu Alexa. Eric a declarat că, în ciuda faptului că are un talent științific puternic și resurse financiare „uriașe”, compania a fost „plină de probleme tehnice și birocratice”, sugerând că „datele au fost prost adnotate” și „documentația a fost fie inexistentă, fie veche”.

Potrivit a doi foști angajați care lucrau la inteligența artificială legată de Alexa, tehnologia istorică care stă la baza asistentului vocal a fost inflexibilă și dificil de schimbat rapid, îngreunată de o bază de cod greoaie și dezorganizată și de o echipă de ingineri „prea dispersată”.

Software-ul Alexa original, construit pe baza tehnologiei achiziționate de la start-up-ul britanic Evi în 2012, era o mașină de răspuns la întrebări care funcționa prin căutarea într-un univers definit de fapte pentru a găsi răspunsul potrivit, cum ar fi vremea zilei sau un anumit cântec din biblioteca muzicală.

Noua Alexa utilizează un „buchet” de modele diferite de inteligență artificială pentru a recunoaște și traduce interogările vocale și pentru a genera răspunsuri, precum și pentru a identifica încălcări ale politicii, cum ar fi preluarea de răspunsuri nepotrivite și halucinații. Construirea de software pentru a traduce între sistemele tradiționale și noile modele AI a fost un obstacol major în integrarea Alexa-LLM. Modelele includ propriul software intern al Amazon, inclusiv cele mai recente modele Nova, precum și Claude, modelul AI de la start-up-ul Anthropic, în care Amazon a investit 8 miliarde de dolari în cursul ultimelor 18 luni.

„Cea mai mare provocare în ceea ce privește agenții AI este să ne asigurăm că aceștia sunt siguri, fiabili și previzibili”, a declarat anul trecut directorul executiv al Anthropic, Dario Amodei, pentru FT. Software-ul AI de tip agent trebuie să ajungă la punctul „în care . . . oamenii pot avea încredere în sistem”, a adăugat acesta. „Odată ce vom ajunge la acest punct, vom lansa aceste sisteme”.

Un actual angajat al Amazon a declarat că sunt încă necesare mai multe etape, cum ar fi suprapunerea filtrelor de siguranță pentru copii și testarea integrărilor personalizate cu Alexa, cum ar fi luminile inteligente și soneria Ring. „Fiabilitatea este problema – să o facem să funcționeze aproape 100% din timp”, a adăugat angajatul.

„Acesta este motivul pentru care ne vedeți pe noi … sau Apple sau Google livrând lent și treptat.” Numeroase părți terțe care dezvoltă „abilități” sau funcții pentru Alexa au declarat că nu sunt sigure când va fi lansat noul dispozitiv cu AI generativ și cum să creeze noi funcții pentru acesta.

„Așteptăm detaliile și înțelegerea”, a declarat Thomas Lindgren, cofondator al dezvoltatorului suedez de conținut Wanderword. „Când am început să lucrăm cu ei, au fost mult mai deschiși … apoi, cu timpul, s-au schimbat”. Un alt partener a declarat că, după o perioadă inițială de „presiune” care a fost pusă pe dezvoltatori de Amazon pentru a începe să se pregătească pentru următoarea generație de Alexa, lucrurile au devenit liniștite.

O provocare persistentă pentru echipa Alexa a Amazon – care a fost afectată de concedieri majore în 2023 – este cum să facă bani. Găsirea modului de a face asistenții „suficient de ieftini pentru a funcționa la scară largă” va fi o sarcină majoră, a declarat Jared Roesch, co-fondator al grupului de AI generativ OctoAI.

Opțiunile discutate includ crearea unui nou serviciu de abonament Alexa, sau să ia o parte din vânzările de bunuri și servicii, a declarat un fost angajat Alexa. Prasad a declarat că obiectivul Amazon a fost de a crea o varietate de modele AI care ar putea acționa ca „blocuri de construcție” pentru o varietate de aplicații dincolo de Alexa.

„Ceea ce suntem întotdeauna fundamentați este clienții și AI-ul practic, nu facem știință de dragul științei”, a spus Prasad. „Facem acest lucru … pentru a oferi clienților valoare și impact, ceea ce în această eră a inteligenței artificiale generative devine mai important ca niciodată, deoarece clienții doresc să vadă un randament al investițiilor.”

G4Media.ro

G4Media.ro

Amazon se grăbește să „transplanteze creierul” asistentului vocal Alexa cu AI generativă

Urmărește mai jos producțiile video ale G4Media:

Donează lunar pentru susținerea proiectului G4Media

Donează suma dorită pentru susținerea proiectului G4Media

Citește și...

OpenAI lansează un nou model de inteligenţă artificială, capabil ”să gândească în imagini”

OpenAI anunță lansarea unei biblioteci de imagini pentru ChatGPT

Retailerii europeni şi-ar putea creşte profiturile operaţionale cu 70 de miliarde de dolari prin utilizarea AI pe întregul lanţ valoric – analiză PwC