Cum dezvăluie inteligența artificială texte antice – și ar putea rescrie istoria
În octombrie 2023, Federica Nicolardi a primit un e-mail care urma să-i schimbe definitiv cercetarea. Atașat se afla un fragment dintr-un sul de papirus ars în erupția Vezuviului din anul 79 d.Hr. Sulul carbonizat era unul dintre sutele descoperite în ruinele unei vile romane de lux din Herculaneum, lângă Pompei, Italia, în secolul al XVIII-lea. De-a lungul timpului, încercările de a separa straturile fragede și carbonizate ale sulurilor le-au distrus parțial, iar cercetătorii ajunseseră să creadă că restul nu mai poate fi desfășurat.
Nicolardi, papirusolog la Universitatea din Napoli, Italia, era implicată într-un efort de a folosi inteligența artificială (AI) pentru a citi ceea ce părea imposibil de descifrat. Acum, cele mai noi rezultate erau disponibile. Imaginea arăta o fâșie de papirus încărcată cu litere grecești, clar vizibile pe un fundal mai închis. Scrisul era limpede, cu câteva rânduri dense, întinse pe aproape cinci coloane, relatează Nature.
„A fost incredibil”, spune Nicolardi. „M-am gândit: «Deci chiar se întâmplă asta.»” A înțeles pe loc că papirusologia nu va mai fi la fel. „În acel moment, simți că iei parte la un moment istoric pentru domeniul tău.” Citea linii întregi de text care fuseseră inaccesibile vreme de 2.000 de ani.
Proiectul, numit Vesuvius Challenge, este doar un exemplu despre cum inteligența artificială avansată — care deja revoluționează aspecte ale vieții contemporane, de la banking la cercetare medicală — este pe cale să modifice profund și felul în care percepem lumea antică. Rețelele neuronale artificiale sunt folosite pentru a descifra texte străvechi, de la greaca și latina clasică până la Scriptul Oaselor Oracol din China — texte de divinație inscripționate pe oase de bovine și carapace de țestoase. Aceste unelte digitale ajută la interpretarea unor arhive prea vaste pentru a fi consultate de cercetători în mod tradițional, umplu goluri de text și decodează limbi rare sau pierdute, din care au mai rămas doar urme.
Rezultatele promit o avalanșă de texte inedite, oferind cercetătorilor mai multe date decât au avut la dispoziție de secole. Dar beneficiile nu se opresc aici. Deoarece instrumentele de inteligență artificială pot recunoaște mai multe limbi și pot stoca mult mai multe informații decât poate gestiona o singură persoană — și pot descoperi singure tipare statistice în texte — aceste tehnologii propun o manieră fundamental nouă de a explora sursele istorice antice.
Acest progres ar putea transforma nu doar „întrebările la care vrem să răspundem”, afirmă Nicolardi, „ci și pe cele pe care putem începe să ni le punem”.
Reconstruirea textelor antice
Calculatoarele sunt folosite de decenii pentru a cataloga și analiza texte digitalizate. Însă entuziasmul actual provine din utilizarea rețelelor neuronale — alcătuite din straturi ierarhice de noduri interconectate — și mai ales din folosirea rețelelor neuronale „profunde”, cu numeroase straturi interne.
Primele tentative de a aplica învățarea profundă textelor antice, în anii 2010, s-au bazat pe fotografii digitale ale documentelor, fie pe papirusuri, fie pe frunze de palmier. Modelele numite rețele neuronale convoluționale (CNN) — inspirate de neuroștiința vizuală — pot detecta date organizate sub formă de matrice din imagini. Acestea au fost folosite pentru recunoașterea optică a caracterelor, dar și în alte scopuri: echipe din China care studiază Scriptul Oaselor Oracol au folosit asemenea rețele pentru a completa litere erodate, a analiza evoluția caracterelor oraculare de-a lungul timpului și a reconstitui fragmente fracturate.
În paralel, rețelele neuronale recurente (RNN), concepute pentru analiza secvențelor de date unde ordinea contează, și-au dovedit potențialul în căutare, traducere și completarea de lacune în texte deja transcrise. Ele au fost folosite, de pildă, pentru a sugera caractere lipsă în sute de texte administrative și juridice standardizate din Babilonul antic.
Dar pot aceste rețele neuronale să meargă mai departe de simpla automatizare a unor sarcini plictisitoare, făcând conexiuni inaccesibile specialiștilor umani? Un prim proiect de anvergură, care a demonstrat puterea inteligenței artificiale, a început în 2017 la Universitatea Oxford, Marea Britanie, unde Thea Sommerschield își făcea doctoratul în istorie antică, iar Yannis Assael în informatică. Sommerschield încerca să descifreze inscripții grecești din Sicilia și i-a explicat lui Assael dificultățile întâlnite: „Aceste texte sunt greu de citit, prost conservate, cu multe lacune. Nu știm exact de unde provin, nu cunoaștem datarea, iar dialectele sunt amestecate.”
Clasiciștii interpretează noile documente bazându-se pe cunoștințele lor despre texte similare. Însă aceștia, de regulă, se specializează în lucrări dintr-o anumită regiune și perioadă; este imposibil ca un singur om să stăpânească toate sursele relevante pentru un text necunoscut. Aceasta era exact provocarea pe care modelele de învățare automată ar fi putut-o rezolva, a sugerat Assael, devenit ulterior cercetător la Google DeepMind din Londra.
Cercetătorii au antrenat mai întâi un model RNN, numit Pythia, pe zeci de mii de inscripții grecești din secolele VII î.Hr. – V d.Hr., apoi i-au prezentat modelului texte pe care nu le văzuse anterior, cerându-i să propună caractere sau cuvinte lipsă.
Sommerschield, acum la Universitatea Nottingham, își amintește emoția momentului când ea, Assael și profesorul ei coordonator, Jonathan Prag, au rulat pentru prima dată modelul. Completarea textului apărea pe ecran, caracter după caracter, ceva ce nu fusese imaginat până atunci.
„A fost ca într-un film”, spune ea. „Am rămas cu gurile căscate.”
În 2022, echipa a creat un model numit Ithaca, care nu doar sugerează caractere și cuvinte lipsă, ci și localizează și datează un text necunoscut. De această dată, cercetătorii au folosit un progres din învățarea automată numit model transformer, capabil să surprindă tipare lingvistice mai complexe decât RNN, analizând simultan elemente precum caractere și cuvinte și evaluându-le în funcție de context. (Chatbot-uri precum ChatGPT de la OpenAI sau Claude de la Anthropic folosesc și ele modele transformer.)
Sommerschield subliniază că echipa lor concepe instrumente destinate a-i sprijini pe cercetători, nu a-i înlocui. Rețeaua neurală cutreieră un întreg corpus masiv, iar specialistul adaugă expertiza umană. „Omul este în centrul designului nostru”, spune Assael. În teste, Ithaca a rezolvat lacune artificiale cu o acuratețe de 62%, față de 25% în cazul experților umani. Însă, combinând sugestiile Ithaca cu judecata specialiștilor, acuratețea a ajuns la 72%. Totodată, Ithaca a identificat corect originea geografică a inscripțiilor în 71% din cazuri și a datat textele cu o eroare medie de 30 de ani față de estimările acceptate.
Disponibil gratuit online, Ithaca primește câteva sute de cereri săptămânal, spun autorii. Nu este clar în ce momente contribuie la proiecte științifice, decât dacă autorii menționează acest lucru, explică Sommerschield. Până acum, se știe că a ajutat la re-datarea unor decrete politice ateniene și la analiza unor tăblițe din secolul al IV-lea î.Hr., care conțin întrebări adresate Oracolului de la Dodona, în nord-vestul Greciei.
Un ocean de arhive
În Coreea de Sud, alți cercetători se confruntă cu provocări foarte diferite, studiind unul dintre cele mai mari arhive istorice din lume: înregistrări zilnice exhaustive, care însumează sute de mii de articole, acoperind domniile a 27 de regi coreeni, în perioada cuprinsă între secolele al XIV-lea și începutul secolului XX. „Volumul de date este imens”, explică Kyunghyun Cho, specialist în traducere automată la Universitatea din New York. Cho, de obicei, se ocupă de limbi moderne, dar a aflat despre aceste arhive istorice de la tatăl său, profesor pensionat de literatură coreeană. Textele sunt complete și se cunoaște proveniența lor, însă puțini le pot citi, fiind scrise în Hanja, un sistem antic de caractere chinezești, diferit de chineza și coreeana contemporane.
Un grup restrâns de traducători guvernamentali lucrează manual la transpunerea acestor înregistrări în coreeana modernă, dar această sarcină ar necesita decenii. Împreună cu colaboratori din Coreea de Sud, inclusiv cu JinYeong Bak de la Universitatea Sungkyunkwan, Cho a antrenat un model transformer pentru a traduce automat aceste documente. Problema a fost că nu exista destul material tradus în coreeana modernă pentru a antrena un astfel de model, așa că echipa a adoptat o metodă multilingvă, combinând Hanja, traduceri mai vechi în coreeana arhaică și versiunile limitate în coreeana modernă și engleză. Specialiști umani au evaluat traducerile AI — consemnări despre evenimente precum vizite oficiale, executarea trădătorilor și concerte muzicale — considerându-le mai corecte și mai ușor de citit decât versiunile arhaice și, în anumite cazuri, chiar mai reușite decât traducerea modernă.
La polul opus, unii specialiști folosesc rețele neuronale pentru a analiza limbi antice din care s-au păstrat doar câteva fragmente. Modelele transformer necesită, adesea, cantități mari de date pentru antrenament, ceea ce devine dificil în cazul acestor limbi. De pildă, Katerina Papavassileiou, de la Universitatea din Patras (Grecia), și colegii au folosit o rețea neuronală recurentă (RNN) pentru a reconstitui bucăți lipsă dintr-o colecție de 1.100 de tăblițe miceniene din Knossos, Creta, redactate în Linear B și datând din mileniul al II-lea î.Hr. În teste, când au fost introduse goluri artificiale, soluțiile corecte apăreau în primele zece propuneri ale modelului în 72% din cazuri, iar în situații reale se aliniau adesea cu sugestiile experților umani. Ca să îmbunătățească rezultatele, Papavassileiou intenționează să adauge și date vizuale despre urmele de litere abia vizibile, în locul exclusivului text transliterat, și să experimenteze „învățarea prin transfer”, prin care modelul aplică cunoștințele dobândite dintr-un grup de tăblițe la altul.
Papavassileiou speră ca, în viitor, modelele antrenate pe Linear B să fie aplicate și la Linear A, un sistem folosit de civilizația minoică, care are multe simboluri comune cu Linear B, dar rămâne nedescifrat.
Cum se descifrează textele necitibile
Poate cea mai convingătoare dovadă a puterii AI în depășirea obstacolelor majore este cercetarea asupra sulurilor din Herculaneum. „Cred că fac una dintre cele mai uluitoare lucrări posibile”, comentează Assael. Informaticianul Brent Seales și colegii lui de la Universitatea din Kentucky (Lexington), ajutați de participanții la Vesuvius Challenge, se ocupă de citirea textelor care nu pot fi văzute deloc cu ochiul liber.
Lecturarea sulurilor din Herculaneum implică două obstacole. Mai întâi, sulurile, extrem de fragile, nu pot fi derulate. Ca să vadă ce se află în interior, Seales a dedicat ani întregi dezvoltării unei tehnici de „desfășurare virtuală”, care folosește scanări CT (tomografie computerizată) de înaltă rezoluție ale structurii interne, identifică manual straturile vizibile în fiecare secțiune transversală, apoi aplică algoritmi pentru a transforma aceste suprafețe în imagini bidimensionale. În 2015, echipa a folosit metoda ca să citească textul complet dintr-un sul ars, imposibil de deschis, găsit la En-Gedi (Israel) și datat în jurul secolului al III-lea d.Hr., care s-a dovedit a fi un fragment din cartea biblică Leviticul.
Sulul de la En-Gedi are doar cinci înfășurări; în schimb, cele din Herculaneum conțin fiecare sute de înfășurări ultrafine, aproape ca mătasea. Pentru a obține date CT de rezoluție foarte mare, cercetătorii au dus câteva suluri la acceleratorul de particule Diamond Light Source, lângă Oxford. Dar, pe când cerneala de la En-Gedi (și alte documente ulterioare) conținea fier, strălucind la scanarea CT, scribii din Herculaneum au folosit cerneală pe bază de carbon, invizibilă în scanări, deoarece densitatea sa e similară cu cea a papirusului. Echipa lui Seales a realizat că, deși nu vedeau cerneala direct, ar putea detecta forma acesteia. Dacă există diferențe fine în textura fibrelor de papirus gol față de zonele cerneala, este posibil să antreneze o rețea neuronală care să depisteze aceste diferențe.
Era prea mult pentru micul grup de cercetători condus de Seales, așa că, în martie 2023, s-au aliat cu antreprenorul Nat Friedman din Silicon Valley, lansând Vesuvius Challenge, unde au pus la bătaie premii generoase. Ei au publicat imagini desfășurate ale suprafețelor papirusurilor, invitând participanții să creeze rețele neuronale capabile să detecteze cerneala. Peste 1.000 de echipe s-au înscris, iar câteva sute de oameni discutau zilnic pe canalul de Discord despre progresele lor. Un premiu mare s-a acordat în februarie 2024: studenții la informatică Youssef Nader, Luke Farritor și Julian Schilliger au împărțit 700.000 de dolari pentru reușita de a produce 16 coloane de text perfect lizibil.
Echipa câștigătoare a folosit un TimeSformer, o versiune modernă de transformer, deseori folosită la prelucrarea de videoclipuri, care separă dimensiunile spațiale de cea temporală. Pentru Vesuvius Challenge, l-au adaptat astfel încât să distingă adâncimea papirusului de suprafața acestuia. Nicolardi și colegii săi au identificat textul ca fiind dintr-o lucrare de filosofie greacă despre muzică, plăcere și senzație, până atunci necunoscută, posibil semnată de epicurianul Filodemu. Participarea la acest proces a fost „magică”, afirmă ea.
De atunci, participanții continuă să îmbunătățească algoritmii de detecție a cernelii, în colaborare cu papirusologii. Echipa lui Seales scanează tot mai multe suluri și speră că învățarea automată poate accelera și pasul de „desfășurare virtuală”, considerat un blocaj major care limitează numărul de date disponibile pentru cercetători. Seales se arată optimist că până în 2024, când s-a pus la dispoziție un premiu de 200.000 de dolari pentru citirea a 90% din patru suluri, „desfășurarea ghidată de inteligență artificială va fi gata”. „După ce automatizezi acest proces, practic poți scala operațiunea”, spune el despre desfășurare. „Suntem foarte aproape de a reuși asta.”
De fapt, Seales vrea să citească întreaga bibliotecă. Există sute de suluri nedesfăcute din Herculaneum, depozitate în diverse colecții — majoritatea la Napoli, dar și la Paris, Londra și Oxford. „Asta va aduce mai mult text nou pentru papirusologi decât tot ce s-a descoperit în ultimii 100 de ani”, declară el.
Procedeul deschide și alte surse inaccesibile, numite de Seales „biblioteca invizibilă”: texte ascunse în cotoarele cărților medievale ori în benzi folosite la înfășurarea mumiilor egiptene, unde „avem artefactul fizic, dar nu putem citi textul”. Deja, echipa sa a colectat date dintr-un sul egiptean nedesfăcut, deținut de Smithsonian (Washington DC), și poartă discuții pentru a scana papirusuri arse din secolul al VII-lea d.Hr. găsite la Petra (Iordania).
Mai mult, unii arheologi cred că mare parte din biblioteca vilei din Herculaneum este încă îngropată. Dacă vreodată s-ar excava, ar putea ieși la iveală mii de suluri. Lecturarea lor ar însemna „cea mai mare descoperire din istoria lumii antice”, spune Seales. „Acum avem tehnologia necesară.”
Un val de informații
Chiar și textul din numai patru suluri citit integral ar fi o imensă provocare pentru papirusologi. „Vorbim de 400 de coloane de text grecesc de analizat”, observă Nicolardi. „Vom avea nevoie de mai multe resurse financiare, pentru că nu sunt suficienți papirusologi.” De obicei, papirusologia „nu se practica în mod colaborativ”, remarcă Seales, dar probabil „vom produce mult mai mult text decât poate gestiona comunitatea actuală”. Asta ridică întrebări despre cine ar trebui să aibă acces la date și cum se va publica. „Vom crea, cel mai probabil, o comunitate globală, mai mare decât cea existentă acum.”
Persistă și temeri privind acuratețea și posibilitatea replicării, mai ales dacă volume uriașe de texte noi sunt puse rapid la dispoziția cercetătorilor ne-specializați, ajutați de AI. Există riscul „halucinațiilor” — situații în care o rețea neuronală poate genera rezultate false. Seales și alții subliniază importanța echipelor interdisciplinare, compuse atât din specialiști în umanioare, cât și din experți în informatică. O măsură suplimentară de siguranță ar fi publicarea open-source a tuturor datelor — text brut și scanări, alături de seturile de antrenament și algoritmii folosiți — pe un lanț de proveniență digitală, spune Seales.
„Trebuie să construim un aparat academic, cultural și legal”, afirmă Richard Ovenden, director al Bibliotecilor Bodleian la Universitatea Oxford, care deține câteva suluri din Herculaneum. Totuși, argumentează că temerile privind impactul distructiv al AI asupra educației clasice sunt nejustificate. „Ceea ce face AI este să le ofere papirusologilor acces la date pe care altminteri nu le-ar fi avut niciodată”, explică el. „Le face munca și mai valoroasă.”
În alte domenii, se întâmplă fenomene similare. Enrique Jiménez, specialist în literatura antică din Orientul Apropiat, la Universitatea Ludwig-Maximilians (München), a colaborat cu British Museum (Londra) pentru fotografierea a 25.000 de tăblițe babiloniene în scriere cuneiformă (îndeosebi din a doua jumătate a primului mileniu î.Hr.), cu scopul de a le face accesibile AI. Recent, a obținut fonduri pentru încă 30.000 de tăblițe. În total, circa 100.000 de tăblițe cuneiforme au fost digitalizate global, dintr-un total de 500.000. Echipa dezvoltă rețele neuronale pentru a recunoaște semnele cuneiforme din fotografii și a le atribui unei anumite perioade. După ce textele sunt transliterate, se aplică unelte de învățare automată mai simple pentru a uni fragmente din aceeași lucrare (proiectul numit Fragmentarium). Așa s-au descoperit vreo 20 de versuri noi din Epopeea lui Ghilgameș și 30 de copii ale unui imn necunoscut, dedicat orașului Babilon. „Este absolut spectaculos”, subliniază Jiménez. „Ar fi durat decenii ca Fragmentarium să găsească atâtea manuscrise.”
Fluxul de informații este entuziasmant, dar și „intimidant”, spune el. „Cred că, în următorii 10-20 de ani, vom digitaliza totul. E o creștere exponențială a surselor disponibile.”
Punerea de noi întrebări
Această multiplicare în amploare ar putea lansa noi moduri de a folosi AI pentru descifrarea lumii antice. Analiza masivă a textelor digitalizate, la o scară fără precedent, i-ar ajuta pe cercetători nu numai să se ocupe de documente individuale, ci și să formuleze întrebări mai extinse despre societățile care le-au produs.
„Va trebui să ne schimbăm mentalitatea”, avertizează Nicolardi. „Nu ne mai interesează doar textul, ci cultura în ansamblu.”
Transformarea e deja în curs. În Coreea de Sud, mai multe echipe studiază arhivele în Hanja, nu prin citire directă, ci prin antrenarea modelelor AI să parcurgă documentele originale și să depisteze tendințe și conexiuni politice. JinYeong Bak a prezentat la reuniunea Asociației pentru Lingvistică Computațională din Bangkok (august 2023) cum a folosit tehnici similare pentru a identifica stilurile de guvernare ale unor regi din perioada Joseon. De pildă, Yeonsangun, un conducător despotic între 1495 și 1506, ar fi prezentat o intensificare bruscă a deciziilor arbitrare spre finalul domniei, în timp ce Injo (1623-1649), mai puțin autoritar, a menținut un stil de conducere constant, ascultând adesea sugestiile oficialilor.
Treptat, cercetătorii unifică sarcinile și integrează multiple seturi de date în modele mai vaste. În cazul sulurilor din Herculaneum, Seales și colegii vor să folosească AI pentru a sugera completări în textele transcrise. Se urmărește și conectarea unor arii geografice și epoci diferite în rețele complexe, pentru a formula concluzii generale și a transfera cunoștințe între colecții. Un model antrenat pe 104 limbi moderne, printre care ebraica și araba, a fost surprinzător de eficient în traducerea akkadienei (limbă mesopotamiană antică din care derivă, parțial, ebraica și araba). Cho colaborează la legarea limbilor din Japonia, Coreea, China și Vietnam, bazate pe caractere chinezești, însă își imaginează că, în viitor, aceste cercetări s-ar putea extinde la nivel global. Ținta, spune el, ar fi „să construim un sistem care să folosească toate aceste conexiuni în timp și spațiu.”
Bak își dorește ca astfel de studii să meargă dincolo de un simplu „minerit de date”. Până acum, învățarea automată s-a folosit pentru a identifica tipare numerice și tendințe, însă, cu instruire suplimentară, un AI generativ similar cu ChatGPT ar putea să facă inferențe „active” și să poarte discuții despre sursele istorice, „conducând la generarea de date noi, pseudo, dar interesante”.
Imaginează-ți că, într-o bună zi, un chatbot gen ChatGPT, antrenat pe aceste vaste colecții de texte recent descifrate, ar putea răspunde la întrebări despre ce gândeau în trecut un grec, un coreean sau un babilonian. Poate că, în viitor, va fi suficient să întrebăm direct inteligența artificială.
Urmărește mai jos producțiile video ale G4Media:
Donează lunar pentru susținerea proiectului G4Media
Donează suma dorită pentru susținerea proiectului G4Media
CONT LEI: RO89RZBR0000060019874867
Deschis la Raiffeisen Bank
1 comentariu