O companie de IT din Cluj-Napoca anunță o premieră mondială: A dezvoltat un algoritm de analiză în limba română. Softul poate extrage dintr-un text sentimentele pe care le generează

Zetta Cloud din Cluj Napoca, o companie specializată în cercetarea și dezvoltarea de produse software din domeniul Inteligenței Artificiale, a anunțat lansarea în premieră mondială a primei soluții complete de analiză automată de text pentru limba română. Directorul general al companiei, Emil Ștețco, a explicat pentru G4Media cum funcționează produsul la care lucrează de șase luni.

Soluția de analiză automată de text pentru limba română este un produs software al companiei clujene numit IntelliDockers (www.intellidockers.com), destinat companiilor și organizațiilor care vor să proceseze automat volume mari de date într-un mod rapid și sigur.

Emil Ștețco spune că IntelliDockers folosește algoritmi de Inteligență Artificială de tip rețele neuronale și permite înțelegerea automată a documentelor în diferite limbi (engleză, română, germana, poloneza, italiana și maghiară).

Acesta a explicat că este vorba despre ”supervised learning”, un concept care presupune să dai sistemului suficiente de multe exemple variate, pentru ca în viitor să știe singur cu ce are de-a face. Practic, algoritmii învață bazându-se pe datele care i-au fost puse la dispoziție anterior. Un exemplu simplu: poate detecta dacă într-o imagine este o pisică sau un câine.

Există, desigur, și exemple mai complicate despre cum funcționează algoritmul și ce poate el face. Echipa care l-a dezvoltat a lucrat șase luni, iar munca a fost infernală. Este vorba despre zeci de mii de articole introduse manual, pentru ca algoritmul să aibă ce procesa.

Sistemul are o acuratețe de 80% acum, dar pentru a o îmbunătăți va fi nevoie, paradoxal, de mai multă muncă decât a fost depusă până acum. ”Este foarte important setul de date introduse, mai precis calitatea setului de date de antrenamente și, desigur, și cantitatea” spune Emil Ștețco.

Intellidockers este utilizabil în cadrul platformelor de marketing sau competitive business intelligence, healthcare, soluții de securitate pentru agenții guvernamentale, sisteme de customer support sau în cadrul unor platforme de automatizare inteligentă și RPA (robotic process automation).

Emil Ștețco a explicat cum poate fi utilizat în domeniul presei, având în vedere că poate extrage dintr-un articol sentimentele pe care le generează acesta, pe care le poate grupa în trei categorii: pozitive, negative sau neutre. ”Asta poate contribui la calibrarea articolului, înainte de publicare. Cele mai bune articole sunt cele care generează sentimente neutre”, adaugă acesta. De asemenea, algoritmul ar putea spune unui site de știri secțiuniile în care trebuie publicate articolele, în funcție de conținutul lor.

În plus, algoritmul poate furniza date legate de trendul articolelor care sunt publicate într-o perioadă la nivel mondial, analizând baze mari de date. De asemenea, poate compara semantic două sau mai multe documente, pentru identificarea subiectelor comune dintr-un set mare de informații și poate extrage automat date despre entitățile și tipului lor din aceste documente: nume de persoane, nume de organizații, locații, referințe temporale, unitați de măsură, monede, denumiri de produse, naționalități și multe altele.

Foto: exemplu analiza de continut – intellidockers

Mergând spre domeniul mai larg de aplicare, ar mai fi de citat un comunicat al companiei, potrivit căruia elementele pe care această soluție le poate extrage automat dintr-un document sunt:

Limba sau limbile în care a fost scris documentul (Language Detection).

Sentimentele manifestate în document: pozitive, negative, neutre (Sentiment Analysis).

Clasificare a documentelor pe baza standardelor IPTC și IAB (Classification).

Extragerea entităților și a tipului lor din documente: nume de persoane, nume de organizații, locații, referințe temporale, unitați de măsură, monede, denumiri de produse, naționalități (Named Entity Extraction).

Sumarizare automată a documentelor (Automatic Summarization).
Compararea semantică a două sau mai multe documente, pentru identificarea subiectelor comune dintr-un set mare de documente (Similarity Check).

Lansarea acestui produs software de inteligenta artificiala care include și limba română este a doua premieră pentru Zetta Cloud, precizează reprezentanții companiei.

În anul 2017 în urma unei finanțări Google, a creat prima platforma care poate detecta automat nivelul de încredere al știrilor folosind algoritmi avansați de inteligenta artificiala, TrustServista: www.trustservista.com.

Potrivit reprezentanților companiei, în prezent această soluție este folosita în cadrul unor proiecte educationale în SUA și Asia de Sud Est dar și în cadrul unor proiecte europene de detectare a mesajelor radicale din mediul online.

Foto Emil Ștețco: www.zettacloud.ro

Urmărește mai jos producțiile video ale G4Media:

5 comentarii

Crivat

18.6.2019 la ora 6:48 pm

Felicitari baietilor din Cluj, care prin efortul lor incet incet ne aduc in rand cu lumea, cu mentiunea ca „premiera mondiala” e un titlu mult prea exagerat si reflecta amatorismul/dorinta de senzational autorului articolului. Chestiile astea (sentiment analysis) si altele mult mai complicate ( natural language processing, deep learnining) se fac de ani buni in SUA care este lider mondial in domeniu si sunt deja implementate in produsele Google, Micrisoft, Amazon, Apple etc
Meritul baietilor din Cluj este faptul ca au aplicat algorimi si metodologii de neural networks deja dezvoltate si la aplicatii in limba romana, care necesita un efort de calibrare netrivial, dar nicidecum ceva de spart gura targului.
- Cloudfare
  
  18.6.2019 la ora 8:07 pm
  
  Guvernul zero analiza
Alexandru Balan

18.6.2019 la ora 7:41 pm

” ANALISE THIS! ” :
MUI3 SI MUARTE – P$D/ALDE & UDMR !
mike

18.6.2019 la ora 8:59 pm

Din cate stiu primul algoritm de rețele neurale a fost creat in 1940 de catre Pitts si apoi îmbunătățit treptat. Dar poate algoritmul celor de la Zetta este diferit…. Pe un astfel de algoritm se bazeaza si traducerile automate.
O fata

19.6.2019 la ora 1:38 pm

Poate erau și fete acolo…

G4Media.ro

G4Media.ro

O companie de IT din Cluj-Napoca anunță o premieră mondială: A dezvoltat un algoritm de analiză în limba română. Softul poate extrage dintr-un text sentimentele pe care le generează

Urmărește mai jos producțiile video ale G4Media:

Donează lunar pentru susținerea proiectului G4Media

Donează suma dorită pentru susținerea proiectului G4Media

Citește și...

Inteligența artificială îmbunătățește detectarea abuzului asupra copiilor, potrivit unui nou studiu

Filmele realizate cu ajutorul inteligenței artificiale pot câștiga cele mai importante Oscaruri

UE investeşte 140 de milioane euro pentru implementarea de tehnologii digitale esenţiale / Planul implică stimularea implementării inteligenţei artificiale, extinderea reţelei centrelor europene de inovare digitală şi combaterea dezinformării

5 comentarii