O companie de IT din Cluj-Napoca anunță o premieră mondială: A dezvoltat un algoritm de analiză în limba română. Softul poate extrage dintr-un text sentimentele pe care le generează
Zetta Cloud din Cluj Napoca, o companie specializată în cercetarea și dezvoltarea de produse software din domeniul Inteligenței Artificiale, a anunțat lansarea în premieră mondială a primei soluții complete de analiză automată de text pentru limba română. Directorul general al companiei, Emil Ștețco, a explicat pentru G4Media cum funcționează produsul la care lucrează de șase luni.
Soluția de analiză automată de text pentru limba română este un produs software al companiei clujene numit IntelliDockers (www.intellidockers.com), destinat companiilor și organizațiilor care vor să proceseze automat volume mari de date într-un mod rapid și sigur.
Emil Ștețco spune că IntelliDockers folosește algoritmi de Inteligență Artificială de tip rețele neuronale și permite înțelegerea automată a documentelor în diferite limbi (engleză, română, germana, poloneza, italiana și maghiară).
Acesta a explicat că este vorba despre ”supervised learning”, un concept care presupune să dai sistemului suficiente de multe exemple variate, pentru ca în viitor să știe singur cu ce are de-a face. Practic, algoritmii învață bazându-se pe datele care i-au fost puse la dispoziție anterior. Un exemplu simplu: poate detecta dacă într-o imagine este o pisică sau un câine.
Există, desigur, și exemple mai complicate despre cum funcționează algoritmul și ce poate el face. Echipa care l-a dezvoltat a lucrat șase luni, iar munca a fost infernală. Este vorba despre zeci de mii de articole introduse manual, pentru ca algoritmul să aibă ce procesa.
Sistemul are o acuratețe de 80% acum, dar pentru a o îmbunătăți va fi nevoie, paradoxal, de mai multă muncă decât a fost depusă până acum. ”Este foarte important setul de date introduse, mai precis calitatea setului de date de antrenamente și, desigur, și cantitatea” spune Emil Ștețco.
Intellidockers este utilizabil în cadrul platformelor de marketing sau competitive business intelligence, healthcare, soluții de securitate pentru agenții guvernamentale, sisteme de customer support sau în cadrul unor platforme de automatizare inteligentă și RPA (robotic process automation).
Emil Ștețco a explicat cum poate fi utilizat în domeniul presei, având în vedere că poate extrage dintr-un articol sentimentele pe care le generează acesta, pe care le poate grupa în trei categorii: pozitive, negative sau neutre. ”Asta poate contribui la calibrarea articolului, înainte de publicare. Cele mai bune articole sunt cele care generează sentimente neutre”, adaugă acesta. De asemenea, algoritmul ar putea spune unui site de știri secțiuniile în care trebuie publicate articolele, în funcție de conținutul lor.
În plus, algoritmul poate furniza date legate de trendul articolelor care sunt publicate într-o perioadă la nivel mondial, analizând baze mari de date. De asemenea, poate compara semantic două sau mai multe documente, pentru identificarea subiectelor comune dintr-un set mare de informații și poate extrage automat date despre entitățile și tipului lor din aceste documente: nume de persoane, nume de organizații, locații, referințe temporale, unitați de măsură, monede, denumiri de produse, naționalități și multe altele.
Mergând spre domeniul mai larg de aplicare, ar mai fi de citat un comunicat al companiei, potrivit căruia elementele pe care această soluție le poate extrage automat dintr-un document sunt:
- Limba sau limbile în care a fost scris documentul (Language Detection).
- Sentimentele manifestate în document: pozitive, negative, neutre (Sentiment Analysis).
- Clasificare a documentelor pe baza standardelor IPTC și IAB (Classification).
- Extragerea entităților și a tipului lor din documente: nume de persoane, nume de organizații, locații, referințe temporale, unitați de măsură, monede, denumiri de produse, naționalități (Named Entity Extraction).
- Sumarizare automată a documentelor (Automatic Summarization).
- Compararea semantică a două sau mai multe documente, pentru identificarea subiectelor comune dintr-un set mare de documente (Similarity Check).
Lansarea acestui produs software de inteligenta artificiala care include și limba română este a doua premieră pentru Zetta Cloud, precizează reprezentanții companiei.
În anul 2017 în urma unei finanțări Google, a creat prima platforma care poate detecta automat nivelul de încredere al știrilor folosind algoritmi avansați de inteligenta artificiala, TrustServista: www.trustservista.com.
Potrivit reprezentanților companiei, în prezent această soluție este folosita în cadrul unor proiecte educationale în SUA și Asia de Sud Est dar și în cadrul unor proiecte europene de detectare a mesajelor radicale din mediul online.
Foto Emil Ștețco: www.zettacloud.ro
Urmărește mai jos producțiile video ale G4Media:
Donează lunar pentru susținerea proiectului G4Media
Donează suma dorită pentru susținerea proiectului G4Media
CONT LEI: RO89RZBR0000060019874867
Deschis la Raiffeisen Bank
© 2024 G4Media.ro - Toate drepturile rezervate
Acest site foloseşte cookie-uri.
Website găzduit de Presslabs.