ROMÂNI CARE AU REUȘIT

Transpunerea unui text de pe banda reportofonului pe hârtie reprezintă o muncă migăloasă și grea. O mână de specialiști români în IT au creat însă relativ recent o tehnologie de recunoaștere vocală, care ne ușurează munca, nu numai nouă, jurnaliștilor, ci și profesioniștilor în comunicare din varii domenii. Această tehnologie „transformă”, în doar câteva minute, o poveste vorbită, în cuvânt scris, indiferent de lungimea poveștii. Firma căreia i se datorează acest concept se numește Vatis Tech, operează deocamdată în România, dar cu perspective internaționale.
Adrian Ispas, fondator și CEO al „Vatis Tech”: „Am conceput o nouă limbă, de la zero”
– Suprimarea muncii de transcriere a unui text înregistrat audio, pe hârtie, pare ceva de-a dreptul revoluționar. Cum ați ajuns la ideea proiectului dvs.?

– Proiectul a început în urmă cu exact trei ani, când, împreună cu Alexandru Nicolae Topală și Emanuel-Ioan Nazare, ne-am înscris la un concurs de programare, „Innovation Labs”. În acea perioadă, ascultam multe podcasturi și voiam să revin ușor la anumite idei din ele, însă era foarte greu să cauți în audio. Lucrând în domeniul IT, m-am gândit că poate și alții întâmpină aceleași dificultăți și că ar fi utilă o tehnologie care să ne ajute din acest punct de vedere.
– Ce anume poate să facă acest program de transcriere pe care l-ați inventat?
– Programul creat de noi transformă efectiv cuvântul rostit în cuvânt scris, ca la o scriere după dictare, dacă vreți. Mai exact, detectează automat numărul de vorbitori din fișierul audio și îi asociază cu cuvintele, identifică o gamă largă de entități, cum ar fi nume de persoane și companii, date sau locuri, adaugă automat semne de punctuație și scrie numele proprii cu majuscule, pentru a face transcrierea mai lizibilă, convertește automat numerele scrise cu litere în numere scrise cu cifre etc.
– Cât timp a durat de la idee până la punerea ei în practică?

– Momentul în care am decis că trebuie să concepem propria tehnologie a fost la final de 2020-început de 2021, iar algoritmul pentru limba română a fost complet finalizat în iunie 2022. A durat, așadar, aproximativ un an și jumătate. În tot acest timp, pentru că nu aveam resurse pentru limba română și nici o infrastructură specifică în spate, am construit tot ce aveam nevoie, practic, am „conceput” o nouă limbă, de la zero. Cam așa s-ar traduce, în termeni uzuali, ceea ce am făcut noi la nivel de program IT.
– Un proiect realizat de trei oameni?
– Din păcate, când am început să dezvoltăm această tehnologie pentru limba română, nu aveam aproape nici o resursă, deoarece nu exista foarte multă cercetare academică pe zona de transcriere automată și astfel, nefiind un domeniu foarte dezvoltat, nu a fost nimeni înaintea noastră care să creeze baze de date audio necesare algoritmilor de transcriere. Astfel, am decis să construim noi totul de la zero, de la platforma de colectare de date, până la colectarea și etichetarea efectivă a datelor, cu ajutorul unor oameni pe care îi plăteam din salariile noastre, de la joburile de zi cu zi, de la acea vreme. Acum, Vatis Tech e singurul nostru loc de muncă.
Proiect evaluat la peste 4 milioane de euro

Inițial, doar Adrian Ispas, Alexandru Nicolae Topală și Emanuel-Ioan Nazare au fost implicați în acest proiect, în timp li s-a alăturat și Gabriel Mureșanu, cu peste 20 de ani de experiență în vânzări, iar cel mai nou membru al echipei este Claudia Ancuța, și ea cu zece ani de experiență în marketing.
– Pentru un întreprinzător care pornește o afacere, ce este mai greu de găsit: banii sau oamenii?
– Oamenii. Este extrem de dificil să găsești oameni foarte buni, care să se alăture unui start-up la început de drum, când nimic nu este sigur și nu știi dacă peste un an afacerea va mai exista sau nu. Dacă ai noroc să ai alături, de la început, oameni foarte buni, o echipă foarte bună, banii întotdeauna te vor urma.
– Investiția inițială a fost din fonduri europene sau din surse proprii?
– Investiția inițială a fost din fonduri proprii, practic ne-am pus în joc salariile de la joburile noastre de la acea vreme, și s-a ridicat la câteva zeci de mii de euro, pentru o perioadă de jumătate de an. Apoi am reușit să atragem investiții în valoare de 850.000 euro, de la investitori privați. Vatis Tech este acum evaluat la peste 4 milioane de euro.
– Pe cine ați convins până acum de utilitatea proiectului?

– Vatis Tech se bucură deja de încrederea a peste 30 de clienți constanți: trusturi de presă, instituții media, dar și din domeniul medical, financiar, juridic sau al inovației tehnologice. Principalul feedback primit de la clienți a fost legat de acuratețea transcrierii, ceea ce ne-a ajutat să dezvoltăm tehnologia pe mai multe verticale, precum apeluri telefonice, medical sau legal. Clienților Vatis Tech li se adaugă, la momentul actual, și 11 parteneri din sfera furnizorilor de tehnologie, a integratorilor de sisteme și a furnizorilor de date. Cu toate acestea, această tehnologie nu se adresează doar companiilor mari, ci și free-lancerilor sau oricărei persoane interesate să convertească rapid o înregistrare audio în text scris. Pentru aceștia, Vatis Tech are o ofertă promoțională, de o oră gratuită, pe care cei interesați o pot utiliza fie integral, o singură dată, fie în reprize mai mici, fără limită de timp.
– Ce planuri de viitor aveți?
– Momentan, ne concentrăm pe îmbunătățirea tehnologiei de recunoaștere vocală pentru limba română, însă avem în plan să dezvoltăm soluția și pentru alte limbi vorbite în Europa, precum franceza, spaniola sau germana. Pentru limba română, am demonstrat că soluția noastră are rezultate mai bune decât tehnologia Google: conform testelor, acuratețea transcrierii Google este de 84 la sută, pe când cea a Vatis Tech a depășit 95 la sută.