Antonija Dujmović
Govoreći o mogućnostima primjene analize nestrukturiranog teksta jedna od zapaženijih sudionica ovogodišnje konferencije Women in Data Science bila je Ana-Marija Petric. Danas konzultantica u Poslovnoj inteligenciji svoja je prva radna iskustva iz područja podatkovne znanosti stjecala u Nizozemskoj kamo je otišla nakon što je magistrirala jezike na Oxfordu. Podijelila je s nama svoja iskustva i razmišljanja o širokim mogućnostima primjene podatkovne znanosti i prediktivne analitike.
Što je trenutno u fokusu Vašeg stručnog (znanstvenog) interesa?
U fokusu mog stručnog interesa trenutno je NLP (Natural language processing), medicina i prediktivna analitika. NLP kao kombinacija lingvistike, znanosti o informacijama i computer science je izvrsno polje u kojem mogu kombinirati svoje formalno obrazovanje sa znanošću o podacima. Također, analiza nestrukturiranog teksta je polje goleme potencijalne primjene.
Medicina je trenutno dio društva gdje vidim ogromne primjene za podatkovnu znanost, od preventivne medicine do analize slika i meta analize medicinskih članaka.
Što se tiče prediktivne analitike, smatram da se u polju predviđanja budućih kretanja može značajno smanjiti problem nedovoljnih ili prevelikih količina na zalihama te na taj način doprinijeti boljem funkcioniranju nizova opskrbe.
Koji su konkretni načini primjene rezultata Vaših istraživanja i rada?
Konkretno, analiza nestrukturiranog teksta pridonosi poboljšanju razumijevanja golemih količina podataka, zaštiti osobnih podataka (jako puno podataka se nalazi u nestrukturiranom tekstu), bržoj obradi informacija i slično. Kada govorimo o analizama primjerice sentimenta, možemo ju primjeniti u analizi support ticketa (tako da se napravi priority queue za one korisnike koji imaju najnegativniji pristup) ili u analizi efekata marketinških kampanja.
Kod medicinskih problema, mnogo vremena je utrošeno na prikupljanje relevantnih članaka, objavljenih istraživanja i slično. Machine learning pomaže pretražujući goleme baze članaka u nekoliko sekundi te omogućava liječniku da se vrlo brzo i na jednom mjestu upozna sa svim relevantnim člancima bilo o bolesti bilo o terapijama.
Prediktivna analitika omogućava smislenije i bolje planiranje količina uzimajući u obzir ponašanja krajnjih korisnika. Takav pristup omogućava retailerima i producerima da optimiziraju svoje poslovanje, kako ulaganja tako i svakodnevne operacije poput skladištenja i ruta.
Jesu li mogućnosti koje pruža podatkovna znanost dovoljno prepoznate u društvu?
Mogućnosti podatkovne znanosti u Hrvatskoj nisu još dovoljno dobro prepoznate. Vrlo često se govori o podatkovnoj znanosti bez da se daju konkretni primjeri. U inozemstvu je ta situacija obrnuta, barem što se tiče Nizozemske jer su mogućnosti puno bolje prepoznate i korištene.
Što je Vas osobno motiviralo i usmjerilo na ovo područje?
Znatiželja. Htjela sam razumjeti, budući da sam iz humanističke struke, zašto ljudi rade to što rade i govore to što govore. Kroz godine rada moj interes se produbio na ostala područja poput medicine i financija, ali konstanta je znatiželja i entuzijazam za naučiti nešto novo.
Koji su posebni izazovi u ovom zanimanju?
Kombinirati poslovna i matematička znanja, komunicirati s različitim vrstama ljudi (od CEO-a do osoba koje rade u skladištima primjerice), opravdati često visoke inicijalne troškove projekata činjenicom da se smanju work load ili da se kroz vrijeme ostvaruju značajne uštede. Balansirati zahtjeve korisnika, jer niti jedan algoritam nije svemoguć i to se uvijek treba imati u vidu.
Kako je izgledao Vaš obrazovni put i jesu li djevojke bile u manjini među Vašim kolegama/cama?
Ja sam studirala jezike tako da su kod mene djevojke i žene uvijek bile većina. Na Oxfordu sam radila laboratorijska istraživanja i komputacijsku lingvistiku što mi je omogućilo inicijalno znanje o programiranju. Dalje dam ga nadograđvala internim i eksternim edukacijama u Nizozemskoj ovisno o branši u kojoj sam radila. Velik dio mog obrazovnog puta u podatkovnoj znanosti bio je praktične prirode, kao junior dio teama sve do senior pozicije.
Koja biste stereotipna mišljenja o ovom zanimanju izdvojili?
Mnogo ljudi misli da je podatkovna znanost samo fancy ime za običnu statistiku. Statistika je važan dio podatkovne znanosti ali sigurno nije sve. Također, ljudi često smatraju da umjetna inteligencija znači robotika ili da će umjetna inteligencija preuzeti svijet. Umjetna inteligencija trenutno za to nije uopće sposobna.