Znanstvenici sa Sveučilišta u Oxfordu razvili su softver koji precizno čita ljudski govor s usana. I to s visokim točnošću od 93,4 posto – a to je puno bolji rezultat od onih koji ostvaruju ljudski stručnjaci za čitanje s usana.

Program LipNet (PDF dokument) mogao bi imati golemi potencijal primjene u raznim sferama, uvjereni su znanstvenici. Mogao bi se koristiti kao pomoć u komunikaciji s ljudima koji su gluhi, ali i poboljšati razgovore u bučnim prostorima. Također, mogao bi se koristiti i za dodavanje govora u nijemim filmovima.

Ili, pak, pomoći HAL-u 9000 da točno protumači o čemu iza zaključanih vrata pričaju astronauti David i Frank u Odiseju u svemiru

U tom pogledu, ovaj bi tehnološki iskorak mogao biti korišten za usluge „Velikog Brata“ i na Zemlji – u teoriji bi se moglo pojačati masovno praćenje građana kroz već postojeće sustave CCTV kamera koje se nalaze u mnogim gradovima po svijetu.

Tim sa Sveučilišta u Oxfordu je na projektu radio zajedno sa stručnjacima Googlea iz slavnog odjela DeepMind. Softver su trenirali na preko 30.000 videa sa snimljenim razgovorima. Sustav je tako jednostavno točno naučio kako neke riječi izgledaju dok se izgovaraju i zbog toga je postao gotovo nepogrešiv.

Za razliku od drugih sličnih programa LipNet “probavlja” izrečene fraze kao cijele rečenice pa tako riječi prevodi iz konteksta, a ne pojedinačno i zato nudi veću preciznost.

Komentiraj

Please enter your comment!
Please enter your name here

Ova web-stranica koristi Akismet za zaštitu protiv spama. Saznajte kako se obrađuju podaci komentara.