Mis on kõnetehnoloogia ja mida ta meile annab?

Kõnetehnoloogia jaguneb kolmeks valdkonnaks – kõnesüntees, kõnetuvastus ja häälkäsklused. Olgugi et see tehnoloogia on üpris uudne, on ta kümne aastaga vallandanud tehnikamaailmas tõelise revolutsiooni, jõudes tänaseks praktiliselt kõikjale. Vaatame aga lähemalt, kuidas antud tehnoloogiad toimivad ja kas ta lubab näiteks tulevikus suhelda nutiseadmetega emakeeles või vaadata Netflixi võrukeelsete subtiitritega.

Siri & Siiri

Kõnetehnoloogia vorm, millega me igapäevaselt enim kokku puutume, on häälkäsklused. 2011. aastal seadis Apple maailma kursi häälkäsklustele, kui iPhone 4S-i integreeriti tänaseks kuulsaim häälabiline Siri. Kümne aastaga on Siri saanud endale lugematul arvul vendi-õdesid, jõudes me autodesse, koduseadmetesse ja mujale.

Häälabilised vajavad aktiveerimiseks märksõna ning täna on levinumad “Ok, Google” ja “Hey, Siri”. Erinevate allikate kohaselt investeeris Apple 2010. aastal üle 200 miljoni dollari selleks, et Siri integreeritakse Apple’i seadmetega. Ka Eesti riik on fikseerinud kursi kõnetehnoloogia täielikule väljaarendamisele meie emakeeles, käivitades keeletalgud, kus kogutakse tavaliste inimeste spontaanset kõnet.

Kõnetuvastus ehk automaatne transkriptsioon

Kõnetuvastuse ehk automaatse transkribeerimise abil muudetakse inimkõne kirjalikuks tekstiks. Kõnetuvastus hõlbustab vaegkuuljate jaoks päevakajaliste otsesaadete jälgimist, kus kõneldud tekst muudetakse automaatsubtiitriteks. Automaatsubtiitrid on reaalajas masina poolt loodud tiitrid, et suurendada ligipääsetavust päevakajalisele infole ja arutelule ning lihtsustada otsesaadete jälgimist otse-eetris. Kõnetuvastus leiab täna juba kasutust ka näiteks Põhja-Tallinna Regionaalhaigla radioloogia osakonnas uuringuaruannete koostamisel ning ka Riigikogus ja kohtutes, kus istungeid stenografeeritakse, vähendades nii inimeste töökoormust.

Kõnesüntees ehk masinrääkimine

Kõnesüntees on võime teisendada teksti kõneks inimese enda abita. Kõnetuvastussüsteemid kasutavad lausete esmaseks kaardistamiseks kõige väiksemaid heliühikuid, mida kutsutakse foneemideks. Seejärel, kui foneetilised rühmad on tuvastatud, teisendab masin tekstid, mis eelnevalt juba muudeti foneemideks, heliks.

Emakeelsesse kõnetehnoloogia arengusse on oodatud panustama kõik

Kuigi kõnetehnoloogia on tänaseks pea kõikjal, jätkub tal potentsiaali palju enamaks. Kui me seni oleme harjunud kasutama kõnetehnoloogiat inglise keeles, ei ole kaugel ka aeg kui me saame pöörduda oma telefoni, nutikella, targa koduabilise või auto poole oma emakeeles.
Heategevusliku kampaania “Anneta kõnet” on ellu kutsutud koostöös Majandus- ja Kommunikatsiooniministeeriumi ja Riigi Infosüsteemi Ametiga. Ühine eesmärk on koguda tavaliste inimeste spontaanset eestikeelset kõnet kõnetehnoloogia lahenduste – kõnetuvastus ja häälkäsklused – arendamiseks. Selleks suundu www.annetakõnet.ee platvormile ja panusta emakeelse kõnetehnoloogia arengusse.

 

Jäta oma vastus

Please enter your comment!
Please enter your name here