Čtvrtek 13. května 2021svátek má Servác 11 °C občasný déšť Předplatné LN
Lidovky.cz > Orientace > Věda

Počítače se učí mluvit i rozumět

Nastane doba, kdy operátory na infolince nahradí inteligentní hlasové automaty? Zdá se, že ne, ale výrazně jim ulehčí práci. | na serveru Lidovky.cz | aktuální zprávy Nastane doba, kdy operátory na infolince nahradí inteligentní hlasové automaty? Zdá se, že ne, ale výrazně jim ulehčí práci. | foto: T-MobileReprofoto

Počítačové systémy s hlasovým výstupem a ovládané pouze za pomoci lidské řeči byly po dlouhou dobu pouze představou autorů sci-fi. V poslední době se však zdá, že se jejich vize začínají vyplňovat.

Myšlenka ovládání počítačů pomocí hlasu je stejně stará jako výpočetní technika sama. Když si totiž představíme dvojici člověk-počítač jako systém, pak je klávesnice tím nejužším místem při jejich vzájemné komunikaci. To s sebou nese chronicky známé problémy: soudci, policisté nebo lékaři namísto toho, aby se věnovali své práci, tráví hodiny přepisováním textů, či si na to musejí najímat další personál.

Není tedy divu, že si z letošního veletrhu Invex odnesla ocenění Křišťálový disk i technologie NovaVoice – řešení pro převod mluvené řeči na text. Funguje přesně tak, jak byste očekávali: namísto používání klávesnice mluvíte do mikrofonu, přičemž se čtený text v reálném čase objevuje na obrazovce. V základu diktujete do Microsoft Wordu, kde přibude nový panel pro práci s programem, ale není problém systém převést i na jiné programy.

Při tvorbě programu bylo použito velké množství řečníků, takže program není závislý na jednom specifickém mluvčím, jak tomu bývalo v minulosti. U konkrétního uživatele ale probíhá systém specifického učení, takže lze při dlouhodobějším používání dosáhnout spolehlivosti až 97 %. U netrénovaných mluvčích se hodnoty pohybují kolem devadesáti procent, což znamená, že každé desáté slovo (hlavně vlastní jména) je nutno opravit ručně.

Podle prostředí, v jakém bude NovaVoice nasazen, obsahuje specifický slovník, aby pokryl co možná nejvíce odborných termínů daného odvětví. V současnosti tak existují řešení pro zdravotnictví, krajské úřady a soudnictví. Právě zde by mohl převodník mluvené řeči do textu ušetřit nejvíce času a skutečně tak zefektivnit české soudnictví. Proto se testuje u vybraných soudů v Praze a Plzni, jeho další rozšíření bude záviset především na finanční situaci.

Nejenom rozumět, ale i pochopit
Správné převedení mluvené řeči do textu je jen jednou složkou problému. Daleko náročnější bude naučit počítače chápat, co vyřčenými slovy myslíme. Ale i zde se začínají objevovat první vlaštovky.

Jednou z nich je i Týna, virtuální asistentka na lince zákaznické podpory T-Mobile. Až do konce roku funguje pouze v testovacím režimu, takže se s ní setkají jen vybraní zákazníci.

Při volání na infolinku se totiž můžete setkat se dvěma možnostmi: „plechovou hubou“, u které se musíte obrněni trpělivostí proklikávat jednotlivými položkami menu, než dosáhnete svého cíle, anebo živým operátorem, jehož provoz je však pro operátora finančně náročnější. Týna představuje rozumný kompromis mezi oběma zmiňovanými variantami: sice se vám představí jako hlasový automat, svůj požadavek jí však nesdělujete pomocí volby čísel na klávesnici, ale přirozeným jazykem. Není přitom předepsaná žádná norma, jak má takový dotaz vypadat.

Věta je pak rozložena na fonémy, základní jednotky lidské řeči, analyzována softwarem firmy Nuance Communications a porovnávána s databází více než 20 tisíc slov a slovních spojení.
Následně se v žádosti identifikuje požadovaný objekt (např. „roaming“) a akce (např. „aktivovat“). Podle zástupců společnosti T-Mobile je Týna v 80 % případů schopna vyřešit problém a navést volajícího na požadovanou oblast hlasového automatu, zbývající zákazníci mají možnost kdykoli přejít na klasický automat nebo se nechat přepojit na operátora.

Počítače mluví, zvykejte si
Dříve býval syntetický hlasový výstup něčím, s čím jsme se mohli setkat jen zřídka a co sloužilo spíše pro pobavení. Nastává však doba, kdy na vás stroje začnou mluvit čím dál tím častěji a to i v případech, kdy byste to nečekali.

Příkladem může být i populární videoserver YouTube, který bývá často terčem posměchu nebo kritiky za nízkou úroveň komentářů. Proto máte možnost nechat si před odesláním svůj příspěvek nechat přečíst, a ještě jednou tak zvážit jeho přínos. Taková funkce by jistě neškodila i mnoha českým serverům.

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Lékařské špičky v kauze obřích pojistných podvodů. Hrozí jim až 10 let

Pojistky před soudem. Případem rozsáhlých pojistných podvodů se škodou zhruba... | na serveru Lidovky.cz | aktuální zprávy

Premium Uznávaní doktoři „léčili“ neexistující zranění. V kauze tří stovek pojistných podvodů za 50 milionů korun je obžalováno...

Procházku vypnu, slibuje Rakić. Uznávaný sudí analyzuje: Dokázal by to, ale...

Rakušan Aleksandar Rakic si už Jiřího Procházky všiml. A chce mu v UFC srazit... | na serveru Lidovky.cz | aktuální zprávy

Premium Z Jiřího Procházky se mezi konkurenty polotěžké váhy UFC (93 kg) stává žádané zboží. O novou dvojku divize si hlasitě...

Nejproočkovanější země světa zavádí tvrdá opatření. Covid mají i očkovaní

Ruská vakcína Sputnik V. | na serveru Lidovky.cz | aktuální zprávy

Premium Na Seychelách vyskočil součet všech případů za více než rok pandemie v posledních třech dnech o třináctinu. Problém je...

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!