Úterý 14. května 2024, svátek má Bonifác
130 let

Lidovky.cz

Počítače se učí mluvit i rozumět

Věda

  6:00
Počítačové systémy s hlasovým výstupem a ovládané pouze za pomoci lidské řeči byly po dlouhou dobu pouze představou autorů sci-fi. V poslední době se však zdá, že se jejich vize začínají vyplňovat.

Nastane doba, kdy operátory na infolince nahradí inteligentní hlasové automaty? Zdá se, že ne, ale výrazně jim ulehčí práci. foto: T-MobileReprofoto

Myšlenka ovládání počítačů pomocí hlasu je stejně stará jako výpočetní technika sama. Když si totiž představíme dvojici člověk-počítač jako systém, pak je klávesnice tím nejužším místem při jejich vzájemné komunikaci. To s sebou nese chronicky známé problémy: soudci, policisté nebo lékaři namísto toho, aby se věnovali své práci, tráví hodiny přepisováním textů, či si na to musejí najímat další personál.

Není tedy divu, že si z letošního veletrhu Invex odnesla ocenění Křišťálový disk i technologie NovaVoice – řešení pro převod mluvené řeči na text. Funguje přesně tak, jak byste očekávali: namísto používání klávesnice mluvíte do mikrofonu, přičemž se čtený text v reálném čase objevuje na obrazovce. V základu diktujete do Microsoft Wordu, kde přibude nový panel pro práci s programem, ale není problém systém převést i na jiné programy.

Při tvorbě programu bylo použito velké množství řečníků, takže program není závislý na jednom specifickém mluvčím, jak tomu bývalo v minulosti. U konkrétního uživatele ale probíhá systém specifického učení, takže lze při dlouhodobějším používání dosáhnout spolehlivosti až 97 %. U netrénovaných mluvčích se hodnoty pohybují kolem devadesáti procent, což znamená, že každé desáté slovo (hlavně vlastní jména) je nutno opravit ručně.

Podle prostředí, v jakém bude NovaVoice nasazen, obsahuje specifický slovník, aby pokryl co možná nejvíce odborných termínů daného odvětví. V současnosti tak existují řešení pro zdravotnictví, krajské úřady a soudnictví. Právě zde by mohl převodník mluvené řeči do textu ušetřit nejvíce času a skutečně tak zefektivnit české soudnictví. Proto se testuje u vybraných soudů v Praze a Plzni, jeho další rozšíření bude záviset především na finanční situaci.

Nejenom rozumět, ale i pochopit
Správné převedení mluvené řeči do textu je jen jednou složkou problému. Daleko náročnější bude naučit počítače chápat, co vyřčenými slovy myslíme. Ale i zde se začínají objevovat první vlaštovky.

Jednou z nich je i Týna, virtuální asistentka na lince zákaznické podpory T-Mobile. Až do konce roku funguje pouze v testovacím režimu, takže se s ní setkají jen vybraní zákazníci.

Při volání na infolinku se totiž můžete setkat se dvěma možnostmi: „plechovou hubou“, u které se musíte obrněni trpělivostí proklikávat jednotlivými položkami menu, než dosáhnete svého cíle, anebo živým operátorem, jehož provoz je však pro operátora finančně náročnější. Týna představuje rozumný kompromis mezi oběma zmiňovanými variantami: sice se vám představí jako hlasový automat, svůj požadavek jí však nesdělujete pomocí volby čísel na klávesnici, ale přirozeným jazykem. Není přitom předepsaná žádná norma, jak má takový dotaz vypadat.

Věta je pak rozložena na fonémy, základní jednotky lidské řeči, analyzována softwarem firmy Nuance Communications a porovnávána s databází více než 20 tisíc slov a slovních spojení.
Následně se v žádosti identifikuje požadovaný objekt (např. „roaming“) a akce (např. „aktivovat“). Podle zástupců společnosti T-Mobile je Týna v 80 % případů schopna vyřešit problém a navést volajícího na požadovanou oblast hlasového automatu, zbývající zákazníci mají možnost kdykoli přejít na klasický automat nebo se nechat přepojit na operátora.

Počítače mluví, zvykejte si
Dříve býval syntetický hlasový výstup něčím, s čím jsme se mohli setkat jen zřídka a co sloužilo spíše pro pobavení. Nastává však doba, kdy na vás stroje začnou mluvit čím dál tím častěji a to i v případech, kdy byste to nečekali.

Příkladem může být i populární videoserver YouTube, který bývá často terčem posměchu nebo kritiky za nízkou úroveň komentářů. Proto máte možnost nechat si před odesláním svůj příspěvek nechat přečíst, a ještě jednou tak zvážit jeho přínos. Taková funkce by jistě neškodila i mnoha českým serverům.

Autor: