Pátek 26. dubna 2024, svátek má Oto
130 let

Lidovky.cz

Počítač míří do televizní soutěže

Česko

Stroje se učí porozumět otázkám formulovaným přirozenou řečí

Pokroky na poli umělé inteligence má demonstrovat počítač přihlášený do televizní vědomostní soutěže. Jeho tvůrci si výsledkem souboje s lidmi nejsou vůbec jistí.

Vtelevizních pořadech typu Chcete být milionářem či Riskuj! vyhrává ten, kdo má všestranné znalosti a kdo třeba z neúplných informací uložených v nevyužívaných koutech paměti odvodí správnou odpověď častěji než soupeř. Samozřejmě se musí umět včas rozhodnout.

Jak by si v takové soutěži vedl počítač? Takřka neomezená schopnost skladovat data by ho jasně favorizovala, musel by ale být schopen porozumět otázce, probrat se uskladněným informačním balastem a dostatečně rychle formulovat odpověď.

Právě o to se pokouší tým společnosti IBM pracující na projektu Question Answering computing system (Systém na odpovídání otázek). Stroj má přezdívku Watson, podle zakladatele firmy Thomase Watsona. IBM přihlásila svůj výtvor do soutěže Jeopardy!, což je přímý vzor českého Riskuj. Jeopardy! na amerických obrazovkách běží už několik desetiletí.

Pochop, vyhledej, vyhodnoť, opakuj a porovnej Pravidla soutěže není asi třeba přibližovat. Důležité je, že otázka často není formulována přímočaře, takže rozhodně nestačí jednoduché prohledávání encyklopedií. Počítač musí být především schopen rozpoznat, na co má odpovídat.

Nejde o triviální úkol. V americké soutěži je zadání často prošpikováno idiomy, slovními hříčkami a dvojsmysly. Místo jednoduchého udání čísla se využívá analogií se známými jevy, což pro počítač úlohu dál komplikuje. Vědce právě tyto překážky přitahují. „Cílovou metou je, aby počítač dokázal hovořit jako člověk,“ říká šéf týmu David Ferruci.

Látku, tedy všechno možné, co lze považovat za všeobecné znalosti, si Watson „nastuduje“ a uloží a utřídí dopředu. Během soutěže nebude připojen k internetu.

Jakmile zazní otázka, začne „zapamatovaná“ data prohledávat a zkusí v databázi najít relevantní obsah. Nespokojí se s jednou odpovědí. Naopak, čím víc, tím líp. Výsledky pak podrobí statistické analýze. Když systém vyhodnotí odpověď za dostatečně pravděpodobnou, přihlásí se o slovo. Odpověď Watson vysloví pomocí hlasového výstupu. V případě správné odpovědi hlasem oznámí i kategorii, z níž bude další otázka.

Watson nemusí napodobovat lidi ve všem. Kromě toho, že bude osvobozen od obligátního rozhovoru o zálibách a o tom, jaká byla cesta do studia, mu lidé z IBM vyjednali ještě jednu malou výhodu: jejich svěřenec bude dostávat otázky v elektronické podobě.

To by nemělo přesvědčivost demonstrace ohrozit. Počítače už totiž dokážou převádět mluvené slovo do psané podoby se slušnou úspěšností. I rozpoznávání textu je zaběhanou technologií, ale projekt by to zbytečně prodražilo. Takto se vývojáři mohou soustředit na podstatné problémy. Pokud by o to byl zájem, nic nebrání tomu, aby byl Watson o tyto moduly obohacen.

Vědomostní soutěže, v nichž by soupeřily počítače, by jistě neměly velkou sledovanost. Ovšem kdyby stroj s rozumnou spolehlivostí odpovídal na otázky z libovolné oblasti, našel by široké pole uplatnění.

Watson využívá výpočetní síly superpočítače Blue Gene. Ten bude kvůli soutěži převezen do Los Angeles. Ani sofistikovaný expertní systém běžící na extrémně výkonném hardwaru nezaručuje úspěch. Podíl správných odpovědí u vítězů soutěže Jeopardy! se obvykle pohybuje kolem 85 procent. Pokud by za lidi soutěžil Kenneth Jennings, bylo by zřejmě potřeba ještě víc. Jenningse v roce 2004 proslavila série 74 vítězství v řadě, za což inkasoval v soutěži rekordní sumu více než dva a půl milionu dolarů (více než 50 milionů korun).

Při demonstraci Watsonových schopností program dešifroval poměrně komplikovaně zadanou zeměpisnou otázku, aby vzápětí na dotaz, co je to list (anglicky sheet), odpověděl, že ovoce. Že by chtěl vyvrátit předsudek, že počítače neumějí vtipkovat?

***

Počítač se musí vyrovnat se zadáním, které je velmi často prošpikováno idiomy, analogiemi, slovními hříčkami a dvojsmysly

Autor: