10. listopadu 2006 8:52 Lidovky.cz > Relax > Věda

Nejlepší překladatel se opičí

Jedním z průkopníků překladů na internetu byl známý vyhledávač AltaVista. Jméno služby Babel Fish odkazuje na rybičku ze známého románu Douglase Adamse Stopařův průvodce po galaxii. | na serveru Lidovky.cz | aktuální zprávy Jedním z průkopníků překladů na internetu byl známý vyhledávač AltaVista. Jméno služby Babel Fish odkazuje na rybičku ze známého románu Douglase Adamse Stopařův průvodce po galaxii. | foto: Lidové noviny

PRAHA Výsledky počítačových překladů se často uvádějí jako příklad činnosti, při které ani nejvýkonnější stroj nestačí mozku člověka. Brzy to možná přestane platit. Alespoň v případě textů bez literárních ambicí. Do praxe totiž míří nová generace programů, která se nezatěžuje větným rozborem, ale sází na hrubou sílu a velké slovníky vzorových textů.

Princip je jednoduchý: program na začátku o cizím jazyce „neví“ nic. Ale dostane k dispozici velké množství textů ve zdrojovém a v cílovém jazyce a pak si v nich sám najde pravidla. Například v případě překladu z arabštiny do angličtiny stroj opakovaně srovnává řetězce textu v arabštině s jejich anglickými protějšky a postupně vytvoří hrubý překlad. Následně text vyladí s využitím vzorů „odkoukaných“ z učebních anglických textů, čímž napodobí slovosled přirozeného jazyka. Není potřeba programovat algoritmy simulující gramatická pravidla, což je velmi náročné, málo efektivní a hlavně - musí se vytvářet pro každý jazyk zvlášť.

Boj se záplavou textů
Dnes datovými sítěmi probíhají terabajty textů. Mnohé z nich zajímají tajné služby. Pro ty zdatnější není problém e-maily či textové zprávy z mobilních telefonů zachytit a vytřídit. Ovšem chybějí překladatelé. Pro Američany jsou nyní zřejmě nejdůležitějšími jazyky arabština a čínština. Nedostatek kvalifikovaných překladatelů údajně dokonce ohrožuje národní bezpečnost.

Agentura DARPA, jejímž úkolem je financovat slibné projekty a která stála také u vzniku internetu, proto organizuje soutěže počítačových překladačů. Letošní ročník, který proběhl před týdnem, zcela ovládl program z dílny internetového giganta Google. Jeho překladatel je založený na statistických metodách. Program pro převod textů z arabštiny a čínštiny přitom vytvořili odborníci, kteří ani jeden ze zdrojových jazyků neovládali.

O deset procent horší než lidský profesionál
Ze čtyřiceti účastníků soutěže Google jasně zvítězil. V pětatřiceti úlohách obsadil první místo nebo je alespoň sdílel s jiným programem, píše časopis Nature. Poražen byl jen jedenkrát.

Při hodnocení shody překladu s výsledkem práce lidského překladatele dosáhl nevyššího skóre při překladu z arabštiny do angličtiny -celých 50 procent. Pro srovnání, pokud dokument převádějí do druhého jazyka dva lidští překladatelé, bývá shoda přibližně šedesátiprocentní. Statistický přístup k jazyku přináší i další výhody. Poradí si například s textem obsahujícím překlepy. Ty by přitom konvenční program založený na obsahu slovníku přeložit nedovedl.