Pondělí 27. května 2024, svátek má Valdemar
  • Premium

    Získejte všechny články mimořádně
    jen za 49 Kč/3 měsíce

  • schránka
  • Přihlásit Můj účet
130 let

Lidovky.cz

Čeští vědci spolupracovali na vývoji úspěšného překladače

Věda

  5:13
PRAHA - Anglicko-český překladač CUBBITT založený na využití umělých neuronových sítí dohání v překladu novinových článků práci lidských překladatelů. Na jeho vývoji spolupracovali vědci z Matematicko-fyzikální fakulty Univerzity Karlovy. V testu byly výsledky překladače hodnoceny jako méně plynulé, avšak obsahově přesnější než lidské.
Slovníky (ilustrační foto)

Slovníky (ilustrační foto) foto: Shutterstock

Mluvčí Univerzity Karlovy (UK) Václav Hájek o tom informoval v tiskové zprávě. Článek o překladači publikoval odborný časopis Nature Communications.

Olomoučtí vědci vyvinuli nový rychlotest na koronavirus, výsledky umí ukázat do hodiny

Vědci využili neuronovou síť, kterou připravili na anglické texty a jejich protějšky přeložené do češtiny. Šlo o 58 milionů párů vět. Překladač pak použili k přeložení vzorku anglických novinových textů. Na stejném vzorku pracovali také profesionální překladatelé z překladové agentury. Kvalitu automatických i ručních překladů pak hodnotilo 15 rodilých mluvčích češtiny, kteří posuzovali přesnost a plynulost překladu. Hodnotitelé přitom nevěděli, kdo na daných větách pracoval.

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost překladu,“ uvedl hlavní autor studie Martin Popel.

Autentická a syntetická paralelní data

Podle vědců spočívala jedna z inovací ve způsobu, jak byla překladači střídavě předkládána autentická a syntetická paralelní data - tedy páry českých vět a jejich automatických překladů do angličtiny. Při experimentu vědci pozorovali, že je výhodnější neuronové síti předložit autentická a syntetická data nikoliv rovnoměrně promísená, ale ve specificky vyváženém rytmu střídajících se autentických a syntetických bloků.

Autoři studie upozornili, že měření se uskutečnilo pouze na specifickém žánru novinových článků, výsledky tedy nelze zobecňovat na překladatelskou práci jako celek. Vědci z UK spolupracovali s kolegy z Oxfordské univerzity a z týmu Google Brain.

Autor:

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!