Prekladač Google zažíva revolúciu. Významne vylepší preklad aj pre slovenčinu

24. 04. 2017

logo spoločnosti Google Inc.Prekladač Google sa dočkal zásadného vylepšenia, pričom bude prekladať presnejšie a s lepším pochopením textu. Preklad medzi angličtinou a slovenčinou bude využívať špičkovú technológiu prekladu založenú na neurónových sieťach.

Táto novinka znamená doteraz najvýraznejšie zlepšenie a zodpovedá pokroku, ktorým strojové preklady prešli za posledných 10 rokov. Neurónový preklad totiž prekladá vety ako celok (teda nielen po kratších slovných spojeniach – frázach), ktorý je založený na dynamickom rozvoji práve strojového učenia.

Cieľom Googlu je sprístupňovať informácie čo najviac ľuďom na svete. Až polovica všetkého obsahu na internete je v anglickom jazyku, ale iba 20 % svetovej populácie angličtinu ovláda na nejakej úrovni. Strojové učenie mení od základov skoro všetky služby a projekty, na ktorých Google pracuje a práve Prekladač je skvelou ukážkou, aký pokrok sa dá vďaka nemu dosiahnuť.

Neurónový preklad poskytne výrazne lepšie výsledky než doteraz využívaný systém prekladu fráz. Je to najmä z dôvodu prekladu viet ako celku (teda nielen po kratších slovných spojeniach), ktorý je založený na dynamickom rozvoji práve strojového učenia (viac informácií o strojovom učení je k dispozícii na oficiálnom výskumnom blogu). Vďaka tomu budú preklady presnejšie a budú sa vo väčšej miere približovať prirodzenej reči ľudí. Túto zmenu bude možné sledovať najmä pri preklade dlhších a komplikovanejších viet.

 A ako to teda funguje? (GIF na stiahnutie)

 príklad prekladu

príklad prekladu obr. 3 Google preklad

Nový neurónový preklad pre slovenčinu bude dostupný všetkým požívateľom tak v mobilnej aplikácii, ako aj vo webovej verzii na stránke translate.google.sk, a tiež vo vyhľadávači Google. Čoskoro bude dostupný aj v rámci automatického prekladu v prehliadači Chrome.

Slovenčina je jedným zo 16 jazykov, ktoré budú oddnes využívať technológiu prekladu založeného na neurónových sieťach.

Neurónové“ zaujímavosti:

Neurónové siete dokážu zredukovať chyby v prekladoch o 55 – 85 % v rámci mnohých jazykových dvojíc a táto novinka znamená doteraz najvýraznejšie zlepšenie a zodpovedá pokroku, ktorým strojové preklady prešli za posledných 10 rokov. Novinka sa týka 16 jazykov (v dvojici s angličtinou), až 10 z nich sa systém „učil“ v rámci viacjazyčných modelov.

Zhrnutie

  • Slovenčina je jedným z ďalších jazykov, ktoré budú využívať technológiu prekladu založeného na neurónových sieťach.
  • Väčšina prekladov bude presnejšia a priblíži sa prirodzenej hovorovej reči.
  • Zlepšenie bude viditeľné najmä pri použití na preklad dlhších viet, pretože ich teraz prekladáme ako celok, a nielen ako jednotlivé frázy ako tomu bolo doteraz. Vďaka tomu dlhšie odstavce budú preložené Prekladačom s lepším pochopením textu.


O čo ide:

  • Táto novinka znamená doteraz najvýraznejšie zlepšenie a zodpovedá pokroku, ktorým strojové preklady prešli za posledných 10 rokov.
  • Neurónový preklad je 3. generáciou strojového prekladu (po RBMT/rule-based a SMT/PBMT/statistical/phrase-based). Prekladač Google bol prvých 10 rokov založený na frázovom prekladaní (PBMT).
  • Novým zistením je, že neurónová technológia spracováva jazyky lepšie, keď sa ich učí niekoľko naraz. Dá sa to prirovnať k tomu, že aj človek sa jednoduchšie naučí cudzí jazyk, ak už pozná niektorý z príbuzných jazykov. V prípade Prekladača - napríklad máme omnoho viac dát pre hindčinu než pre jej príbuzné jazyky maratčinu a bengálčinu. Keď sa ich systém učí všetky naraz, všetky tri jazyky sa zlepšia viac ako keby sa ich učil individuálne.
  • Za rozvojom vedy okolo „neurónového strojového prekladu“ (Neural Machine Learning) stojí mnoho softvérových vývojárov. Googlu sa podarilo vyvinúť vlastné špecializované čipy pre preklad a vizuálne rozpoznávanie, tzv. TPUs (Google Tensor Processing Units) a spolu s inovatívnymi nápadmi svojich inžinierov dokázal priniesť túto novú technológiu masám.
  • Neurónové preklady sú odteraz dostupné pre vybrané jazyky na väčšine platforiem Prekladača Google: v aplikáciách, na webovej stránke a tiež vo Vyhľadávači Google.


Čo je nové na tomto systéme prekladu?

Obidva, neurónový aj štatistický systém strojového prekladu, vychádzajú z obrovského množstva dát z oficiálnych prekladov rovnakých dokumentov do viacerých jazykov. Na ich základe určujú, aký vzťah je medzi jazykmi. Rozdiel je v tom, ako každý z týchto systémov využíva vložené dáta. Neurónový systém sa neučí jazyky samostatne, ale sám sa učí ako prekladať zadané texty tak, aby čo najviac zodpovedali textom, ktoré mu boli poskytnuté ako základ pre učenie. Kým štatistický systém porovnáva vložené dáta podľa vopred zadaných gramatických vzorcov.

Prekladač Google – globálne štatistiky:

  • viac ako jedna miliarda uskutočnených prekladov za deň
  • každý deň sa preloží 140 miliárd slov
  • viac ako 500 miliónov používateľov mesačne
  • dostupný pre 103 jazykov, čo predstavuje až 99 % používateľov internetu
  • len 8 % dopytov na preklad pochádza z USA                


O spoločnosti Google Inc.

Spoločnosť Google sa ako globálny technologický líder snaží neustále vylepšovať spôsob prepájania ľudí s informáciami. Inovácie Googlu v oblasti vyhľadávania a reklamy umožnili spoločnosti získať vedúcu pozíciu na internete a vytvoriť jednu z najznámejších svetových značiek.

# # #

Google je ochranná známka spoločnosti Google Inc. Všetky ďalšie názvy spoločností a produktov môžu byť ochrannými známkami príslušných spoločností, s ktorými sú asociované.

Informácie nám poskytla Daša Tkáčová zo spoločnosti GRAYLING.

Uverejnila: MI

Kľúčové slová:
informačné a komunikačné technológie , inovácie

Odbory vedy a techniky:
Iné

Tlač