Reklama

Google Translate pridáva 110 nových jazykov, doučuje ho AI

Zdroj | Ian Macharia
Stanislav Vinc
Zdroj | Ian Macharia
Zdroj | Ian Macharia

Google Translate je už roky pre mnohých prvou voľbou, pokiaľ potrebujú preložiť súvetie, dlhšie texty alebo aj celé dokumenty. Okrem svetových jazykov Prekladač dávno ovláda aj slovenčinu, čo sa však paradoxne nedalo ešte donedávna povedať o početne zastúpenejších jazykoch.

Vďaka pokroku v oblasti veľkých jazykových modelov, ktoré poháňajú aj AI četbotov, Prekladač konečne tieto resty dobieha.

Google po prvý krát rozšíril jazykovú knižnicu Prekladača za pomoci Zero-Shot Machine Translation ešte v roku 2022. V tom čase do služby pribudlo 24 nových jazykov, ktoré sa služba naučila prekladať prostredníctvom strojového učenia bez toho, aby jej boli poskytnuté príklady existujúcich prekladov. V tom istom roku sa spoločnosť zaviazala postaviť AI model, ktorý bude rozumieť 1 000 jazykom z celého sveta.

Obsah pokračuje pod reklamou
Zdroj | Google

Tentokrát už za pomoci novšieho jazykového modelu PaLM 2, do služby Google Translare prichádza 110 nových jazykov, čo predstavuje doposiaľ najväčšiu nárazovú expanziu v jej histórii. Google týmto krokom rozšíril pokrytie služby o viac ako 614 miliónov ľudí, ktoré pridané jazyky ovládajú, čo predstavuje približne 8 % z celosvetovej populácie.

Zaujímavé je, že hoci v zozname figurujú aj malé jazyky domorodých národov či jazyky, ktoré už priamo natívne nikto neovláda, niektorými z nich naopak hovorí viac ako 100 miliónov ľudí. Približne štvrtina z pridaných jazykov pochádza z Afriky, medzi nimi aj Kantónčina či jazyky Afar a NKO, ku ktorým sa pridáva napríklad, Mančina, Pandžábčina, Tok pisin či berberský jazyk Amazigh.

Pri niektorých jazykoch čelil Google problému s absenciou ich štandardizácie, resp. potrebou voľby konkrétneho dialektu či pravopisných pravidiel, kde bolo potrebné zistiť, ktorý z variantov daného jazyka má vo svete najväčšie zastúpenie. Jedným z takýchto jazykov je aj rómčina, ktorá má po celej Európe mnoho dialektov. Voľba v tomto prípade padla na južanskú vlašskú rómčinu, do ktorej Prekladač primiešava severskú vlašskú a balkánsku rómčinu.

Jazykový model PaLM 2 má Google pomôcť aj v tomto smere a to jeho schopnosťou učiť sa ďalšie jazyky a dialekty na základe ich vzájomnej podobnosti. Do služby preto okrem nových jazykov plánuje postupne pridávať aj ďalšie varianty už existujúcich jazykov. Kto vie, Google Translate bude možno časom ovládať aj naše slovenské nárečia.

Zdroj
Ďalšia story
Zatvoriť

Newsletter

Ďakujeme za váš záujem! Odteraz vám už neunikne žiadna novinka.
Ľutujeme, ale váš formulár sa nepodarilo odoslať.