Dnes Google analyzuje vyhľadávané frázy či vety slovo po slove. Vďaka BERT bude vyhľadávač chápať kontext medzi jednotlivými slovami a ponúkne presnejšie výsledky.
Google pripravuje jednu z najväčších aktualizácií vyhľadávača za dlhšiu dobu. Približne od minulého roka je známa technika založená na neurónovej sieti pre lepšie spracovanie prirodzeného jazyka, ktorá sa nazýva BERT. Bidirectional Encoder Representations from Transformers dokáže vďaka strojovému učeniu trénovať, aby sa zdokonaľovala v odpovedaní na otázky.
Zjednodušene povedané, Google zlepší v krátkom časovom horizonte vyhľadávanie na základe otázok tak, že pomocou určitých modelov vyhľadávanie dokáže spracovať slová vo vzťahoch medzi sebou navzájom, vrámci jednej otázky. Momentálne vyhľadávač analyzuje otázku slovo po slove. Google tak bude lepšie rozumieť kontextu slov vo vzťahu k slovu pred ním a po ňom. Prirodzene, výsledkom budú lepšie výsledky vyhľadávania.
Vylepšené vyhľadávanie nie je otázkou len nového softvérového riešenia. Modely, ktoré sa na BERT používajú, sú tak zložité, že bolo treba aj nový hardvér. Google prvýkrát použil svoje najnovšie čipy Tresor Processing Unit, TPU, ktoré využívajú cloud.
BERT je aktuálne nasadený v angličtine, do ďalších jazykov má prísť čoskoro. Už teraz Google tvrdí, že novinka pomôže jednému z desiatich vyhľadávaní. V praxi to celé znamená toľko, že do vyhľadávača môžete napísať otázku prirodzene, tak akoby ste sa ju spýtali živého človeka. Už nebudte musieť transformovať vaše dopytovanie do rôznych kostrbatých slovných zloženín, ktorým dominuje kľúčové slovo.
Táto novinka je dôležitá najmä pre jazyky, v ktorých sa významy slov zásadne menia pridaním predložky. V angličtine takýmito sú „for“ a „to“. Ďalšou výhodou BERT, je že sa riešenie dokáže vzdelávať samé v jazyku na základe vedomostí z iného jazyka. Z pomedzi jazykov, na ktoré Google doteraz na BERT nasadil, sú najvýraznejšie zlepšenia v kórejčine, hindčine a portugalčine.