Algoritmus BERT: Velký posun v porozumění přirozenému jazyku

Google dělá velké změny ve svém vyhledávacím systému. Tato je nejčerstvější. Co všechno ovlivní?
Logo Google

Minulý týden Google oznámil aktualizaci, která je považována za nejdůležitější aktualizaci od spuštění algoritmu RanBrain (2015).

„Podstatou Vyhledávání Google je porozumění jazyku. Naším úkolem je zjistit, co hledáte, a najít užitečné informace na webu, bez ohledu na to, jak slova ve svém dotazu píšete nebo kombinujete. I když už delší dobu pracujeme na zdokonalení svých jazykových znalostí, ne vždy se nám to daří, zejména u složitých nebo konverzačních dotazů. Díky nejnovějším pokrokům našeho výzkumného týmu v oblasti porozumění jazyku, které umožnilo strojové učení, významným způsobem se zlepšujeme v tom, jak rozumíme vyhledávacím dotazům, což představuje největší skok vpřed za posledních pět let a jeden z největších posunů v historii Vyhledávání.“ (Zdroj: https://blog.google/products/search/search-language-understanding-bert)

Algoritmus BERT (Bidirectional Encoder Representations from Transformers) je algoritmus hlubokého učení pro zpracování přirozeného jazyka. Tento algoritmus, který ovlivní až 10 % vyhledávacích dotazů, pomáhá vyhledávači lépe pochopit významový odstín a kontext slov zadávaných do vyhledávání a přiřadit k vyhledávacím dotazům relevantní výsledky. Analyzuje vyhledávací dotazy, nikoli webové stránky. V současné době se tato aktualizace týká textů v anglickém jazyce, ale postupně se bude rozšiřovat i na další jazyky.

Porozumět kontextu je důležité, protože bez kontextu nelze odstranit případné potenciální dvojznačnosti. Jako příklad Google uvádí frázi „2019 brazil traveler to usa need a visa“. Důležitá je zde právě anglická předložka „to" [„do“], kterou doposud Google nesprávně chápal tak, že občan USA se chystá do Brazílie. Nově tak ukáže správný výsledek s informacemi pro turisty cestující z Brazílie do USA.

obrazek_8.png

Algoritmus BERT

Zdroj obrázku: https://blog.google/products/search/search-language-understanding-bert

BERT je hodně podobný RankBrainu v tom, že se zaměřuje na lepší pochopení vyhledávacích dotazů a obsahu na stránce. Nenahrazuje však RankBrain ani jiné algoritmy, nýbrž s nimi spolupracuje. Jedno je jisté, algoritmus BERT určitě nebude zvýhodňovat nekvalitní webový obsah.

Mylné představy o algoritmu BERT

1. Je třeba optimalizovat  web na longtailové dotazy.

Není to tak, že váš web musí být uzpůsoben („přívětivý“) pro longtailové výrazy. U algoritmu BERT jde o to, aby Google porozuměl tomu, co uživatel svým dotazem míní, a teprve pak může tento význam spojit s konkrétními informacemi na vašem webu.

2. Účinek algoritmu BERT je zanedbatelný

Někteří jsou přesvědčeni, že tento algoritmus bude mít minimální dopad. Společnost Google však uvádí, že tato aktualizace ovlivňuje jeden z deseti vyhledávacích dotazů v angličtině ve Spojených státech amerických. A deset procent přece není tak malé množství.

3. BERT přisuzuje důležitost  tzv. „stop-words“

Když Google používá jako příklad vyhledávací dotazy, jejichž správné porozumění ovlivňují předložky, začali si někteří myslet, že „stop-words“ nabývají na důležitosti. „Stop-words“ jsou slova, která nemají význam sama o sobě, jako například předložky či spojky. 

4. BERT je největší aktualizace všech dob

 Toto prohlášení je založeno na nesprávném výkladu tiskové zprávy, kterou vydala společnost Google. Algoritmus BERT patří totiž mezi největší aktualizace za posledních 5 let.

Použité zdroje:

Pandu Nayak, „Understanding searches better than ever before

Barry Schwartz, „Welcome BERT: Google’s latest search algorithm to better understand natural language

Roger Montti, „Google BERT Misinformation Challenged

Vylepšete SEO

napište nám

Přidat komentář