- #Umelá inteligencia
- 5 min.
- 6.12.2023
Google predstavil Gemini, univerzálny AI model a hlavného konkurenta pre GPT-4
Odpoveď na ChatGPT zo strany spoločnosti Google prišla už v úvode tohto roka, no výsledná služba Bard sa len s prižmúrenými očami doťahovala na to, čo so svojim četbotom predvádzala konkurenčná spoločnosť OpenAI. Hoci Google svojho Barda priebežne vylepšoval, do skutočne novej éry vstupuje až teraz.
Bard sa dočkal aktualizácie na úplne nový multimodálny jazykový model zvaný Gemini. Dostupný je v troch úrovniach a na rozdiel od ChatGPT, si bez vetvenia a prepájania prvkov modelu natívne rozumie s textom, nahrávkami a fotografiami. V najmenšej forme je dostupný aj v zariadeniach Pixel.
Bard pôsobil už od začiatku ako unáhlený produkt, ktorý potreboval Google dostať von čím skôr ako dôkaz, že nespí na vavrínoch a v boji s Microsoftom a OpenAI má aj svoje zbrane. Príchod nového modelu Gemini to nepriamo potvrdzuje, no aj Bard je vďaka nemu výrazne šikovnejší.
Gemini má byť doposiaľ najflexibilnejším jazykovým modelom, dostupný je totiž v troch verziách, ktoré dokážu fungovať na každom hardvéri od smartfónov až po dátové centrá. V tom najmenšom merítku sa tak vlastne už aj stalo, Google nasadil model Gemini Nano určený na jednoduchšie úkony priamo do svojich smartfónov s najväčšou nádielkou funkcií určenou pre Pixel 8 Pro.
Stredný model Gemini Pro je ten, ktorý dostal aktuálne do výbavy Bard. Určený je všeobecne na všetky úkony, či už potrebujete generovať či analyzovať texty, programovať, pracovať s obrázkami alebo zvukovými nahrávkami. Najväčší model Gemini Ultra je určený na tie najkomplexnejšie úlohy, ktorý so skóre 90 % ako vôbec prvý model prekonal ľudských expertov v teste MMLU, ktorý využíva kombináciu 57 predmetov, vrátane matematiky, fyziky, histórie, práva, medicíny či schopnosti riešiť komplexné problémy. Gemini Ultra bude sprístupnený v priebehu budúceho roka.
„Každý technologický posun je príležitosťou pokročiť vo vedeckých objavoch, urýchliť ľudský pokrok a zlepšiť naše životy. Domnievam sa, že prechod, ktorý práve vidíme v súvislosti s AI, bude najhlbší v našich životoch, oveľa väčší ako prechod na mobilné zariadenia alebo web predtým. Umelá inteligencia má potenciál vytvárať príležitosti – od každodenných po výnimočné – pre ľudí kdekoľvek. Prinesie nové vlny inovácií a ekonomického pokroku a podnieti vedomosti, vzdelávanie, kreativitu a produktivitu v takom rozsahu, aký sme doteraz nevideli.„, uviedol Sundar Pichai, CEO Google.
Google postavil Gemini aj do priameho porovnania s modelom GPT-4. Generálny riaditeľ divízie Google DeepMind, Demis Hassabis pre portál The Verge uviedol, že Gemini výrazne prekonal GPT-4 v 30 z celkovo 32 testov, ktoré zahŕňali aj texty MMLU či programovanie v jazyku Python.
Schopnosti Gemini predviedol Google v sérii videí, v ktorých postupne analyzuje vedecké štúdie, pomáha s kontrolou ručne písaných príkladov z matematiky a napokon priamo programuje. Práve v programovaní sa zdá byť Gemini najsilnejší. Prostredníctvom nového systému AlphaCode2 dokáže Gemini v programovacej súťaži údajne prekonať až 85 % ľudských programátorov, zatiaľ čo v prípade predchádzajúceho modelu AlphaCode to bolo len približne 50 %.
Multimodálnosť Gemini umožňuje Google implementovať ho postupne do všetkých svojich služieb. Sundar uviedol, že integrovaný eventuálne bude do samotného vyhľadávania Google, ako aj do jeho reklamných platforiem či internetového prehliadača Chrome. Podobnú stratégiu zvolil Microsoft v spolupráci s OpenAI, ktorý v súčasnosti implementuje AI nástroj Copilot do svojich programov, platforiem a operačného systému Windows 11.
Miesto, kde sa väčšina ľudí s Gemini zrejme po prvý krát stretne, je už zmieňovaný četbot Bard. V rámci neho je Gemini dostupný iba v anglickom jazyku, no Google sľubuje rozšírenie jeho jazykových schopností už v dohľadnej dobe. Budúci rok má byť táto služba navyše rozšírená o novú verziu Bard Advanced, ktorú bude na pozadí poháňať najväčší model Gemini Ultra. Vďaka multimodálnosti bude tomuto rozšírenému četbotovi podobne ako konkurencii možné zasielať už aj obrázky, zvukové nahrávky a videá na ďalšiu analýzu.