Reklama

Facebook využíva na trénovanie svojej umelej inteligencie aj vaše dáta

Zdroj | Anthony Quintano
Stanislav Vinc
Zdroj | Anthony Quintano
Zdroj | Anthony Quintano

Mark Zuckerberg poodhalil ďalšie plány jeho spoločnosti Meta Platforms v oblasti vývoja umelej inteligencie. Pri práci na novej generatívnej umelej inteligencii plánuje Meta využiť verejne dostupné dáta, ktoré jej poskytli miliardy používateľov jej sociálnych sietí.

Pokiaľ sa Zuckerbergovi podarí tieto dáta zúžitkovať naplno, prekonať kvalitou svojej umelej inteligencie môže teoreticky prekonať aj službu ChatGPT, s ktorou svoj projekt nepriamo porovnáva.

Ďalšou kľúčovou časťou našej príručky je učenie sa z jedinečných údajov a slučiek spätnej väzby v našich produktoch… Na Facebooku a Instagrame sú stovky miliárd verejne zdieľaných obrázkov a desiatky miliárd verejných videí, čo je podľa našich odhadov viac ako obsahuje dataset Common Crawl a ľudia v našich službách tiež zdieľajú aj veľké množstvo verejných textových príspevkov v komentároch.„, uviedol Mark Zuckerberg ako pozvánku na blížiace sa predstavenie Mety súvisiace s AI.

Obsah pokračuje pod reklamou

Dátový balík Common Crawl obsahuje dáta získané z 250 miliárd webových stránok získané v priebehu 17 rokov. Jedná sa o jeden z najväčších a najpopulárnejších dátových balíkov, ktoré na učenie svojej umelej inteligencie využila aj spoločnosť OpenAI. Dátový balík spoločnosti Meta však má byť nielen väčší, ale aj cennejší.

Pozrite si

Ktoré banky na Slovensku dostanú okamžité platby ešte tento rok?

Meta môže dáta pre tréning svojej umelej inteligencie čerpať zo svojich sociálnych sietí – Facebook k dnešnému dňu využíva viac ako 3 miliardy ľudí po celom svete, Instagram zhruba polovicu z toho. Veľká časť týchto dát pochádza z verejne prehliadateľných diskusií v komentárov pod príspevkami.

Tieto komentáre tak majú spoločný kontext a vzájomne na seba reagujú, čo je pri vývoji četbota kľúčové. Umelá inteligencia sa tak môže v interakcii učiť priamo od ľudí. Čerešničkou na torte toho je fakt, že Meta za tieto dáta nemusí nikomu platiť. Používatelia jej sociálnych sietí jej ich odovzdali dobrovoľne a zadarmo.

Tieto dátové balíky však majú aj veľkú slabinu, s ktorou sa musela potýkať už aj spoločnosť OpenAI pri využití balíka Common Crawl. Tento balík obsahoval veľké množstvo toxických dát, vrátane neznášanlivého a mládeži neprístupného obsahu, ktorý bolo potrebné odfiltrovať. Podľa výskumu Univerzity v Montreale obsahuje 4-6 % zo všetkých webových stránok v tomto balíku rasové urážky, neznášanlivé prejavy alebo rasovo ladené konšpiračné teórie.

Verejné diskusie na sociálnych sieťach nie sú o nič čistejšou vzorkou dát. Meta tak bude musieť tieto dáta očistiť, čo môže byť dôvod, prečo Mark Zuckerberg hovorí o využití týchto dát až teraz, aj napriek tomu, že na umelej inteligencii jeho spoločnosť údajne pracuje už viac ako jednu dekádu.

Zdroj
Ďalšia story
Zatvoriť

Newsletter

Ďakujeme za váš záujem! Odteraz vám už neunikne žiadna novinka.
Ľutujeme, ale váš formulár sa nepodarilo odoslať.