Reklama

AI má lepšie morálne úsudky ako vysokoškolskí študenti, ukázal veľký test

Zdroj | unsplash/Ave Calvar
Stanislav Vinc
Zdroj | unsplash/Ave Calvar
Zdroj | unsplash/Ave Calvar

Výskumné tímy amerických a švajčiarskych psychológov a neurovedcov podrobne skúmali rozdiely v odpovediach na morálne otázky od ľudí a umelej inteligencie. Účastníci mali najprv za úlohu vybrať, ktorá odpoveď bola lepšia a následne rozpoznať, ktorú odpoveď napísala AI.

Podobne ako pri ostatných testoch hodnotenia „ľudskosti“ umelej inteligencie, aj v tomto prípade veľký jazykový model prekvapil.

V prvej časti štúdie mala reprezentatívna vzorka 299 dospelých obyvateľov Spojených štátov ohodnotiť kvalitu odpovedí na morálne hypotetické scenáre bez toho, aby vedeli, kto je autorom týchto odpovedí. Scenáre začínali tými najjednoduchšími od „Muž, naštvaný, že jeho objednávka pizze dorazila neskoro, udrel kuriéra do nosa“, až po dilemu, či je skutočne nevhodné, aby muž prišiel do kancelárie oblečený v sukni.

Obsah pokračuje pod reklamou

Reprezentatívnej vzorke boli následne poskytnuté odpovede na 10 takýchto morálnych otázok, na ktoré sa mala umelá inteligencia vyjadriť zhruba 600 slovami. Ľudskú odpoveď písali študenti vysokej školy prvého a druhého ročníka. Účastníci výskumu mali v prvej časti výskumu zvoliť, ktorá z týchto odpovedí bola podľa nich dôveryhodnejšia, férovejšia, súcitnejšia, emočnejšia alebo racionálnejšia.

Pri hodnotení v prvej časti výskumu respondenti ešte nevedeli, že časť odpovedí pochádza od umelej inteligencie. V priemere tak boli v tomto slepom teste odpovede od veľkého jazykového modelu (pravdepodobne ChatGPT) hodnotené lepšie, konkrétne boli cnostnejšie, inteligentnejšie, spravodlivejšie, dôveryhodnejšie, racionálnejšie a celkovo AI pôsobila ako „lepší človek“. V oblasti emócií, súcitu a zaujatosti nemala navrch ani jedna strana.

Pozrite si

CATL zrecykluje pre Volvo vyradené batérie, no nebude to „perpetuum mobile“

To, že jedna časť odpovedí bola vytvorená umelou inteligenciou, sa respondenti dozvedeli až v druhej časti testu, v ktorej bolo ich úlohou takéto odpovede rozpoznať. Tu ich úspešnosť dosahovala 58 až 82 percent, v závislosti na konkrétny scenár. Podľa výskumného tímu respondenti zrejme odpovede rozpoznali vďaka špecifickej štruktúre viet, dĺžke odpovedí a podobnosti medzi nimi.

Táto upravená verzia morálneho Turingovho testu by mala ukázať, či je stroj schopný vykonávať rovnako kvalitné alebo ešte lepšie morálne úsudky ako človek. Na základe výsledkov tejto štúdie je možné veľmi ľahko skĺznuť k záveru, že by sa ľudia mali hanbiť, ak ich v morálke dokáže prekonať aj obyčajný četbot.

Respondenti však mohli byť iba náchylní vyberať za lepšie odpovede od umelej inteligencie z dôvodu jej lepšej schopnosti pracovať so slovami, celkovej dĺžke odpovedí, vďaka ktorým pôsobili tieto odpovede všeobecne kvalitnejšie. Umelá inteligencia však na rozdiel od človeka zatiaľ žiadnym z týchto morálnych úvah nerozumie.

Na základe obrovských databáz textov a tréningu umelá inteligencia iba dokáže správne poskladať tak, aby poskytovala uspokojivé odpovede, ktoré vyzerajú v očiach ľudí „dobre“. Stačí však trocha šikovnosti a menšia slabina v ochrane četbota voči manipulácii používateľom a rovnaký jazykový model dokáže zrazu generovať rovnako presvedčivé odpovede aj s opačným, negatívnym morálnym úsudkom.

Podľa výskumného tímu je tak dôležité, aby boli prípadné morálne úsudky umelej inteligencie nasadzované kdekoľvek v praxi, riadne označované s upozornením, že AI v skutočnosti morálke (v aktuálnej forme) nerozumie.

Nová štúdia americko-švajčiarskych vedcov každopádne potvrdila to, o čom sme sa mali možnosť presvedčiť už v mnohých iných podobných štúdiách a teda, že súčasní četboti už dokážu generovať kvalitnejšie texty, ako mnohí študenti. Pozornosti kohokoľvek, kto už si ale četbota sám vyskúšal, typický spôsob vyjadrovania AI neujde a takúto odpoveď dokáže hneď na prvý pohľad rozpoznať.

Zdroj
Ďalšia story
Zatvoriť

Newsletter

Ďakujeme za váš záujem! Odteraz vám už neunikne žiadna novinka.
Ľutujeme, ale váš formulár sa nepodarilo odoslať.