Vo vývoji umelej inteligencie sme za posledné roky mali možnosť vidieť pokroky. Od úplných základov sa viaceré algoritmy postupne dostali až k tvorbe neuveriteľne realistických fotografií, v čom je aktuálnym pionierom projekt DALL-E 2. Kým na tvorbu takýchto obrázkov by človek potreboval mať značný talent a zručnosti s maľovaním či prácou v Photoshope, iné výzvy, ktoré môžu dať umelej inteligencii zabrať, zvládne aj malé dieťa.
Skladanie stavebnice LEGO nie je niečo, čo by ste možno na prvé počutie mohli považovať za náročnú úlohu pre umelú inteligenciu. Reč je však konkrétne o skladaní konkrétnych stavebníc podľa oficiálnych návodov, ktoré nie sú stvorené pre stroje, ale ľudí. Stroje sa riadia úplne inými postupmi a tak im dokonalý návod zrozumiteľný aj pre malé dieťa na prvý pohľad nič nepovie.
Problémom pre stroje pri návodoch stavebníc LEGO je, že pracujú s 3D objektmi v 2D priestore a to navyše bez jednoznačne stanovených krokov. Aby totiž bolo skladanie tejto stavebnice o niečo zábavnejšie, LEGO vás nechá, aby ste si viaceré medzikroky domysleli a na konci tak mali zo seba ešte lepší pocit. Pre stroje však ide prakticky o nočnú moru. Výskumníkom zo Stanfordovej Univerzity sa to však podarilo prelomiť.
Výsledkom ich výskumu je model MEPNet (Manual-to-Executable-Plan Network), ktorý dokáže prepojiť 2D obrázky s 3D objektom a vytvoriť si následný postup projektu aj s využitím precíznej predikcie pri práci s dovtedy neznámymi 3D objektami, ktoré treba vzájomne poprepájať. MPNet sa napokon podarilo prekonať všetky existujúce skladacie algoritmy, čo si výskumný tím overil pri troch nových dátových balíkoch LEGO manuálov, ale aj skladaní domov vo videohre Minecraft podľa návodov.
Vedci plánujú algoritmus otestovať aj v reálnom prostredí s využitím robotiky. Vytvorenie stroja na skladanie LEGO stavebníc však nie je ich cieľom. Napokon, pre väčšinu ľudí je najväčšou zábavou pri tomto hobby práve samotné skladanie a prenechať to strojom asi nie je v takmer nikoho záujme.
Model MEPNet by však mohol umožniť strojom a asistentom porozumieť všetkým typom 2D nákresov, či už ide o návody na opravu áut, spotrebičov či elektroniky, alebo aj zložitých nákresov z vedeckých kníh a štúdií. Prínos takýchto algoritmov si dnes zrejme nevieme poriadne ani len predstaviť.