Vedci v Číne vyvinuli tenzorovú procesorovú jednotku (tensor processing unit, TPU), ktorá používa tranzistory na báze uhlíka namiesto kremíka a má byť mimoriadne energeticky účinná.
Modely AI sú extrémne náročné na dáta a na fungovanie vyžadujú obrovské množstvo výpočtového výkonu. To predstavuje významný problém pri trénovaní a rozširovaní modelov strojového učenia, zvlášť keď dopyt po aplikáciách AI prudko rastie. To je dôvod, prečo vedci pracujú na výrobe nových komponentov – od procesorov po výpočtovú pamäť, navrhnutých tak, aby spotrebovali rádovo menej energie pri vykonávaní potrebných výpočtov.
Vedci spoločnosti Google vytvorili na riešenie tejto výzvy v roku 2015 svoj TPU. Tieto špecializované čipy fungujú ako vyhradené hardvérové akcelerátory pre tenzorové operácie – zložité matematické výpočty používané na trénovanie a spúšťanie modelov AI. Odklonením týchto úloh z centrálnej procesorovej jednotky (CPU) a grafickej procesorovej jednotky (GPU) umožňujú TPU rýchlejšie a efektívnejšie trénovať modely AI.
Na rozdiel od konvenčných TPU je nový čínsky čip prvým, ktorý namiesto tradičných polovodičových materiálov, ako je kremík, používa uhlíkové nanorúrky – drobné, valcové štruktúry vyrobené z atómov uhlíka usporiadaných do šesťuholníkového vzoru. Táto štruktúra umožňuje, aby cez ne prúdili elektróny s minimálnym odporom, vďaka čomu sú uhlíkové nanorúrky vynikajúcimi vodičmi elektriny. Vedci svoj výskum zverejnili v časopise Nature Electronics.
CEO Google Sundar Pichai na konferencii I/O 2017 predstavuje TPU procesor
Vedci z Pekingskej univerzity, ktorí nový čip vytvorili, tvrdia, že takýto TPU by mohol otvoriť dvere energeticky efektívnejšej umelej inteligencii.
Zhiyong Zhang, spoluautor článku a profesor elektroniky na Pekingskej univerzite v Pekingu, povedal, že umelá inteligencia ohlasuje novú revolúciu, ale tradičná polovodičová technológia na báze kremíka dokáže čoraz ťažšie uspokojiť potreby spracovania obrovského množstva údajov. „Našli sme riešenie tvárou v tvár tejto globálnej výzve“, uviedol Zhiyong Zhang.
Podľa výskumníkov „uhlíkový“ TPU spotrebuje iba 295 mikrowattov (μW) energie a dokáže poskytnúť 1 bilión operácií na watt. Nový TPU sa skladá z 3 000 uhlíkových nanorúrkových tranzistorov a je postavený na architektúre systolického poľa – siete procesorov usporiadaných do mriežkového vzoru. Systolické polia prenášajú dáta cez každý procesor v synchronizovanej postupnosti krok za krokom, podobne ako položky pohybujúce sa na dopravnom páse. To umožňuje TPU vykonávať viacero výpočtov súčasne tým, že koordinuje tok dát a zabezpečuje, aby každý procesor pracoval na dielčej časti úlohy v rovnakom čase.
Toto paralelné spracovanie umožňuje vykonávať výpočty oveľa rýchlejšie, čo je kľúčové pre modely AI spracúvajúce veľké množstvo údajov. Tiež znižuje počet zápisov a čítaní statickej pamäti s náhodným prístupom (SRAM). Minimalizácia týchto operácií umožňuje zrýchliť výpočty a zároveň znížiť spotrebu energie TPU. Na otestovanie svojho nového čipu vedci vytvorili päťvrstvovú konvolučnú neurónovú sieť a použili ju na úlohy rozpoznávania obrázkov MNIST. Neurónová sieť s novým TPU dosiahla až 88-percentnú presnosť pri rozpoznávaní obrázkov, pričom spotrebuje len 295 µW energie. Prispieva k tomu optimalizovaný proces výroby uhlíkových nanorúrok s čistotou 99,9999 %.
Spotreba energie pri superpočítačoch na vývoj AI sa stáva vcelku dramatickým prvkom, takže zvyšovanie energetickej efektivity procesorov je kľúčové. Cortex, obrovský superpočítačový klaster Tesly, si vyžiadal rozšírenie hlavnej budovy Giga Texas. Elon Musk uviedol, že Cortex tento rok bude vyžadovať chladenie s výkonom asi 130 MW a neskôr, keď sa v nasledujúcich 18 mesiacoch rozšíri, stúpne potreba chladiaceho výkonu na 500 MW.
V budúcnosti by technológia založená na uhlíkových nanorúrkách mohla poskytnúť energeticky efektívnejšiu alternatívu k čipom na báze kremíka, uviedli čínski vedci. Paradoxne však pritom skúmajú, ako by sa uhlíkový TPU dal integrovať do kremíkových CPU. Vedci plánujú pokračovať v zdokonaľovaní čipu, aby sa zlepšil jeho výkon a aby bol škálovateľnejší.