Výskumný tím z Kalifornskej univerzity v Davise dosiahol významný pokrok v oblasti neurotechnológií. Vyvinul mozgový implantát, ktorý dokáže premeniť mozgovú aktivitu priamo na hovorenú reč a to dokonca priamo v reálnom čase.
Ide o jeden z prvých krokov k plne digitálnemu hlasovému traktu, ktorý by mohol výrazne zmeniť spôsob, akým ľudia s ochrnutím komunikujú so svetom.
Používatelia doterajších syntetizátorov reči sa doposiaľ spoliehali najmä na zariadenia, ktoré umožňovali komunikáciu pomocou mikropohybov svalov. Stephen Hawking napríklad používal senzor v okuliaroch, ktorým ovládal kurzor na obrazovke, pričom slová vytváral tempom približne jedno slovo za minútu a až následne ich previedol na syntetizovaný hlas. Nové technológie však dnes umožňujú čítať signály priamo z mozgu.
Zariadenia BCI (brain-computer interface), ktoré dokážu interpretovať mozgovú aktivitu, nie sú úplnou novinkou, no tie doterajšie často fungovali len s veľmi obmedzenou slovnou zásobou a vysokou časovou odozvou, nehovoriac o tom, že nevedeli zachytiť jemnosti reči, ako sú intonácia, výška tónu alebo melódia. Vedúca výskumného tímu Kalifornskej univerzity v Davise, Maitreyee Wairagkar, sa preto rozhodla zmeniť prístup. Namiesto prekladu na slová sa jej tím sústredil na produkciu zvuku, teda priamo na fonémy a hlas.
Implantát testoval pacient označený ako T15, 46-ročný muž s ochorením ALS, ktorého prirodzená reč bola takmer nezrozumiteľná. Mal implantovaných 256 mikroelektród v oblasti mozgu, ktorá riadi svaly hlasového traktu. Tie zachytávali mozgovú aktivitu na úrovni jednotlivých neurónov, ktorú následne spracovával algoritmus umelej inteligencie. Táto AI dekódovala signály do parametrov reči ako výška tónu alebo hlasovosť, ktoré sa potom previedli na zvuk pomocou syntetizátora prispôsobeného na pacientov pôvodný hlas. Celý proces prebiehal s oneskorením približne 10 milisekúnd, teda prakticky okamžite.
Na rozdiel od starších systémov tu neexistovalo obmedzenie na určitý počet slov. Pacient mohol povedať čokoľvek, vrátane výrazov, ktoré neexistujú v slovníku, či bežných medzihrí ako „hmm“ alebo „ehm“. Systém zachytával aj intonačné rozdiely, čo umožnilo pacientovi klásť otázky alebo dokonca spievať krátke melódie.
Výsledky testov ukázali značné zlepšenie oproti jeho prirodzenej reči. V jednoduchšom teste, kde poslucháči vyberali správnu vetu z ponúkaných možností, bola zrozumiteľnosť výstupu zo systému 100 %. V náročnejšom teste s otvorenou transkripciou, kde účastníci nepoznali možnosti vopred, bola chybovosť na úrovni 43,75 %.
„Ešte nie sme v bode, kde by sa to dalo použiť v otvorenej konverzácii. Vnímam to ako dôkaz, že koncept funguje,“ uviedol spoluautor výskumu Sergey Stavisky. Jeho návrhom na vylepšenie systému do budúcnosti, je použitie väčšieho počtu elektród. „V súčasnosti je veľa startupov, ktoré vyvíjajú BCI zariadenia s viac ako tisíckou elektród. Keď si vezmete, čo sme dosiahli so 250 elektródami, a porovnáte to s tým, čo by sa dalo dosiahnuť s tisíckou alebo dvoma tisíckami, myslím, že by to jednoducho fungovalo,“ tvrdí, pričom práce na tom už prebiehajú.
Paradromics, startup zameraný na BCI so sídlom v Austine v Texase, sa chce pustiť do klinických testov rečovej neuroprotézy a už žiada o schválenie od FDA. „Majú systém so 1 600 elektródami a verejne oznámili, že sa budú venovať reči,“ hovorí Stavisky. „David Brandman, náš spoluautor, bude hlavným výskumníkom týchto testov a budeme to robiť tu na UC Davis.“