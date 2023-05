Umělá inteligence umožňuje neinvazivní čtení myšlenek - převádí na text

2. 5. 2023

čas čtení 5 minut



Pokrok zvyšuje vyhlídky na nové způsoby obnovy řeči u osob, které mají problémy s komunikací v důsledku mrtvice nebo onemocnění motorického neuronu



Byl vyvinut dekodér založený na umělé inteligenci, který dokáže převádět mozkovou aktivitu na souvislý proud textu. Je to průlomový objev, který poprvé umožňuje neinvazivní čtení myšlenek člověka.



Dekodér dokázal rekonstruovat řeč s neuvěřitelnou přesností, zatímco lidé poslouchali příběh - nebo si ho tiše představovali - pouze pomocí dat ze snímků fMRI. Předchozí systémy dekódování řeči vyžadovaly chirurgické implantáty. Nejnovější pokrok zvyšuje vyhlídky na nové způsoby obnovy řeči u pacientů, kteří mají problémy s komunikací v důsledku mrtvice nebo onemocnění motorického neuronu.



Tento úspěch překonává základní omezení fMRI, které spočívá v tom, že tato technika sice dokáže mapovat mozkovou aktivitu na konkrétní místo s neuvěřitelně vysokým rozlišením, ale je jí vlastní časová prodleva, která znemožňuje sledování aktivity v reálném čase.



Zpoždění existuje proto, že skeny fMRI měří odezvu krevního toku na mozkovou aktivitu, která dosahuje vrcholu a vrací se do výchozího stavu během přibližně 10 sekund, což znamená, že ani ten nejvýkonnější skener nemůže tuto hodnotu zlepšit. "Je to hlučný, pomalý zástupce nervové aktivity," řekl Huth.



Tento tvrdý limit ztěžuje schopnost interpretovat mozkovou aktivitu v reakci na přirozenou řeč, protože poskytuje "změť informací" rozloženou do několika sekund.



Nástup rozsáhlých jazykových modelů - takových, na kterých je založena umělá inteligence ChatGPT společnosti OpenAI - však poskytl novou cestu. Tyto modely jsou schopny číselně reprezentovat sémantický význam řeči, což vědcům umožnilo sledovat, které vzorce neuronální aktivity odpovídají řetězcům slov s určitým významem, místo aby se pokoušeli číst aktivitu slovo po slově.



Proces učení byl intenzivní: tři dobrovolníci museli ležet ve skeneru po dobu 16 hodin a poslouchat podcasty. Dekodér byl vycvičen k přiřazování mozkové aktivity k významu pomocí velkého jazykového modelu GPT-1, předchůdce modelu ChatGPT.



Později byli stejní účastníci skenováni při poslechu nového příběhu nebo při představě, že vyprávějí příběh, a dekodér byl použit k vygenerování textu pouze z mozkové aktivity. Přibližně v polovině případů se text přesně - a někdy i velmi přesně - shodoval se zamýšleným významem původních slov.



"Náš systém pracuje na úrovni myšlenek, sémantiky, významu," řekl Huth. "To je důvod, proč to, co z něj dostaneme, nejsou přesná slova, ale podstata."



Například když účastníkovi přehrál slova "Ještě nemám řidičský průkaz", dekodér je přeložil jako "Ještě se ani nezačala učit řídit". V jiném případě se hrála slova "Nevěděla jsem, jestli mám křičet, brečet nebo utéct. Místo toho jsem řekla: "Nech mě být!"" byla dekódována jako "Začala křičet a plakat, a pak jen řekla: "Říkala jsem ti, abys mě nechal na pokoji".".



Účastníci byli také požádáni, aby se během pobytu ve skeneru podívali na čtyři krátká, němá videa, a dekodér byl schopen využít jejich mozkovou aktivitu k přesnému popisu části obsahu, uvádí se v článku v časopise Nature Neuroscience.



"Pro neinvazivní metodu je to skutečný skok kupředu ve srovnání s tím, co se dělalo dříve, obvykle jednotlivá slova nebo krátké věty," řekl Huth.



Někdy se dekodér dostal na špatný konec a měl problémy s některými aspekty jazyka, včetně zájmen. "Nevěděl, jestli jde o první nebo třetí osobu, o muže nebo ženu," řekl Huth. "Proč mu to nejde, nevíme."



Dekodér byl personalizovaný, a když byl model testován na jiné osobě, bylo čtení nesrozumitelné. Bylo také možné, aby účastníci, na nichž byl dekodér vycvičen, systém blokovali, například tím, že mysleli na zvířata nebo si v klidu představili jiný příběh.



"Bereme velmi vážně obavy, že by mohl být použit ke špatným účelům, a snažili jsme se tomu zabránit. Chceme se ujistit, že lidé používají tyto typy technologií jen tehdy, když chtějí, a že jim to pomáhá."





Prof. Tim Behrens, počítačový neurovědec z Oxfordské univerzity, který se na práci nepodílel, ji označil za "technicky nesmírně působivou" a uvedl, že otevírá řadu experimentálních možností, včetně čtení myšlenek ze snění nebo zkoumání toho, jak se nové nápady rodí z mozkové aktivity na pozadí. "Tyto generativní modely umožňují nahlédnout do mozku na nové úrovni," řekl. "Znamená to, že z fMRI můžete skutečně vyčíst něco hlubokého."







Podrobnosti v angličtině ZDE

