Мозговий імплант та ШІ перетворюють думки на мову

Команда дослідників з Каліфорнії створила інноваційну систему, що використовує мозговий імплант та алгоритми ШІ для відновлення природного мовлення в паралізованих людей – в реальному часі та їхнім власним голосом.

Новітня технологія є результатом співпраці дослідників з Університету Каліфорнії в Берклі та Університету Каліфорнії у Сан-франциско. Вчені створили компактний імплант, що вимірює електричну нейронну активність мозку людини, а також алгоритм ШІ, який вчиться будувати речення на основі цих даних голосом пацієнта. Це значний прогрес у порівнянні з попередніми нейрокомп’ютерними інтерфейсами синтезу мови. За словами доцента кафедри електротехніки та комп’ютерних наук в Берклі Гопали Ануманчіпаллі, його команда використовує потоковий підхід, що дозволяє нейропротезу декодувати мовлення з такою самою швидкістю, як це роблять голосові асистенти на кшталт Alexa або Siri. Завдяки схожому типу алгоритма дослідники навчилися швидко розшифровувати дані нейронної активності мозку та практично синхронно синтезувати голосове мовлення на їхній основі.

Цікаво, що ця технологія є сумісною з широким спектром нейрокомп’ютерних інтерфейсів від щільних масивів електродів, що фіксують нейронну активність прямо з поверхні мозку чи глибинних мікроелектродів, які проникають всередину органу, до неінвазивних систем електроенцефалографії або навіть поверхневої електроміографії, що зчитує м’язову активність обличчя. У своєму дослідженні каліфорнійські вчені використовували перший тип інтерфейсу. Нейропротез розміщали так, аби він міг отримувати дані моторної кори, яка відповідає за контроль моторного компоненту мовлення. Потім отримані дані ШІ перетворює на зв’язне мовлення. За словами співавтора дослідження Чеоля Джуна Чо, об’єктом опрацювання алгоритму є те, що відбувається вже після сформованої думки, коли людина вирішила, що хоче сказати, які слова використати та як залучити м’язи голосового тракту.

A streaming brain-to-voice neuroprosthesis to restore naturalistic communication / Kaylo T. Littlejohn et al.

Для тренування ШІ дослідники використовували дані мозкової функції пацієнтів, які намагалися подумки проговорити слова, які з’являлися на екрані перед ними. Завдяки цьому вчені отримали якісну мапу нейронної активності моторної кори, пов’язаної з мовленням. Другим ШІ-елементом виступила модель синтезу мовлення, створена на базі записів голосу пацієнтів, зроблених до втрати ними здібності говорити через хворобу або травму. Вона відповідає за генерування аудіо, що озвучує думки людини. Головна особливість цієї системи полягає у тому, що імплант проводить сканування активності мозку що 80 мс – значно частіше, ніж в попередніх проєктах тієї ж команди вчених (у 2023 році їхня система оновлювала дані кожні 8 секунд). Це дозволило значно скоротити затримки у передачі думок пацієнтів.

Автори дослідження опублікували відео з однією з пацієнток – 47-річною жінкою, що втратила здатність розмовляти у віці 30 років через бічний аміотрофічний склероз. Синтезоване на основі її мозкової активності мовлення не є бездоганним та цілком природним, але значно ближчим до ідеалу за інші аналогічні системи. Надалі вчені намагатимуться зробити процес синтезу ще швидшим та додати голосу пацієнта більше експресивності – інтонацій, емоцій тощо. В майбутньому подібні технології могли б значно покращити якість життя та соціалізацію людей, що страждають від параліча, спричиненого БАС та іншими прогресуючими нейродегенеративними захворюваннями або травмами.

Поділитися в соцмережах