Image by Freepik

AI, преобразующий мысли в речь, переводит мозговые волны в речь

Время для прочтения: 3 мин.

Последние обновления: Apr 4, 2025

Автор Киара Фаббри Мультимедийный журналист
Перевод выполнен Команда локализации и перевода Услуги локализации и перевода

Ученые совершили значительный прорыв в восстановлении естественной речи у людей с параличом, используя искусственный интеллект для преобразования мозговых волн в произнесенные слова в реальном времени с помощью мозговых имплантатов.

Спешите? Вот основные факты:

Система расшифровывает мозговые волны и преобразует их в почти мгновенную, естественно звучащую речь.
Система использует голос пациента до травмы для создания персонализированного синтеза речи, что позволяет общаться аутентично.
Модель ИИ декодирует речевые сигналы за 80 миллисекунд, значительно сокращая предыдущие задержки.

Ученые из Радбаудского университета вместе с UMC Утрехт разработали технологию мозговых имплантатов с ИИ, которая переводит нейронные сигналы в произносимые слова с точностью от 92 до 100%, как сообщает Neuroscience News. Исследование, опубликованное на этой неделе в Nature Neuroscience, нацелено на разработку инструментов коммуникации для парализованных людей.

Исследование использовало пациентов с эпилепсией, у которых на короткое время были внедрены имплантаты в мозг, чтобы создать ассоциации между нейронными сигналами и вербальными выражениями. Эта разработка уменьшает предыдущую задержку, которая затрудняла общение для людей с нарушениями речи.

«Наш подход стриминга приносит ту же быструю способность декодирования речи, что и устройства, такие как Alexa и Siri, в нейропротезы», — объяснил Гопала Ануманчипалли, со-руководитель исследования, как сообщает New Atlas. “Используя похожий тип алгоритма, мы обнаружили, что можем декодировать нейронные данные и, впервые, обеспечить практически синхронный стриминг голоса”, — добавил он.

Система работает за счет захвата активности мозга через электроды высокой плотности, размещенные на поверхности мозга. Затем ИИ расшифровывает эти сигналы, воссоздавая слова и предложения с удивительной точностью.

Кроме того, модель текста в речь, обученная на голосе пациента до травмы, гарантирует, что сгенерированная речь звучит естественно и тесно напоминает их оригинальный голос.

Один из авторов исследования, Чеол Джун Чо, объяснил, как система преобразует мысли в речь: «Мы декодируем после того, как мысль уже сформирована, после того, как мы решили, что сказать, после выбора слов и решения о движении мышц голосового тракта», — как сообщает New Atlas.

Этот прорыв значительно улучшает прежние технологии. Кроме того, эту систему на базе искусственного интеллекта теперь можно использовать для инициации речи в течение одной секунды, что позволяет вести непрерывные беседы. Эта технология может изменить жизнь людей с тяжелыми параличами, заболеваниями, при которых человек заключен в своем теле, или такими состояниями, как ЛСД, позволяя им общаться естественным образом.

Тем не менее, несмотря на эти достижения, технология все еще сталкивается с проблемами. Как объясняется в Neuroscience News, этот ИИ требует обширного обучения на нейронных данных человека, и он может не работать эффективно для тех, у кого нет предыдущих записей речи.

Хоть система и может декодировать слова, добиться полностью естественного темпа и выражения остается сложной задачей. К тому же, текущие модели испытывают трудности в прогнозировании полных предложений и абзацев, сосредотачиваясь в основном на отдельных словах.

Кроме того, менее инвазивные версии, использующие шлемы для ЭЭГ, имеют меньшую точность, около 60%, по сравнению с имплантированными электродами, как отмечено в New Scientist.

Впереди, исследователи планируют улучшить скорость речи системы и выразительность, делая разговоры еще более реалистичными.

AI, преобразующий мысли в речь, переводит мозговые волны в речь

Мы рады, что вам понравилась наша статья!

Оставьте комментарий