Система семантического слуха управляет шумоподавлением

Наушники с шумоподавлением – прекрасный инструмент для блокирования посторонних звуков – чужих голосов в оживлённом общественном месте, шум города и т. п. Однако вместе с тем они подавляют и те звуки, которые пользователь хотел бы слышать. Исследователи из Университета Вашингтона работают над системой семантического слуха, которая сумела бы идентифицировать параметры шума, блокировать посторонние и сохранять лишь нужные звуки.

Технология семантического слуха полагается на использование алгоритмов глубинного обучения, которые работают на основе обычного смартфона с беспроводным подключением к обычным шумоподавляющим наушникам. Микрофон телефона воспринимает весь окружающий шум и направляет их в специальное приложение, которое на уровне цифровых сигналов отфильтровывает звуки, которые пользователь хотел бы слышать, подавляя остальной шум. Учёные отмечают, что приложение может работать и наоборот, блокируя выбранные звуки от слуха человека, пропуская весь остальной окружающий шум. На данном этапе разработок система семантического слуха предлагает 20 «избранных» звуков, которые полагается пропускать или игнорировать, в зависимости от режима работы.

Система семантического слуха позволяет выбирать степень шумоподавления — University of Washington

По словам исследователей, пока что данная технология работает только в связке со смартфоном. Дело в том, что электронная «начинка» наушников не потянет такую задачу самостоятельно, а использование дистанционных облачных серверов не обеспечит нужную скорость передачи и обработки данных. Профессор Шьямнатх Голлакота, который является ведущим автором данного исследования, пояснил, что пока беспроводные наушники не имеют достаточной вычислительной мощности, чтобы выполнить алгоритм, способный, например, выделить голоса птиц из фонового шума. Учёный подчеркнул, что система семантического слуха должна действовать в режиме реального времени, чтобы звуки в наушниках отображались синхронно с визуальной информацией окружающего мира: например, голос собеседника желательно слышать сразу, а не с запозданием. Это значит, что алгоритмы должны обрабатывать звуки быстрее, чем за тысячную долю секунды.

В испытании технологии приняли участие 22 добровольца, которые тестировали систему в парках, на улицах и в офисах. По их мнению, система достаточно успешно сохраняла либо удаляла из окружения заданные звуки – пение птиц, сирены, будильник и т. п. Впрочем, она всё же нуждается в доработках: технология испытывает сложности с идентификацией похожих звуков, например, речи и пения человека. Исследователи планируют продолжить совершенствование системы, используя для тренировки модели больше «живых» аудиоданных из окружающего мира.

Поделиться в соцсетях