Google научил нейросеть разделять голоса на отдельные аудиозаписи

Нейросеть google

Группа разработчиков из Google, занимающаяся машинным обучением, создала нейросеть, которая умеет разделять отдельные голоса в условиях шума. Получившийся ИИ распознает говорящих людей, анализируя их лица во время речи, после чего формирует для каждого свою звуковую дорожку. По итогам нейросеть выдает видео, где отдельные голоса выходят на передний план, а все остальные подавляются.

Результат, без сомнений, длительных работ впечатляет: ИИ не сбивается, если два собеседника пытаются перекричать друг друга, или когда говорящий периодически закрывает лицо. На выходе вы все равно получаете записи каждого голоса. Эта функция сейчас ищет применение в продуктах компании Google, вроде Hangouts и Duo, что поможет пользователям общаться на улице в толпе.

Думаем, в будущем эта полезная опция станет очень востребованной. А пока посмотрите сами, как работает нейросеть:

https://youtu.be/NzZDnRni-8A

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *