Искусственный интеллект Google научился распознавать голоса в толпе

Фото: ShutterStock

Искусственные интеллекты разных разработчиков умеют делать так много разных вещей, что сюжет Терминатора больше не кажется фантастикой. Более того, как ребенок, каждый день ИИ обучается чему-то новому. Например, не так давно разработчики компании Google научили свой искусственный интеллект различать отдельные голоса в толпе людей.

Сначала инженеры научили ИИ выявлять голоса людей с помощью «эффекта вечеринки». То же самое делаем мы, находясь в большой толпе. Для того, чтобы понять, о чем говорит собеседник в шумном помещении, мы анализируем его мимику и жесты, вслушиваемся в звуки и пытаемся читать по губам. Искусственный разум работает по похожему принципу – анализирует мимику и посторонние шумы, выделяет голоса разных людей и создает звуковые дорожки для каждого отдельного человека. После этого ИИ научился выделять и распознавать лица, изолировать их голоса, подавляя при этом посторонние шумы.

Новое умение искусственного интеллекта уникально. Он может выделить из толпы конкретного человека и распознать его голос в режиме онлайн. Для достижения такого эффекта инженеры заставили ИИ просмотреть около 100 тысяч видео и разговорных локаций в YouTube с фоновым шумом. Новую разработку Google предлагает использовать для улучшения групповых видеочатов, чтобы пользователь мог выделить из шума голосов одного собеседника.


27.08.20240

Информационные технологии превращают посещение музея в увлекательное путешествие: делают осмотр экспозиций более интересным и запоминающимся, помогают вызвать у посетителей нужные...

close
Наши информационные каналы
close
Зарегистрировавшись, вы соглашаетесь с нашими Условиями использования и соглашаетесь с тем, что информационно-аналитический портал 1RRE может иногда связываться с вами о событиях, анализах, новостях, предложениях и т. д. по электронной почте. Рассылки и письма от 1RRE можно найти по маркетингу партнеров.