(495) 925-0049, ITShop интернет-магазин 229-0436, Учебный Центр 925-0049
  Главная страница Карта сайта Контакты
Поиск
Вход
Регистрация
Рассылки сайта
 
 
 
 
 

Искусственный интеллект научился грамотно распознавать речь среди шума

Источник: ai-news

Виртуальные ассистенты и системы распознавания голоса достаточно хорошо научились "узнавать" то, что им говорит человек, и выполнять его команды.

Но для корректной работы тех же Siri и Cortana посторонний шум может стать большой проблемой. Справиться с этой технической недоработкой могут помочь эксперты компании Mitsubishi Electric, которые представили новую технологию выделения речи одного человека из общего шума.

Технология японской компании получила название Deep Clustering, функционирование которой построено на принципах машинного изучения. Искусственный интеллект для начала научился самостоятельно выделять речь одного человека из общего потока различных звуков и шумов. Нейронная сеть разделяет входящие аудиоданные на различные элементы и анализирует каждый в отдельности, после чего уже может обрабатывать голос человека. Подобная работа наблюдается и при "присоединении" двух и более собеседников.

В ходе демонстрации технологии японской компании система смогла успешно разделить речь двух человек, говорящих в один микрофон одно и то же предложение на разных языках. Вся обработка производилась в режиме реального времени, а задержка не превышала трех секунд. Точность распознавания составила 90 процентов, а когда в микрофон начали говорить три человека, процент "попадания" упал до 80, что тоже является хорошим результатом. Как рассказывают авторы проекта Энтони Ветро и Йохеи Окато,

" В отличие от выделения речи из фоновых шумов, выделение речи одного человека из "голосового" шума говорящих одновременно людей является сложнейшей задачей, так как у звуков голоса разных людей имеется масса особенностей. В большинстве систем задача разделения голоса решается при помощи установки двух или большего количества микрофонов, но в случае использования всего одного микрофона, с задачей разделения голоса может справиться только искусственный интеллект. Использовать эту технологию можно там, где требуется высокая точность распознавания голосовых сообщений. Например, в системах голосового управления автомобилями, лифтами, бытовыми и прочими электронными устройствами".



 Распечатать »
 Правила публикации »
  Обсудить материал в конференции Дискуссии и обсуждения общего плана »
Написать редактору 
 Рекомендовать » Дата публикации: 15.06.2017 
 

Магазин программного обеспечения   WWW.ITSHOP.RU
EMS SQL Management Studio for PostgreSQL (Business) + 1 Year Maintenance
ABBYY Lingvo x6 Европейская Домашняя версия, электронный ключ
Microsoft Visual Studio Professional w/MSDN AllLng License/Software Assurance Pack OLP 1 License No Level Qualified
ABBYY Business Card Reader 2.0 for Windows (download), электронный ключ
Купить Антивирус Dr.Web Desktop Security Suite для рабочих станций
 
Другие предложения...
 
Курсы обучения   WWW.ITSHOP.RU
 
Другие предложения...
 
Магазин сертификационных экзаменов   WWW.ITSHOP.RU
 
Другие предложения...
 
3D Принтеры | 3D Печать   WWW.ITSHOP.RU
PrintBox3D One
CubeX Trio
CubeX Duo
MakerBot Replicator 2-head
3D ручка Myriwell, голубая
 
Другие предложения...
 
Новости по теме
 
Рассылки Subscribe.ru
Adobe Photoshop: алхимия дизайна
Web-дизайн и е-коммерция. Советы изнутри и снаружи.
 
Статьи по теме
 
Документация
 
 



    
rambler's top100 Rambler's Top100