Google разработала программу, способную читать по губам лучше человека

Система искусственного интеллекта Google DeepMind известна главным образом благодаря созданию программы AplhaGO, сумевшей превзойти одного из наилучших игроков мира в Go.

Ученым довелось инсталлировать в нейросеть продвинутый метод распознавания мимики, после этого DeepMind предстояло «посмотреть» 5 тысяч часов шоу ВВС, таковых как BBC Breakfast, Newsnight и Question Time, в которых содержалось около 120 тысяч предложений.

После показа случайной выборки из 200 видео из передач BBC, человек, читающий по губам, сумел расшифровать менее четверти произносимых слов. Также система смогла безошибочно прокомментировать 46% слов, тогда как у людей этот результат составил приблизительно 12%.

Новейшую систему для распознавания речи представили создатели из Оксфордского университета и лаборатории Google DeepMind. Как передает morning-news.ru, ИИ-систему Google обучили на 6-ти телешоу (таких как Newsnight, BBC Breakfast и Question Time), которые выходили в эфир с 2010-го по 2015-й года, «скормив» ей видео общей длительностью 5 тысяч часов (около 118 тысяч предложений).

Также создатели предполагают, что программа может быть полезна для людей, имеющих проблемы со слухом. Система LipNet также превосходит людей в точности чтения, хотя набор данных под названием GRID состоял только из 51 необычайного слова, тогда как данные BBC содержали практически 17500 слов.

Учёные считают, что система может использоваться в мобильных технологиях и виртуальных ассистентах.

Смотреть видео онлайн

Смотреть kino онлайн