В видеохостинге YouTube возникла новая функция, ориентированная на людей с несоблюдением слуха.
Команда решила сперва сосредоточиться на музыке, шуме и смехе, так как для слабослышащих либо глухих людей они придают разговору на видео значимый контекст. У YouTube появился метод искусственного интеллекта для звуковых эффектов только после обработки тыс. часов видео. «По утверждению разработчиков, труднее всего было обучить систему различать субъекты, которые звучат одновременно — например, смех и рукоплескания», — информирует издание.
Автосубтитры для речи YouTube предоставляет с 2009 года: они основаны на системе распознавания речи Google. Следующим этапом, профессионалы компания планируют добавить распознавание таковых звуков, как стук, звон и лай.
YouTube улучшил функцию автоматического создания субтитров.
Статистика исследований, проведённых разработчиками среди указанной аудитории — информирует о том, что две трети участников считают просмотр видео с подписями — комфортнее. Например, в случае звона нам следует уметь распознавать, что это: «знак будильника, звонок в дверь либо по телефону», — подчеркнул инженер Google Ноа Вана. Но функция пока еще далека от идеала — из-за таковых нюансов как неправильное произношение, акценты, диалекты и фоновые шумы ее приходится регулярно дорабатывать.