На чемпионат заявились около 40 команд, но большинство отсеялись на предварительном этапе. Участники должны были рассмотреть эмоции, показанные людьми на 1 млн снимков, которые были получены в естественных условиях.
«Распознавание эмоций — это зарождающаяся отрасль, в которой нет хороших бенчмарков». Главная сложность заключалась в определении эмоций на основе выражения лиц, которые в момент снимка не были строго повернуты в сторону камеры.
«Мы приняли решение поучаствовать в нем, чтобы понять, где находимся относительно наших соперников и какие наработки в данной области есть во всем мире», — комментирует сооснователь NTechLab Артем Кухаренко.Мы рады результатам, ведь это не заключительная версия нашего алгоритма.
Кроме того, многие люди по-разному выражают эмоции, и универсального шаблона для распознания нет.
Компаниям-участникам при помощи собственных алгоритмов предстояло подвергнуть анализу все млн. фотографий. При всем этом 950 тысяч изображений использовались, чтобы научить программы, 25 тысяч — чтобы проверить точность алгоритма, еще 25 тысяч — чтобы сравнить разных алгоритмов.
В финале, метод от российской фирмы NtechLab оказался не менее точным, чем решение, созданное Университетом Джонса Хопкинса. «Профессиональные конкурсы, в которых участвуют не студенты, а уже работающие на рынке компании, как правило, наименее широко освещаются, однако в них также довольно часто выигрывают команды из РФ, как, к примеру, в случае с The MegaFace Benchmark, где компания NtechLab одержала победу», — прокомментировал результаты россиян гендиректор русской инвестиционной интернет-платформы StartTrack Константин Шабалин. В частности, из-за этого, по оценке организаторов чемпионата, существующие алгоритмы еще предстоит значительно дорабатывать.
Перед алгоритмами была поставлена задача определить 16 видов эмоций, которые профессионалы в состоянии наблюдать благодаря уменьшению лицевых мышц. Это не менее чем вдвое больше, чем требовалось в процессе прошлых экспериментов в данной области. Каждая эмоция определятся по необычайной вариации сокращения лицевых мышц. При всем этом организаторы состязания снижали качество изображения, уменьшая четкость и закрывая маленькую часть фотографии.