В чем компьютер все еще проигрывает человеку
Машинное зрение и распознавание образов строятся на базе сложных математических алгоритмов, однако почти каждый день современные люди сталкиваются с этими технологиями: например, в цифровых фотоаппаратах с автоматическим обнаружением лиц и улыбок. Несмотря на многолетний труд, вложенный в алгоритмы машинного зрения, точность распознавания пока оставляет желать лучшего, хотя и возрастает с каждым новым поколением техники. Традиционный подход к распознаванию лиц, в частности, подразумевает разбиение картинки на множество отдельных небольших зон, где алгоритм пытается найти области с относительно небольшой разницей в тоне (как на коже лица) и выраженными темными областями, которые могут соответствовать глазам и бровям.
При таком подходе нередки ошибки, когда за лицо человека программа принимает узоры на стенах или полки с книгами.
Эксперимент швейцарских и американских ученых был построен на разбиении серии небольших черно-белых изображений на два «семейства», причем критерий разбиения каждый испытуемый – человек или машина – выбирал самостоятельно. Например, критерием могло служить нахождение одного объекта внутри другого или размещение объектов рядом друг с другом. В тех случаях, когда решение было очевидно для человека, который начинал понимать общие и различные признаки в картинках уже после нескольких изображений, машинам приходилось изучать тысячи образцов, чтобы дать более или менее приемлемый результат. Что еще хуже, одна из 24 загадок (серий картинок с одним отличительным признаком для всех изображений) машинам не поддалась вообще.
Загадки, предложенные людям и машинами, можно назвать несложными. Тем не менее, за человеком остается преимущество многолетнего опыта и генетического наследия, а вот машины в этом смысле представляют из себя «чистый лист». Благодаря упрощению задач до предела ученые смогли обнаружить главную слабость машинного обучения – дело в том, что человек очень быстро переходит к семантическому анализу изображения. Если человек сразу оценивает нагромождение деталей в паре изображений, то машина будет сравнивать числовые значения, например, плотность точек в определенном периметре.
Проведенный эксперимент также помог ученым приоткрыть загадку механизма распознавания и различения образов в мозге человека. Как уверяют авторы, это первый случай, когда совершенно идентичные задачи были поставлены перед живым человеком и алгоритмом машинного обучения. Эксперимент достоверно показал, что чем больше измерений проводится для сравниваемых изображений, и чем разнообразнее эти измерения, тем больше вероятность успешного обучения. Обнаружение того факта, что труднее всего машинам справиться с различением образов по взаимному расположению объектов, помогает выбрать наиболее продуктивное направление в развитии алгоритмов машинного зрения и обучения. Как становится понятно, пришло время создавать новые алгоритмы специально для определения обособленных частей изображения и их взаимного относительного расположения.
Подробные сведения о любопытном эксперименте по сравнению возможностей человека и машины в задачах по классификации изображений можно найти в статье авторов исследования, опубликованной в октябрьском выпуске престижного научного журнала «Труды национальной академии наук» (dx.doi.org/10.1073/pnas.1109168108).
По материалам сайта PhysORG.