В чем компьютер все еще проигрывает человеку

08-03-2012
Ученые из швейцарского исследовательского института Idiap и университета Джона Хопкинса (США) провели любопытный эксперимент, чтобы оценить эффективность современных алгоритмов, предназначенных для машинного распознавания образов. Результаты оказались ожидаемыми – человек по-прежнему быстрее справляется с задачами распознавания образов, особенно, когда дело касается определения схожести картинок по расположению объектов относительно друг друга. Тем не менее, у этого эксперимента есть вполне практический аспект – проведенные измерения помогают понять, в каком направлении следует развивать алгоритмы распознавания.

Машинное зрение и распознавание образов строятся на базе сложных математических алгоритмов, однако почти каждый день современные люди сталкиваются с этими технологиями: например, в цифровых фотоаппаратах с автоматическим обнаружением лиц и улыбок. Несмотря на многолетний труд, вложенный в алгоритмы машинного зрения, точность распознавания пока оставляет желать лучшего, хотя и возрастает с каждым новым поколением техники. Традиционный подход к распознаванию лиц, в частности, подразумевает разбиение картинки на множество отдельных небольших зон, где алгоритм пытается найти области с относительно небольшой разницей в тоне (как на коже лица) и выраженными темными областями, которые могут соответствовать глазам и бровям.

При таком подходе нередки ошибки, когда за лицо человека программа принимает узоры на стенах или полки с книгами.

Эксперимент швейцарских и американских ученых был построен на разбиении серии небольших черно-белых изображений на два «семейства», причем критерий разбиения каждый испытуемый – человек или машина – выбирал самостоятельно. Например, критерием могло служить нахождение одного объекта внутри другого или размещение объектов рядом друг с другом. В тех случаях, когда решение было очевидно для человека, который начинал понимать общие и различные признаки в картинках уже после нескольких изображений, машинам приходилось изучать тысячи образцов, чтобы дать более или менее приемлемый результат. Что еще хуже, одна из 24 загадок (серий картинок с одним отличительным признаком для всех изображений) машинам не поддалась вообще.

Загадки, предложенные людям и машинами, можно назвать несложными. Тем не менее, за человеком остается преимущество многолетнего опыта и генетического наследия, а вот машины в этом смысле представляют из себя «чистый лист». Благодаря упрощению задач до предела ученые смогли обнаружить главную слабость машинного обучения – дело в том, что человек очень быстро переходит к семантическому анализу изображения. Если человек сразу оценивает нагромождение деталей в паре изображений, то машина будет сравнивать числовые значения, например, плотность точек в определенном периметре.

Проведенный эксперимент также помог ученым приоткрыть загадку механизма распознавания и различения образов в мозге человека. Как уверяют авторы, это первый случай, когда совершенно идентичные задачи были поставлены перед живым человеком и алгоритмом машинного обучения. Эксперимент достоверно показал, что чем больше измерений проводится для сравниваемых изображений, и чем разнообразнее эти измерения, тем больше вероятность успешного обучения. Обнаружение того факта, что труднее всего машинам справиться с различением образов по взаимному расположению объектов, помогает выбрать наиболее продуктивное направление в развитии алгоритмов машинного зрения и обучения. Как становится понятно, пришло время создавать новые алгоритмы специально для определения обособленных частей изображения и их взаимного относительного расположения.

Подробные сведения о любопытном эксперименте по сравнению возможностей человека и машины в задачах по классификации изображений можно найти в статье авторов исследования, опубликованной в октябрьском выпуске престижного научного журнала «Труды национальной академии наук» (dx.doi.org/10.1073/pnas.1109168108).

По материалам сайта PhysORG.

Новости

все
25.07.2012
Главный инспектор аэрокосмического агентства США, НАСА, сообщил о расследовании скандального
24.07.2012
Анонсированы Leica M9 и X1: карманный FF и APS-C с фиксом Для тех, кто не желает таскать с
23.07.2012
Скоро беспроводная сеть позволит посмотреть сквозь стену? Видеть сквозь препятствия –

Реклама

Наши цены на межкомнатные двери Вас приятно удивят.

Дизайны

Разработали структуру сайта, создали сайт, соответствующий всем требованиям заказчика. Создали
Разработали структуру сайта, создали сайт по новым технологиям. Создали индивидуальный и
ООО Транспортная Компания «ТрансРусь» предлагает Вам свои услуги по приемке и