Компьютеры смогут видеть глазами человека
Базой для компании Cortexica Vision Systems стал Королевский Колледж Лондона, ученые которого шесть с половиной лет изучали, какие механизмы задействованы в зрении человека. С февраля 2009 года, когда была основана компания Cortexica, разработчики создавали алгоритмы для точного воспроизведения процессов, которые использует человек при распознавании визуальных образов.
Итогом этой работы стал программный интерфейс VisualSearch API, который до сих пор пребывал в стадии закрытого бета-тестирования.
По словам самих авторов технологии VisualSearch API, его главными покупателями должны стать создатели приложений для конечных потребителей. Благодаря интерфейсу VisualSearch API настольные и мобильные приложения смогут вести поиск нужной информации без применения штрих-кодов и более современных двумерных QR-кодов, а также без более традиционного текстового поиска. Например, технология VisualSearch API позволяет опознать и найти интересующий пользователя объект даже на картине, выполненной в технике масляной живописи.
Использование принципов человеческого зрения обещает огромные перспективы, как считают в компании Cortexica. В частности, новые алгоритмы могут компенсировать недостаток освещенности, а также помогают опознать и локализовать объект, если он занимает всего лишь крохотную часть от исходного изображения.
Технология визуального распознавания и поиска VisualSearch API уже применяется в двух мобильных приложениях компании Cortexica, предназначенных по большей части для практической проверки новых принципов – WINEfindr и BrandTrak. Эти приложения уже доступны для аппаратов iPhone. Так, приложение WINEfindr помогает находить в Интернете и сравнивать цены на марочные вина, причем исходными данными могут служить не только введенные в текстовом виде названия, но и простая фотография бутылки, сделанная встроенной камерой аппарата. Утилита BrandTrak выполняет более сложные и более специфичные задачи – она позволяет отслеживать воздействие различных брендов в телевизионной рекламе, в онлайн-ресурсах и в печатных изданиях.
После нынешнего официального выпуска технологии VisualSearch API, как ожидается, доступ к технологии визуального поиска смогут получить все заинтересованные разработчики и заказчики.
По материалам обзора на сайте TechCrunch.