Человек или алгоритм – кто внимательнее к обстановке?

  • Размер шрифта: Больше Меньше
  • Печатать
  • PDF

Глядя вокруг себя, люди анализируют то, что видят, и делают выводы: безопасный ли это район? Где ближайшая парковка? Где искать автозаправку – повернуть на светофоре направо или налево?

На основании сложного набора предположений, суждений и выводов люди могут «заглядывать» за пределы поля своего зрения. Вопрос – а можем ли мы научить компьютер так «смотреть»? И если можем – а можно ли его научить ориентироваться лучше, чем человека?

В лаборатории информатики и искусственного интеллекта (CSAIL) Массачусетского технологического института на эти вопросы отвечают, соответственно, «да» и «иногда». Исследователи разработали алгоритм, который лучше, чем человек, определяет по паре фотографий городских пейзажей, какая из них ближе к местному Макдональдсу.

Демо-версия программы, выложенная онлайн, представляет собой модификацию Google Street View, в которой вы можете «оглядываться» и перемещаться в четырех направлениях. Задача – дойти до ближайшего Макдональдса самым коротким путем.
Практика показывает, что с этой задачей пока еще лучше справляются люди. Но с другой вариацией этой задачи – когда надо определить по паре фотографий местности, к какой из этих двух точек ближе находится Макдональдс – компьютер уже справляется лучше человека.

Для создания алгоритма команда – в которую входят аспиранты Адитья Хосла (Aditya Khosla), Бьонхвон Ан (Byoungkwon An) и Джозеф Лим (Joseph Lim), а также ведущий исследователь CSAIL Антонио Торральба (Antonio Torralba) – использовала 8 миллионов изображений из Google – видов восьми крупных городов США, к которыми прилагались данные об уровне преступности и расположении Макдональдсов. Затем исследователи использовали техники глубокого обучения (deep learning), чтобы научить программу тому, как коррелируют друг с другом разные показатели фотографий. Например, компьютер обнаружил, что чаще всего возле Макдональдсов встречаются службы такси, полицейские машины и тюрьмы (а реже всего – утесы, подвесные мосты и песчаные пляжи).

«Алгоритм такого типа можно применить к разным задачам распознавания визуального контента, например, к определению запоминаемости лиц на фото на документах» - говорит Хосла. До этого Хосла разрабатывал алгоритм, предсказывающий уровень популярности фотографий.

Исследователи представят свою разработку в июне на Международной конференции IEEE по компьютерному визуальному восприятию и распознаванию образов (IEEE International Conference on Computer Vision and Pattern Recognition).


Источник: http://www.csail.mit.edu/node/2340
Дата: 18 сентября 2014 г.



 

в разделе: В мире Просмотров: 1174