Учёные обучают машины учиться на уровне людей

  • Размер шрифта: Больше Меньше
  • Печатать
  • PDF

Команда учёных из МТИ (Массачусетского технологического института — Massachusetts Institute of Technology, MIT) разработала алгоритм, который позволяет компьютерам опознавать и воспроизводить простые визуальные понятия или символы, которые в основном неотличимы от тех, что создаются людьми.

Работа «Обучение машины как человека путем применения вероятностной программы» («Human-level concept learning through probabilistic program induction»), представленная в последнем выпуске журнала «Наука» («Science»), демонстрирует значительные успехи в области машинного обучения — намного сокращается время, необходимое компьютеру для изучения новых понятий и расширения их применения для большего числа творческих задач. Результаты исследования показывают, что, воспроизводя то, как человек думает о проблеме, можно разработать лучший алгоритм распознавания.

Человеку, чтобы разучить, запомнить и закрепить что-то новое — новое танцевальное па, букву алфавита — достаточно несколько примеров. Современным машинам же нужны сотни или тысячи примеров для того, чтобы точность выполнения задач сравнялась с человеческими.

Учёные-исследователи из МТИ добиваются сокращения времени процесса обучения и делают его более похожим на то, как люди получают и применяют новые знания, то есть изучение небольшого числа примеров и выполнение ряда задач за короткое время. Для этого учёные разработали структуру «обучения  по байесовской программе» (Bayesian Program Learning, BPL), где понятия представлены простыми компьютерными программами. Например, буква «А» представлена компьютерным кодом, при этом машине не нужен программист, который обычно необходим во время процесса обучения: программы алгоритма сами выстраивают код для описания того, как выглядит буква. Также, в отличие от стандартных компьютерных программ, которые позволяют получить одинаковые результаты каждый раз, эти вероятностные программы позволяют получить различные результаты при каждом выполнении. Это позволяет им зафиксировать различия в экземплярах понятий, например, различия в том, как два разных человека могут писать букву «А».

В то время как стандартные образцы алгоритмов распознавания используют такие понятия как формы пикселей или наборы характерных особенностей, метод BPL позволяет изучить  «генеративную» сторону любых процессов,  превращая обучение в «создание модели» или «объяснение» данных, содержащихся в алгоритме. В случае узнавания и написания букв BPL захватывает как случайные, так и обязательные особенности написания символов, что позволяет алгоритму использовать данные более эффективно. Модель также «учится учиться», используя знания из предыдущих понятий, например, знания латинского алфавита для изучения букв греческого алфавита, ускоряя таким образом обучение новым понятиям. Учёные опробовали свою модель на более чем 1600 типах рукописных символов в 50 письменных системах мира, включая санскрит, тибетский язык, язык гуджарати, глаголицу, и даже придуманные символы из мультсериала «Футурама».

Проверяя способности алгоритма осваивать/распознавать новые сущности, ученые дали задание группе людей и компьютеру: воспроизвести серию рукописных символов или, в некоторых случаях, создать новые символы в стиле тех, что уже были показаны. Затем учёные сравнили полученные результаты с помощью альтернативного «визуального теста Тьюринга» («visual Turing tests») и попросили судей определить, который из символов был произведён компьютером. Менее 25% судей смогли определить, какой символ написан человеком, а какой - компьютером,  а это значит, что машина прошла тест.

Хотя люди ещё не способны создать машину, которая по способности учиться равна человеческому ребенку, но это первый раз, когда  была создана компьютерная программа, способная выучить и использовать большой класс реальных понятий, таких как рукописные символы, которые трудно отличить от тех, что написаны человеком.

Оригинал: http://www.sciencedaily.com/releases/2015/12/151210144535.htm.

в разделе: В мире Просмотров: 1149