Технология NVIDIA STEAL улучшает компьютерное зрение

  • Размер шрифта: Больше Меньше
  • Печатать
  • PDF

Ученые из Университета Торонто, Института по изучению искусственного интеллекта Vector в Торонто и компании NVIDIA разработали метод более точного обнаружения границ, отделяющих одни объекты на изображениях от других. Новая технология улучшает работу существующих моделей компьютерного зрения и помогает маркировать данные для обучения систем искусственного интеллекта. Уже был проведен опыт с моделью прогнозирования семантических границ CASENet – система STEAL (Semantically Thinned Edge Alignment Learning) позволила ей повысить точность на 4%.

Более точное распознавание границ объектов на изображении актуально для самых разных задач компьютерного зрения, от обнаружения и классификации до создания изображений и 3D-моделирования.

STEAL различает границы объектов в пикселях при помощи метода, который исследователи назвали «активным выравниванием». Как фреймворк он может применяться для улучшения существующих свёрточных нейронных сетей и моделей машинного зрения. Также учёные считают, что их разработка может помочь другим исследователям более эффективно маркировать или аннотировать данные для обучения их нейронных сетей. Чтобы доказать это, метод STEAL был использован для уточнения Cityscapes, набора визуальных данных в рамках городской среды, впервые представленного на конференции Computer Vision and Pattern Recognition (CVPR) в 2016 году, при этом удалось добиться увеличения точности сегментации в отдельных категориях до 1,2 %.

«Мы обнаружили, что наши результаты по предсказанию границ у объектов значительно лучше, чем те, которые по последним данным, демонстрирует модель DeepLab-v3, и это при использовании гораздо более лёгкой архитектуры», — пишут авторы исследования.

Научная работа «Дьявол в границах: изучение семантических границ в зашумлённых аннотациях» будет представлена в устной презентации на этой неделе на конференции CVPR 2019 в Лонг-Бич, Калифорния. Помимо неё десятки других исследовательских работ, многие из которых написаны исследователями из NVIDIA Research, будут представлены в выступлениях на конференции, сообщает компания NVIDIA в своём блоге.

Исходный код STEAL доступен для всех желающих на платформе GitHub.

Источник: 3D News

в разделе: В мире Просмотров: 73