На днях Институт искусственного интеллекта Аллена представил новую разработку, дополняющую Semantic Scholar – интеллектуальной интернет-платформы для поиска статей в научных журналах. Платформа действует с 2015 года, ее создатели подчеркивают, что их поисковый сервис комбинирует машинное обучение, обработку естественного языка и машинного зрения, чтобы добавить слой семантического анализа к традиционным методам анализа цитирования. То есть Semantic Scholar не только ищет статьи, но и выделяет связи между ними.

Новый инструмент этой платформы позволяет «укорачивать» сложные и пространные научные тексты без потери смысла.

Это не первая программа обработки естественного языка, созданная для обобщения содержания объемных документов. Но разработчики Semantic Scholar утверждают, что их продукт обладает наиболее высокой степенью сжатия. Так, в среднем из статьи в 5 тысяч знаков программа создает резюме всего в 21 слово, и при этом передает все содержание материала. Таким образом, степень сжатия материала доходит до 238 раз, в то время как ближайший конкурент сжимает тексты всего в 36 раз.

Демонстрационная версия программы доступна в сети бесплатно. На данный момент версия работает только с англоязычными текстами.

Источник: 4PDA