Ресурсы

База данных текстовых фрагментов из новостных сообщений (БДТФ-Н)

Содержимым базы данных (БД) являются предложения на русском языке, автоматически извлеченные из новостных сообщений.

Подробнее...

Словарь простых словосочетаний

Словарь простых словосочетаний (СПС) описывает синтагматические свойства слов с учетом некоторых их морфологических характеристик.

Подробнее...

Коллекция "Relations-1000"

Коллекция "Relations-1000" создана для оценки точности и полноты алгоритмов автоматического извлечения (из новостных текстов) отношений типа роль-лицо и роль-по-отношению-к. Отношения первого типа выражают связь лица с его ролью или аспектом. Например, директор Иван Смирнов (роль), позитивист Федор Иванов (аспект). Второй тип отношений указывает, относительно чего/кого лицо играет данную роль. Например, акционер компании, заведующий кафедрой, племянник Бориса.

Подробнее...

Морфологический словарь личных имен

Словарь может использоваться программными системами для автоматического морфологического анализа текста на русском языке. Словарь содержит информацию исключительно о морфологии личных имен.

Подробнее...

Коллекция "Situations-1000"

Коллекция "Situations-1000" создана для оценки точности и полноты алгоритмов извлечения (из новостных текстов) событий назначения на должность и отставки. В рамках задачи извлечения предлагается определить тип события, место упоминания события в тексте, а также выявить участников события в форме фрагмента текста (строки).

Подробнее...

Коллекция "Persons-1111-F"

Коллекция "Persons-1111-F" создана для оценки точности и полноты алгоритмов извлечения личных имен из новостных текстов. В рамках задачи извлечения предлагается определить места упоминания лиц в тексте, а также привести это упоминание к заданной канонической форме. Набор текстов отличен от коллекции "Persons-1000" и охватывает новости Юго-Восточной Азии, Среднеазиатского региона и стран арабского мира.

Подробнее...