Коллекция "Situations-1000" создана для оценки точности и полноты алгоритмов извлечения (из новостных текстов) событий назначения на должность и отставки. В рамках задачи извлечения предлагается определить тип события, место упоминания события в тексте, а также выявить участников события в форме фрагмента текста (строки).
Сводная информация
|
CopyrightНастоящие материалы представляют собой фрагменты новостных сообщений и правомерно обнародованных текстовых произведений, взятые с сайтов новостных агентств, и предназначены для использования научным сообществом в соответствие со ст. 1274 ГК РФ в научно-исследовательских целях, а именно: для оценки и сравнения алгоритмов автоматического анализа текстовой информации. Указание правообладателя и источника заимствования сделано в файле Reference.pdf. Использование таких фрагментов текстовых произведений, выходящее за рамки ограничений исключительных прав на объекты авторского права, установленных 4 Главой ГК РФ является незаконным. |
Скачать коллекцию
Коллекция представлена в форме единого zip-архива. Архив содержит файлы коллекции, а также сопровождающие файлы CollectionInfo.pdf, Copyright.pdf, Reference.pdf.
СКАЧАТЬ КОЛЛЕКЦИЮ [~4 Мб]
Браузер коллекции
Содержимое коллекции и разметку можно просматривать в онлайновом браузере.
Дополнительные материалы
- Руководство ACE для аннотаторов от 2005 года: ACE English Annotation Guidelines for Events v5.4.3.
- Руководство TimeML для аннотаторов от 2006 года: TimeML Annotation Guidelines v1.2.1.
- Предыдущая версия документа, описывающего принципы разметки коллекции Situations-1000.
Коллекция создана при поддержке РФФИ (проект № 13-06-00483).