Тестирование систем автоматического анализа тональности
- Размер шрифта: Больше Меньше
- Печатать
- Поделиться
Сейчас в рамках конференции «Диалог» проходит цикл тестирований методов автоматической оценки тональности отзывов по отношению к заданным объектам и их конкретным свойствам.
В качестве данных предлагаются:
- отзывы о ресторанах;
- отзывы об автомобилях;
- твиты о банках или телекоммуникационных компаниях.
Анализ отзывов по аспектам
Задача: анализ тональности отзывов по отношению к конкретному объекту по его основным характеристикам (аспектам).
Аспекты объекта (аспектные термины), упоминаемые в отзыве, делятся на:
– явные аспекты, которые указывают на характеристики объекта и не содержат в себе оценки этого объекта;
– неявные аспекты, которые включают сочетание характеристики объекта и оценки в одном слове,
– факты – слова и словосочетания, которые формально указывают на состояние дел, а на самом деле также несут в себе оценку (например, «пережаренный»).
Также в текстах отзывов можно встретить оценку объекта в целом, например «прекрасный ресторан».
Анализ твитов
Для экспериментов по анализу тональности твитов извлечены твиты, упоминающие банки и телекоммуникационные компании (МТС, Мегафон и др.). Задача заключается в определении тональности твита по отношению к этим организациям: положительная, отрицательная или нейтральная.
Предполагаемый график проведения тестирования:
20.10.14 Объявление дорожек
17.11.14 Раздача обучающих данных
10.01.14 Раздача тестовых данных
15.01.15 Прием результатов прогонов
25.01.15 Объявление результатов участникам
15.02.15 Подача статьи на конференцию Диалог.
Источник: http://www.dialog-21.ru/Default.aspx?DN=e56751e1-60e9-45ac-a53c-770b6dcc69af&l=Russian