Об эвристическом методе разрешения неоднозначности при морфологическом анализе незнакомых фамилий

Год: 2013
Тип публикации: Статья
Журнал: Машинное обучение и анализ данных
Том: 1
Номер: 5
Страницы: 519-525
BibTex:
Аннотация: Статья посвящена развитию подхода к морфологическому анализу незнакомых фамилий в русскоязычном тексте, реализованного в специальном модуле системы интеллектуального анализа текста ИСИДА-Т. Идея подхода состоит в первоначальном построении заведомо избыточного множества вариантов - гипотез и последующем сокращении числа вариантов с помощью различных эвристических методов: исключение невозможных вариантов на основании дополнительных проверок правилами-фильтрами; кластеризация словоформ и фильтрация результатов внутри кластера; ранжирование вариантов по предпочтительности. Анализируются ограничения на возможности метода, вытекающие, в частности, из его детерминированной природы.