Разметка событий в TimeML

Предисловие переводчика

TimeML — язык разметки временных выражений и упоминаний событий в естественном языке. Язык позволяет размечать:

  • упоминания событий и их привязку к временным выражениям;
  • порядок событий относительно друг друга;
  • нечеткие временные выражения (такие как, на прошлой неделе, двумя неделями ранее);
  • продолжительность событий; последствия событий.

Документ, приведенный ниже — это отрывок из руководства по аннотированию текста по стандарту TimeML. Мы перевели фрагмент руководства, описывающий тег EVENT, используемый для разметки событий в тексте.


2. Определение тегов TimeML и их атрибутов

2.1 Тег (событие)

В нашем понимании "событие" — это общий термин, означающий ситуации, которые случаются или происходят. События могут быть точечными (см. 1-2 в таблице ниже) или длящимися определенный период времени (3-4). Также к событиям мы относим те предикаты (predicates), которые описывают состояния или положения дел (states or circumstances), в которых что-то становится или является верным (5). Тем не менее, не все статические (stative) предикаты могут быть отмечены как события. См. подраздел 2.1.3, о событиях, принадлежащих к классу ’STATE’.

1) Ferdinand Magellan, a Portuguese explorer, first reached the islands in search of spices. Фердинанд Магеллан, португальский путешественник, первым достиг островов в поисках специй.
2) A fresh flow of lava, gas and debris erupted there Saturday. В субботу здесь было извержение потока лавы, газа и обломков породы. В английском варианте дословно "поток лавы извергся", то есть точечное действие, без указания, что оно длилось.
3) 11,024 people, including local Aeta aborigines, were evacuated to 18 disaster relief centers. 11 024 человека, включая местных аборигенов Аэта, были эвакуированы в 18 центров помощи при стихийных бедствиях.
4) “We’re expecting a major eruption,” he said in a telephone interview early today. "Мы ожидали крупного извержения", – сказал он в телефонном интервью сегодня утром.
5) Israel has been scrambling to buy more masks abroad, after a shortage of several hundred thousand gas masks. Израиль прикладывал все усилия к тому, чтобы купить противогазы за границей, после того, как была обнаружена нехватка нескольких сотен тысяч противогазов.

2.1.1 Как аннотировать EVENTы (события)

События могут быть выражены временными или вневременными глаголами (1 и 2 ниже), отглагольными существительными (nominalizations; 3), прилагательными (4), придаточными предложениями-сказуемыми (5) или предложными группами (6):

1) A fresh flow of lava, gas and debris erupted there Saturday. В субботу здесь было извержение потока лавы, газа и обломков породы. В английском варианте дословно "поток лавы извергся", то есть глагол в прошедшем времени.
2) Prime Minister Benjamin Netanyahu called the prime minister of the Netherlands to thank him for thousands of gas masks his country has already contributed. Премьер-министр Биньямин Нетаньяху позвонил премьер-министру Нидерландов чтобы поблагодарить за тысячи противогазов, которые предоставила его страна EVENT – глагол в инфинитиве.
3) Israel will ask the United States to delay a military strike against Iraq until the Jewish state is fully prepared for a possible Iraqi attack. Израиль будет просить США отложить военный удар по Ираку до тех пор, пока еврейские города не будут полностью готовы к возможной иракской атаке.
4) A Philippine volcano, dormant for six centuries, began exploding with searing gases, thick ash and deadly debris. Филиппинский вулкан, спавший шесть веков, начал извержение горячим газом, толстым слоем пепла и смертоносными обломками породы. В английском варианте dormant – бездействующий, спящий – прилагательное.
5) ”There is no reason why we would not be prepared,” Mordechai told the Yediot Ahronot daily. "Нет никакой причины, почему бы нам не быть готовыми", – сказал Мордехай журналисту "YediotAhronot".
6) All 75 people on board the Aeroflot Airbus died. Все 75 человек, находившихся на борту лайнера "Аэрофлота", погибли.

Отметим, что в приведенных выше предложениях размечено не всё. В первом предложении, например, не размечены ни "поток" (flow) ни "суббота" (Saturday).

Аннотирование формально простых [1] событий (примеры 1, 3, 4 и 6 выше) не вызывают затруднений. Однако формально сложные события в ряде контекстов могут быть разорваны другим словом:

1) There is no reason why we would not be prepared.
There is no reason why we would not be fully prepared.
Нет никакой причины, почему бы нам не быть готовыми.
Нет никакой причины, почему бы нам не быть полностью готовыми.
2) They will definitely take into consideration our readiness.
They will definitely take it into consideration.
Они, безусловно, принимают во внимание нашу готовность.
Они, безусловно, принимают это во внимание.

Чтобы избежать проблем, связанных с тегированием разорванных посторонними словами формально сложных событий, будем придерживаться следующих принципов:

  • Если событие выражено глагольной группой (со вспомогательными глаголами, пример: has been scrambling, to buy, were reported), тэг EVENT применяется только к смысловому глаголу, который в следующих примерах отмечен жирным шрифтом:
    Israel has been scramblingto buy more masks abroad. Израиль прикладывал все усилия к тому, чтобы купить противогазы за границей. Во всех примерах при переводе на русский теряется смысл, так что смотрите английский вариант.
    No injuries were reported. Сообщений о травмах не поступало.
    The private sector could establish a private agency. Частный бизнес может открыть частное агентство.
    If we had been attacked, ... Если нас атакуют…

    Если основной глагол подпадает под действие модального вспомогательного глагола, как в третьем из вышеприведенных примере, или отрицательной частицы, как в:

    Kaufman did not disclose details of the deal. Кауфман не раскрыл деталей сделки.

    то тег EVENT применяется только к основному глаголу. Модальный глагол и/или отрицательная частица будет представлена тегом MAKEINSTANCE, по аналогии с событием в вопросе (см. раздел 2.4).

  • Если сказуемое выражено фразовым глаголом [2], то отмечаем только глагольную часть:
    Additional distribution centers would be set up next week. Дополнительные центры выдачи будут открыты на следующей неделе. См. английский вариант, в русском переводе смысл утрачивается.
  • Если событие выражено группой глаголов, в которую входят аспектуальный и основной глаголы, оба глагола тегируются как отдельные события. Примеры аспектуальных глаголов: begin (начать), stop (прекратить, остановиться), end (закончить), keep (поддерживать) и т.д. См. подраздел 2.1.3.
  • Если аспектуальному глаголу предшествуют вспомогательные глаголы (как в последних двух примерах ниже), применяем первый принцип. В следующих примерах подчеркивание обозначает границы глагольной группы, при этом квадратные скобки обозначают границы каждого тега EVENT:
    The private sector [began] [ establishing] a private agency. Частный бизнес [начал] [открывать] частные агентства.
    If US had [stopped] [interfering] in other countries policies long ago, ... Если США давно [прекратило] [вмешиваться] в политику других стран…
    They probably would have [began] [responding] to President Reagan’s 600 ships plan with new construction. Они, возможно, могли бы [начать] [отвечать] президенту Рейгану на его план в 600 кораблей новой конструкции.
  • Если событие выражено отглагольным существительным, которое является главной частью именной группы, в которую входят и другие элементы (уточнения, дополнения, определения), то размечается только главный элемент:
    The young industry’s rapid growth also is attracting regulators eager to police its many facets. Быстрый рост новой отрасли также стимулирует желание властей навести порядок во множестве ее аспектов.
  • Если событие выражено отглагольным существительным, которое в определенных случаях сопровождается легким предикатом [3] (примеры подчеркнуты во фразах ниже), мы тегируем оба элемента.
    Several pro-Iraq demonstrations have taken place in the last week. На прошлой неделе прошли несколько про-Иракских демонстраций. См. английские варианты.
    They will definitely take into consideration our readiness. Они в конце концов приняли во внимание нашу готовность.

    Оба элемента тегируются, потому что и глагол, и существительные выражают разную информацию о событии. Два тегированных события будут соотноситься как IDENTICAL с атрибутом relType в теге TLINK (см. раздел 3).

  • Если событие — это сказуемостное придаточное предложение, то в нем тегируется только предикативный элемент (прилагательное или существительное в следующих примерах). Для того чтобы решить, что именно маркировать, необходимо определить главные члены предложения:
    1. Если предикативный элемент относится к разряду ENDOCENTRIC, т.е. у него есть "head" (главное слово), то тегируем только "head". В следующих примерах предикативный элемент подчеркнут, главное слово выделено жирным шрифтом:
      There is no reason why we would not be [fully prepared]. Нет причин, почему бы нам не быть [полностью готовыми].
      If, in spite of everything, we will not be [ready], we will ask the United States to delay the operation. Если, несмотря ни на что, мы не будем [готовы], мы попросим Соединенные Штаты отложить операцию.
      James Pustejovsky was [CTO of LingoMotors] for several years. Джеймс Пустейовский был [руководителем технического отдела LingoMotors] в течение нескольких лет.
    2. Если предикативный элемент относится к разряду EXOCENTRIC (то есть у него нет главного члена), то мы отмечаем все выражение тегом TimeML.
      All 75 people were on board at 9:00 a.m. Все 75 человек были на борту в 9:00.
  • Если событие выражено предложной группой (ПГ), мы также начинаем с того, что определяем главный член ПГ. Если ПГ не имеет выраженного главного члена, тегируем следующим образом:
    All 75 people on board the Aeroflot Airbus died. Все 75 человек на борту самолета Аэрофлота умерли.
  • В случае с каузативными предикатами встает вопрос о том, насколько событие, на которое указывает каузатив, действительно отличается от события, выступающего в роли причины (логического субъекта каузатива). Например:
    The rains caused the flooding. Дожди стали причиной наводнения.

    Здесь событие caused (стали причиной) отличается от события rains (дожди), и, возникает вопрос, надо ли его тегировать?

    Здесь можно выделить три варианта:

    Вариант 1: Событие стало причиной события (EVENT cause EVENT)
    The [rains] [caused] the [flooding].
    [Дожди] [стали причиной] [наводнения].

    Вариант 2: Сущность стала причиной события (ENTITY cause EVENT)
    John [caused] the [fire].
    Джон [стал причиной] [пожара].

    Вариант 3: По шаблону <Событие. Речевой маркер + Событие>. (EVENT. Discourse marker EVENT)
    He [kicked] the ball, and it [rose] into the air.
    Он [пнул] мяч, и тот [взлетел] в воздух.

    Мы приняли следующие решения относительно каузативных предикатов в TimeML.

    1. Если аннотатор встречает предикат, обозначающий причинную связь между аргументами в предложении, то варианты следующие:

      (а) Если (логический) субъект каузатива (собственно, причина) — это событие, обозначенное каким-то выражением (например, война, потоп, дождь, встреча и т.д.), то аннотатор размечает его как событие. (Вариант 1 выше).

      (б) Если (логический) субъект — это отдельная сущность (например, Джон, женщина, компания и т.д.), то оно не размечается. (Вариант 2 выше).

    2. Если (логический) объект каузатива (следствие) является событием, то оно размечается обычным образом (потоп, пожар).
    3. Предикат, обозначающий каузативное отношение, размечается как событие (стал причиной).
    4. Если есть событие, представленное логическим субъектом (как в случае 1), то необходимо использовать тэг TLINK (у которого relType = IDENTITY), определяющий связь между событием, соответствующим каузативному отношению, и событием, представленным логическим субъектом (см. раздел 3, обсуждение тега TLINK и его атрибутов).
    5. Добавляем TLINK между событием, выраженным каузативным предикатом, и событием, связанным с позицией (логического) объекта, с атрибутом relType = BEFORE.

    Такой подход применим к следующим глаголам (в их каузативном смысле): cause (быть причиной), stem from (являться следствием), lead to (привести к), breed (порождать), engender (рождаться, возникать), hatch (выводить), induce (наводить), occasion (служить поводом), produce (производить), bring about (влечь за собой), secure (гарантировать, обеспечивать).

    Для приведенного выше Варианта 3 у аннотатора есть выбор: считать ли речевой маркер and (и) сигналом (см. раздел 2.3) к построению тега TLINK с relType = BEFORE или нет. Аннотатор МОЖЕТ поставить тег TLINK между событиями, но это НЕОБЯЗАТЕЛЬНО.

    Полностью проаннотированные варианты примеров, приведенных выше, представлены в разделе. 4.3.

Что НЕ тегировать
  • Общие утверждения (generics) не тегируются, по крайней мере в настоящее время, даже если включение их в разметку может быть полезно для ответа на вопросы.

    Например, слова-события в следующих предложениях тегировать не нужно:

    Use of corporate jets for political travel is legal. Использование корпоративных самолетов для политических поездок законно.
    Businesses are emerging on the Internet so quickly that no one, including government regulators, can keep track of them. Предприятия появляются в Интернете так быстро, что никто, включая правительственные органы, не может за ними уследить.
    Jews are prohibited from killing one another. Евреям запрещено убивать друг друга.

    Здесь свойство приписывается всему классу событий, или отношение утверждается между классом событий и членами набора сущностей. Однако ни единичный пример события, ни ряд примеров событий, в этом классе не позиционируется во времени или в отношении других размещенных во времени событий.

    В отличие от предыдущих примеров с чистыми обобщениями, предложения, выражающие одиночные события, четко позиционируемые во времени, трудностей в разметке не вызывают. Например:

    On June 7, Mr. Sununu used a jet provided by Fiber Materials Inc. 7 июня мистер Сунуну воспользовался самолетом, предоставленным Fiber Materials

    Сравним с менее четким вариантом:

    Sununu has resorted to regular use of corporate planes for political travel. Мистер Сунуну регулярно пользуется корпоративными самолетами для политических поездок.

    Такое предложение описывает типичный пример действия, но не указывает напрямую на конкретные события. На данный момент мы не тегируем подобные примеры.

  • Зависимые глаголы, выражающие событие, которое четко локализовано во времени, но при этом имеющие дополнения со значением обобщения, сами по себе не тегируются. Например, временной глагол класса REPORTING (оповещение) с обобщением в качестве атрибута тегироваться не будет:
    The rabbi said Jews are prohibited from killing one another. Раввин сказал, что евреям запрещено убивать друг друга.

    В этом случае, так как подчиненные выражения не тегируются, матричный глагол [4] said (сказал) также не будет тегироваться.

  • Событие, выраженное отглагольным существительным, не дающее никакой дополнительной информации и поддерживаемое глаголом, с которым он связан, не тегируется. Например:
    Newspaper reports have said ... Газетные отчеты сказали ...

    В этом контексте said (сказали) тегируется как событие, а reports (отчеты) не тегируются.


2.1.3 Атрибуты тега

a. ID тега EVENT (Event ID number, eid) Обязательный атрибут. Каждому событию присваивается уникальный ID-номер. Он автоматически генерируется инструментом аннотирования каждый раз, когда какой-то подстроке присваивается тег EVENT.

b. Класс (Class) Обязательный атрибут. Каждое событие принадлежит к одному из следующих классов. Заметьте, что, если в одном случае глагол выражает события определенного типа, это не означает, что во всех случаях он непременно будет выражать событие этого же типа. То есть глаголы вовсе необязательно относятся к какому-то одному классу.

  • ОТЧЕТ (REPORTING):

События класса "отчет" появляются тогда, когда человек или организация заявляют о чем-то, информируют о каком-либо событии, излагают факты и т.д. Несколько примеров: говорить, доложить, сказать, объяснить, заявить:

Punongbayan said that the 4,795-foot-high volcano was spewing gases up to 1,800 degrees. Пунонгбайан сказал, что вулкан высотой 4 795 футов во время извержения выбрасывал газы температурой свыше 1800 градусов.
No injuries were reported over the weekend. Сообщений о несчастных случаях в выходные не поступало.
Citing an example, ... Ссылаясь на пример,…
  • ВОСПРИЯТИЕ (PERCEPTION):

События этого класса включают физические ощущения от другого события. Обычно события этого класса выражаются глаголами вроде: видеть, наблюдать, взглянуть, заметить, осмотреть, услышать, слушать, прослушать.

Witnesses tell Birmingham police they saw a man running. Свидетели сказали полиции Бирмингема, что видели бегущего человека.
”You can hear the thousands of small explosions down there”, a witness said. "Вы можете услышать там тысячи маленьких взрывов", - сказал очевидец.
  • СТАДИЯ / ФАЗА (АSPECTUAL):

В таких языках, как английский и французский (и русский), существует грамматическое выражение этапов процесса, отражающих разные моменты совершения события:

  1. Начало: начать, стартовать, вступить в действие и прочие глаголы со значением "начать" (begin, start, commence, set out, set about, lead off, originate, initiate).
  2. Повторное начало: начать заново, начать снова и т.д. (restart, reinitiate, reignite).
  3. Завершение: остановить, отменить, (также см. описание класса I_ACTION), закончить, завершить и прочие глаголы со значением "закончить" (stop, cancel, end, halt, terminate, cease, discontinue, interrupt, quit, give up, abandon, block, break off, lay off, call off, wind up).
  4. Кульминация: завершить, закончить (finish, complete).
  5. Продолжение: продолжать, оставаться и прочие глаголы со значением "продолжать" (continue, keep, go on, proceed, go along, carry on, uphold, bear on, persist, persevere).
Несколько примеров:
The volcano began showing signs of activity in April for the first time in 600 years,... Вулкан начал подавать признаки активности в апреле первый раз за 600 лет,…
All non-essential personnel should begin evacuating the sprawling base. Весь свободный персонал должен начать эвакуацию разрушающейся базы.

Здесь элемент закрытого множества предикатов способен принимать в качестве аргумента глагол или существительное и маркирует такое событие одним из вышеперечисленных подтипов класса "СТАДИЯ". См. в разделе 3 пример аннотирования отношений между двумя событиями.

  • И_ДЕЙСТВИЕ (I_ACTION):

И_ДЕЙСТВИЕ – это интенциональное действие. У I_ACTION имеется аргумент, который сам является событием (и должен быть выражен явно) [...]. События, выступающие в роли аргументов И_ДЕЙСТВИЯ, необязательно происходят в то же время, когда происходит И_ДЕЙСТВИЕ (как в примере 1). Сюда относятся также явные перформативы (см. примеры 5-9 ниже). Отметим, что класс И_ДЕЙСТВИЕ не включает в себя состояния (см. описание класса И_СОСТОЯНИЕ (I_STATE)).

Приведенный ниже список является примерным, но не исчерпывающим. И_ДЕЙСТВИЯ в нем выделены жирным шрифтом, а события, выступающие в роли их аргументов, подчеркнуты:
  1. попробовать, попытаться, бороться за (attempt, try, scramble):

  2. Companies such as Microsoft or a combined worldcom MCI are trying to monopolize Internet access. Компании, такие как "Майкрософт" или объединенная международная компания телекоммуникаций "MCI", пытаютсямонополизировать доступ в Интернет.
    Israel has been scrambling to buy more masks abroad. Израиль прикладывал все усилия к тому, чтобы купить еще противогазов за границей.

  3. исследовать, исследования, посмотреть, углубиться в изучение (investigate, investigation, look at, delve):

  4. The Organization of African Unity will investigate the Hutu-organized genocide of more than 500,000 minority Tutsis. Организация Африканского союза проведет расследованиегеноцида более 500 000 представителей этнического меньшинства Тутси, организованный народом Хуту.
    A new Essex County task force began delving Thursday into the slayings of 14 black women. Новое специализированное полицейское подразделение графства Эссекс начало расследование совершенного в четверг убийства 14 чернокожих женщин.

  5. отсрочить, отложить, задержать, воспрепятствовать, остановить (delay, postpone, defer, hinder, set back):

  6. Israel will ask the United States to delay a military strike against Iraq. Израиль попросит США отсрочить военный удар по Ираку.

  7. избежать, предотвратить, отменить (avoid, prevent, cancel):

  8. Palestinian police prevented a planned pro-Iraq rally by the Palestinian Professionals’ Union. Полиция Палестины предотвратила запланированный про-иракский митинг Палестинского союза профессионалов.

  9. спросить, заказать, уверить, запросить, просить, приказывать, убеждать, разрешать (ask, order, persuade, request, beg, command, urge, authorize):

  10. Iraqi military authorities ordered all Americans and Britons in Kuwait to assemble at a hotel. Военные власти Ирака приказали всем американцам и британцам, находящимся в Кувейте, собраться в отеле.
    They were asked to take along important papers. Их попросиливзять с собой важные документы.

  11. обещать, предлагать, заверять, выдвигать (кандидатуру), соглашаться, решать (promise, offer, assure, propose, agree, decide):

  12. Germany has agreed to lend Israel 180,000 protective kits against chemical and biological weapons, and Switzerland offered to lend Israel another 25,000 masks. Германия согласилась поставить Израилю 180 000 наборов индивидуальной защиты от химического и биологического оружия, а Швейцария предложила поставить Израилю еще 25 000 противогазов.

  13. обещать, клясться (swear, vow).

  14. называть, именовать, назначать, заявлять, провозглашать (name, nominate, appoint, declare, proclaim).

  15. требовать, утверждать, предлагать (claim, allege, suggest).

  • И_СОСТОЯНИЕ (I_STATE):

События класса И_СОСТОЯНИЕ сходны с событиями предыдущего класса И_ДЕЙСТВИЕ. Этот класс включает состояния, которые относятся к альтернативному или возможному течению событий (в примерах ниже они выделены квадратными скобками). И_СОСТОЯНИЯ могут быть выражены придаточными предложениями (примеры 1-2), отглагольными существительными (3) или вневременными глагольными группами (4):

1) Russia now feels [the US must hold off at least until UN secretary general Kofi Annan visits Baghdad]. Россия сейчас чувствует, [что США должны выжидать как минимум до тех пор пока генеральный секретарь ООН Кофи Аннан посетит Багдад].
2) Once they get that extinguished, they hope that [residents will begin returning to their homes]. Они надеются, что однажды, когда все будет позади, [жители начнут возвращаться в свои дома].
3)“There is no reason why we would not be prepared for [an attack”]. "Нет ни одной причины, почему бы нам не быть готовыми [к атаке]".
4)The agencies fear they will be unable [to crack those codes to eavesdrop on spies and crooks]. Агентства боятся, что не смогут [взломать эти коды для подслушивания шпионов и преступников].

Следующий ниже перечень И_СОСТОЯНИЙ является примерным, но не исчерпывающим:

  1. верить, думать, подозревать, мечтать, сомневаться, чувствовать, быть возможным, быть уверенным (believe, think, suspect, imagine, doubt, feel, be conceivable, be sure):

  2. “We believe that [his words cannot distract the world from the facts of Iraqi aggression].” "Мы верим, что [эти слова не могут отвлечь мир от факта иракской агрессии]".
    Analysts also suspect [suppliers have fallen victim to their own success]. Аналитики также подозревают, что [поставщики пали жертвами собственного успеха].
    Russia now feels [the US must hold off at least until UN secretary general Kofi Annan visits Baghdad]. Россия сейчас чувствует, что [США должны выжидать как минимум до тех пор, пока генеральный секретарь ООН Кофи Аннан не посетит Багдад].
    It is conceivable that [a larger eruption will take place in few hours]. Возможно, [в течение ближайших часов случится еще более сильное извержение].
    He said he was sure that [a larger eruption would happen]. Он сказал, что был уверен, что [произойдет еще более сильное извержение].

  3. хотеть, любить, предпочитать, желать, жаждать, вожделеть (want, love, like, desire, crave, lust):

  4. “They don’t want [to play with us],” one U.S. crew chief said. "Они не хотят [иметь дела с нами]", - сказал один из командиров экипажа США.
    We aim at triggering associations that will generate lust for [change]. Наша цель – запустить ассоциации, которые создадут большую жажду [перемен].
    An occupation Israel would love [to end], but ... Израиль хотел бы [остановить оккупацию], но…

    Отметим, что "любить" (love) в контексте, например, "Джон любит кузину Пола" (John loves Paul’s cousin) не будет являться И_СОСТОЯНИЕМ. Аналогично "предпочитать" (like). И_СОСТОЯНИЕ должно управлять другим событием.

  5. надеяться, ожидать, стремиться к, планировать (hope, expect, aspire, plan):

  6. “We’re expecting [a major eruption],” he said in a telephone interview early today. Мы ожидаем [еще более крупного извержения]" - сказал он сегодня утром в телефонном интервью.
    Once they get that extinguished, they hope that [residents will begin returning to their homes]. Они надеются, что однажды, когда все будет позади, [жители начнут возвращаться в свои дома].
    We aim at [triggering associations that will generate lust for change]. Наша цель – [запустить ассоциации, которые создадут большую жажду перемен].

  7. бояться, ненавидеть, страшиться, опасаться, беспокоиться, испугаться (fear, hate, dread, worry, be afraid):

  8. The agencies fear [they will be unable to crack those codes to eavesdrop on spies and crooks]. Агентства боятся, что [не смогут взломать эти коды для подслушивания шпионов и преступников].
    They were afraid [to stay]. Они боялись [оставатьсяздесь].

  9. нуждаться, требовать, просить (need, require, demand).

  10. быть готовым, подготовиться (be ready, be eager, be prepared).

  11. The young industry’s rapid growth also is attracting regulators eager [to police its many facets]. Быстрый рост новой отрасли также стимулирует желание властей [навести порядок во множестве ее аспектов].
    “There is no reason why we would not be prepared for [an attack]”. "Нет ни одной причины, почему бы нам не быть готовыми [к атаке]".

  12. суметь, не суметь (be able, be unable):

  13. The agencies fear they will be unable [to crack those codes to eavesdrop on spies and crooks]. Агентства боятся, что не смогут [взломать эти коды для подслушивания шпионов и преступников].

Все И_СОСТОЯНИЯ аннотируются вне зависимости от того, являются ли они постоянными или нет на протяжении всего текста, подлежащего аннотированию (см. следующий класс).

  • СОСТОЯНИЕ (STATE):

Состояния описывают положения дел, в которых что-то является или становится истинным. Однако мы можем аннотировать только некоторые их виды:

  1. Состояния, которые опознаваемо (identifiably) изменяются в ходе изложения размечаемого документа.

  2. Например, в первом примере ниже во фразе "лайнер "Аэрофлота" отношение, показывающее, что лайнер эксплуатируется (управляется) "Аэрофлотом", не являются СОСТОЯНИЕМ в нужном нам смысле.
    Наоборот, так как оно является постоянным в рамках всего сюжета, излагаемого в документе, мы выносим его за скобки и не размечаем. С другой стороны, свойства, про которые известно, что они изменяются в ходе событий, о котором говорится в тексте, размечаются как СОСТОЯНИЕ.

    В этих и следующих примерах состояния, которые подлежат разметке, отмечены жирным шрифтом.

    All 75 people on board the Aeroflot Airbus died. Все 75 человек, находившихся на борту лайнера "Аэрофлота", погибли.
    Israel has been scrambling to buy more masks abroad, after a shortage of several hundred thousand gas masks, including those for young children, was discovered. Израиль прикладывал все усилия к тому, чтобы купить противогазы за границей, после того, как была обнаружена нехватка нескольких сотен тысяч противогазов, в том числе детских.
    No injuries were reported over the weekend. Сообщений о травмах не поступало.

  3. Состояния, которые напрямую связаны с темпоральным выражением.

  4. Этот критерий включает все состояния, связанные с элементами разметки типа TIMEX3 посредством TLINK. Здесь приводятся два примера, в которых состояние отмечено жирным шрифтом, а темпоральное выражение, связанное с ним, подчеркнуто.

    James Pustejovsky was CTO for several years Джеймс Пустейовский был руководителем технического отдела LingoMotors в течение нескольких лет
    They lived in U.N.-run refugee camps for 2 1/2 years. Они жили в лагерях ООН для беженцев два с половиной года.

  5. Состояния, введенные в рассмотрение через событие класса И_ДЕЙСТВИЕ, И_СОСТОЯНИЕ или ОТЧЕТ

  6. Состояния выделены жирным шрифтом, а интродуцирующие их события подчеркнуты.

    Hemediated the crisis. Он содействовал урегулированию кризиса.
    Saddam Hussein soughtpeace on another front. Саддам Хусейн с другой стороны стремился к миру.
    Har-Shefi told police that Rabin was a traitor. Хаар-Шефи сказал полиции, что Рабин был предателем.

  7. Предикативные состояния, истинность которых зависит от времени создания текста.

  8. Несмотря на то, что они не связаны явным образом с каким-либо выражением TIMEX3, состояния, выраженные посредством are в нижеследующих примерах, подлежат разметке, так как их истинность зависит от момента времени, в который они были высказаны (DCT — Document Creation Time).
A total of about 3,000 Americans, 3,000 Britons and more than 450 Japanese are in Iraq and Kuwait. Всего в Ираке и Кувейте около трех тысяч американцев, трех тысяч британцев и более четырехсот пятидесяти японцев.
Overall, more than 2 million foreigners are in both countries. Всего в двух странах более двух миллионов иностранцев.

Эта категория также включает в себя количественные утверждения вроде тех, что появляются в финансовых журналах.

Gas prices fell from a twenty-two dollar barrel level down to the fourteen dollars we’re seeing today. Цены на газ упали с двадцати двух долларов за баррель до четырнадцати долларов на сегодняшний день.

Это правило, однако, распространяется только на предикативные состояния. Классифицирующие (sortal) состояния (напр., президент, начальник и т.п.) не размечаются.

Отметим, что в класс СОСТОЯНИЕ не входят события, которые можно разметить как И_СОСТОЯНИЕ.

  • ПРОИСШЕСТВИЕ (OCCURRENCE):

В этот класс входят все оставшиеся виды событий, описывающие что-либо происходящее или случившееся в мире. Несколько примеров для иллюстрации:

The Defense Ministry said 16 planes have landed so far with protective equipment against biological and chemical warfare. Министерство обороны сказало, что 16 самолетов с наборами индивидуальной защиты от биологического и химического оружия уже приземлились.
Mordechai said all the gas masks from abroad would arrive soon and be distributed to the public, adding that additional distribution centers would be set up next week. Мордехай сказал, что все противогазы из-за границы скоро прибудут и будут розданы населению. Он добавил, что дополнительные центры раздачи откроются на следующей неделе.
Two moderate eruptions shortly before 3 p.m. Sunday appeared to signal a larger explosion. Два несильных толчка около трех часов дня в воскресенье стали сигналом к более масштабному извержению.

Несколько примеров из финансовых журналов:

RMS said it had a loss of $ 158,666, or 10 cents a share, in the third quarter, compared with a year-earlier loss of $ 29,956, or two cents a share. RMS сказала, что в третьем квартале несет убытки в 158 666 долларов, или 10 центов на акцию, по сравнению с убытками прошлого года в 29 956 долларов, то есть 2 цента на акцию.
Ralston said its restructuring costs include the phase-out of a battery facility in Greenville, N.C.... Ральстон сказал, что расходы на реструктуризацию включают постепенное свертывание аккумуляторной станции в Гринвилле, штат Северная Каролина…
Its cereal division realized higher operating profit on volume increases, but also spent more on promotion. Отдел злаков достиг увеличения текущей прибыли за счет роста объема продукции, но также повысил расходы на рекламные мероприятия.

c. Основа (Stem) Необязательный атрибут. Атрибут может использоваться в качестве контейнера для псевдоосновы синтаксической вершины события.

Оригинал: http://www.timeml.org/publications/timeMLdocs/annguide_1.2.1.pdf.

Перевод: Мария Кормалева.



[1] Формально простыми авторы называют события, состоящие из одного слова (примеры: erupted, strike, shortage). События, выраженные двумя и более словами (be prepared, take into consideration) названы формально сложными.

[2] В английском языке фразовый глагол — это конструкция, состоящая из глагола и предлога либо наречия и составляющая одну неделимую лексическую единицу (примеры: back away, be out, catch up, check in и т.д.)

[3] В оригинале «some sort of light predicate».

[4] Matrix verb, основной глагол в главном предложении.