Из чего состоит любой синтаксический анализ?

  1. Предложение необходимо разделить на части, меньшие по размеру, чем само предложение
  2. Необходимо установить отношение между составными частями предложения
  3. Нужно установить формальные (то есть чёткие и имеющие однозначный смысл) критерии выделения частей и отношений

Что такое грамматика зависимостей?

Грамматика зависимостей – один из способов анализа синтаксических отношений, основанный на структурах зависимостей. Основная идея метода:

  • Синтаксические единицы – словоформы
  • Синтаксические отношения – отношения зависимости между словоформами

Грамматика зависимостей в большей степени фокусируется на задаче установления отношений между составными частями предложения и в меньшей – на выделении этих самых составных частей.

Терминологическая справка: лексема, словоформа, парадигма

  • лексема – это слово в том виде, в котором мы его можем видеть в словаре
  • словоформа – лексема в конкретной форме (напр., существительное “кота” в родительном падеже и единственном числе)
  • совокупность всех возможных форм лексемы называется словоизменительной парадигмой

Что такое синтаксическая связь (синтаксическое отношение)?

Основные свойства синтаксических связей, устанавливаемые эмпирически:

  • Связность, неразрывность: в предложении не может быть таких “одиноко стоящих” слов, которые не связаны друг с другом (непосредственно или опосредованно, через другие слова). Слово – минимальная единица синтаксиса, предложение – максимальная.
  • Бинарность: каждое отношение в основном включает в себя по два слова. Синтаксические отношения должны быть бинарными, то есть определяться на множестве пар слов. Этот принцип иллюстрирует тот факт, что в языках обычно на каждое одно сказуемое приходится по одному подлежащему. Даже если кажется, что подлежащих несколько (к примеру, в предложении “Маша и Лена поссорились”), то, скорее всего, это на самом деле одно подлежащее, просто сложное (сочинённое). Так, в вышеозначенном предложении подлежащее точно одно – “Маша и Лена”. Предполагать тернарные (т.е. тройные) отношения нет необходимости.
  • Семантическая связь: чаще всего синтаксические отношения возникают между словами, которые как-то связаны между собой семантически, напр., “определяют” или “дополняют” друг друга.
  • Неравноправность/иерархичность: одно слово в синтаксических отношениях всегда является “главным”, а другое – “зависимым”. Если X определяет Y, то Y уже не может определять X (это свойство называется антисимметричностью). Поэтому такие отношения ещё называют отношениями зависимости. То же самое, что и антисимметричность, но относительно того, что 3 и более синтаксических единиц не могут образовывать замкнутый круг, где A зависит от B, B – от C, а C – от A, называется антитранзитивностью.

Важно отметить, что отношения зависимости далено не всегда устанавливаются между словами, находящимися рядом друг с другом в предложении.

Терминологический ликбез

Главное слово (вершина, ядро, хозяин) – то, что подчиняет себе зависимое слово.

Зависимое слово (слуга) – то, что зависит от главного слова.

Если от главного до зависимого слова на схеме можно дойти не через одну “стрелочку”, а через 2 и более, можно сказать, что главное слово опосредованно подчиняет зависимое.

Описание системы условных обозначений для грамматики зависимостей

Графически синтаксические отношения зависимости обычно изображаются в виде особого подвида графа, называемого деревом (синтаксического подчинения или зависимостей). В дереве не может быть замкнутых путей, есть одна самая главная (корневая) вершина, из которой стрелки выходят, как ветки куста, а также в каждую вершину дерева, кроме корневой, входит ровно по одной стрелочке. Отношения синтаксической зависимости образуют дерево в подавляющем большинстве предложений в естественных языках.

Три принципа, входящих в определение дерева зависимостей:

  1. Принцип единственности корневого узла
  2. Принцип единственности вершины (слово может иметь несколько зависимых, но само всегда зависит только от одной вершины)
  3. Принцип запрета на замкнутый контур

Построение лингвистически адекватного дерева зависимостей

Чтобы построить для предложения лингвистически адекватное (естественное) дерево зависимостей, необходимо для каждой пары словоформ выдвинуть гипотезу о наличии или отсутсвии между ними синтаксической связи, а также направлении этой связи, а потом проверить каждую из них по определённым критериям. То, что выдержит проверку, и есть основа для дерева, так или иначе достоверно отражающего реальное положение вещей в языке. Обычно после такой процедуры остаётся один-единственный вариант дерева, реже - 2, ещё реже – 3, совсем редко – вообще ни одного (такие спорные случаи тоже бывают).

Как установить факт наличия зависимости?

  • по грамматической связанности: синтаксическая связь обычно устанавливается между словами, вместе подчиняющимися одному грамматическому правилу (но не всегда).
  • по линейному порядку: если линейная позиция одного слова в предложении определяется по позиции другого слова, скорее всего, они синтаксически связаны (удобно в языках со строгим порядком слов, но ненадёжно в языках, позволяющих относительно свободный порядок слов).
  • по фонетической слитности: две словоформы, скорее всего, синтаксически связаны, если образуют единый фонетический комплекс, то есть могут использоваться в речи вместе относительно изолированно и произносятся без пауз. Во многих языках такой комплекс характеризуется единым ударением или различием правил чередования на его внешних и внутренних границах. Не является ни надёжным, ни необходимым, ни достаточным для определения синтаксической связи, ибо, как мы помним из предыдущей главы, исследования 1980-х годов показали, что прямой корреляции между просодической и синтаксической структурой нет.

Как отличить вершину от зависимого?

Эндоцентричность (критерий Базелла)

Эндоцентричность (то есть похожесть) – это когда у всей синтагмы (словосочетания) те же грамматические признаки, что и у её главного слова. Но какие именно свойства можно называть грамматическими признаками? Что должно совпадать у вершины и всего словосочетания?

Селективные признаки и связанные понятия

Понятие селективных признаков напрямую связано с термином “селективные (сочетаемостные) свойства”. Селективные свойства языковой единицы (или их синтактика) – это её способность или неспособность сочетаться с другими языковыми единицами в одной речевой цепочке.

Дистрибуция (позиционное распределение) – это множество синтаксических контекстов (мест, позиций в предложении), где та или иная языковая единица может употребляться. Если мы сравниваем между собой две единицы, то отношение между их множествами (пересечение, включение, совпадение, несовпадение и т.д.) тоже будет называться дистрибуцией.

Таким образом, селективный признак – способность или неспособность синтаксической единицы X встречаться с единицей Y.

Синтаксические валентности

Селективные признаки бывают внутренними (способность быть вершинами и присоединять к себе определённые зависимые) и внешними (способность присоединяться к вершинам в качестве зависимых).

Способность присоединять называется активной синтаксической валентностью.

Способность присоединяться называется пассивной синтаксической валентностью и является наиболее показательной.

Критерий морфосинтаксического локуса

Иные критерии

Доказательства центрального положения глагола

существования Бога

Какие недостатки есть у грамматики зависимостей?