Содержание:
- Из чего состоит любой синтаксический анализ?
- Что такое грамматика зависимостей?
- Терминологическая справка: лексема, словоформа, парадигма
- Что такое синтаксическая связь (синтаксическое отношение)?
- Терминологический ликбез
- Описание системы условных обозначений для грамматики зависимостей
- Построение лингвистически адекватного дерева зависимостей
- Доказательства центрального положения глагола
- Какие недостатки есть у грамматики зависимостей?
Из чего состоит любой синтаксический анализ?
- Предложение необходимо разделить на части, меньшие по размеру, чем само предложение
- Необходимо установить отношение между составными частями предложения
- Нужно установить формальные (то есть чёткие и имеющие однозначный смысл) критерии выделения частей и отношений
Что такое грамматика зависимостей?
Грамматика зависимостей – один из способов анализа синтаксических отношений, основанный на структурах зависимостей. Основная идея метода:
- Синтаксические единицы – словоформы
- Синтаксические отношения – отношения зависимости между словоформами
Грамматика зависимостей в большей степени фокусируется на задаче установления отношений между составными частями предложения и в меньшей – на выделении этих самых составных частей.
Терминологическая справка: лексема, словоформа, парадигма
- лексема – это слово в том виде, в котором мы его можем видеть в словаре
- словоформа – лексема в конкретной форме (напр., существительное “кота” в родительном падеже и единственном числе)
- совокупность всех возможных форм лексемы называется словоизменительной парадигмой
Что такое синтаксическая связь (синтаксическое отношение)?
Основные свойства синтаксических связей, устанавливаемые эмпирически:
- Связность, неразрывность: в предложении не может быть таких “одиноко стоящих” слов, которые не связаны друг с другом (непосредственно или опосредованно, через другие слова). Слово – минимальная единица синтаксиса, предложение – максимальная.
- Бинарность: каждое отношение в основном включает в себя по два слова. Синтаксические отношения должны быть бинарными, то есть определяться на множестве пар слов. Этот принцип иллюстрирует тот факт, что в языках обычно на каждое одно сказуемое приходится по одному подлежащему. Даже если кажется, что подлежащих несколько (к примеру, в предложении “Маша и Лена поссорились”), то, скорее всего, это на самом деле одно подлежащее, просто сложное (сочинённое). Так, в вышеозначенном предложении подлежащее точно одно – “Маша и Лена”. Предполагать тернарные (т.е. тройные) отношения нет необходимости.
- Семантическая связь: чаще всего синтаксические отношения возникают между словами, которые как-то связаны между собой семантически, напр., “определяют” или “дополняют” друг друга.
- Неравноправность/иерархичность: одно слово в синтаксических отношениях всегда является “главным”, а другое – “зависимым”. Если X определяет Y, то Y уже не может определять X (это свойство называется антисимметричностью). Поэтому такие отношения ещё называют отношениями зависимости. То же самое, что и антисимметричность, но относительно того, что 3 и более синтаксических единиц не могут образовывать замкнутый круг, где A зависит от B, B – от C, а C – от A, называется антитранзитивностью.
Важно отметить, что отношения зависимости далено не всегда устанавливаются между словами, находящимися рядом друг с другом в предложении.
Терминологический ликбез
Главное слово (вершина, ядро, хозяин) – то, что подчиняет себе зависимое слово.
Зависимое слово (слуга) – то, что зависит от главного слова.
Если от главного до зависимого слова на схеме можно дойти не через одну “стрелочку”, а через 2 и более, можно сказать, что главное слово опосредованно подчиняет зависимое.
Описание системы условных обозначений для грамматики зависимостей
Графически синтаксические отношения зависимости обычно изображаются в виде особого подвида графа, называемого деревом (синтаксического подчинения или зависимостей). В дереве не может быть замкнутых путей, есть одна самая главная (корневая) вершина, из которой стрелки выходят, как ветки куста, а также в каждую вершину дерева, кроме корневой, входит ровно по одной стрелочке. Отношения синтаксической зависимости образуют дерево в подавляющем большинстве предложений в естественных языках.
Три принципа, входящих в определение дерева зависимостей:
- Принцип единственности корневого узла
- Принцип единственности вершины (слово может иметь несколько зависимых, но само всегда зависит только от одной вершины)
- Принцип запрета на замкнутый контур
Построение лингвистически адекватного дерева зависимостей
Чтобы построить для предложения лингвистически адекватное (естественное) дерево зависимостей, необходимо для каждой пары словоформ выдвинуть гипотезу о наличии или отсутсвии между ними синтаксической связи, а также направлении этой связи, а потом проверить каждую из них по определённым критериям. То, что выдержит проверку, и есть основа для дерева, так или иначе достоверно отражающего реальное положение вещей в языке. Обычно после такой процедуры остаётся один-единственный вариант дерева, реже - 2, ещё реже – 3, совсем редко – вообще ни одного (такие спорные случаи тоже бывают).
Как установить факт наличия зависимости?
- по грамматической связанности: синтаксическая связь обычно устанавливается между словами, вместе подчиняющимися одному грамматическому правилу (но не всегда).
- по линейному порядку: если линейная позиция одного слова в предложении определяется по позиции другого слова, скорее всего, они синтаксически связаны (удобно в языках со строгим порядком слов, но ненадёжно в языках, позволяющих относительно свободный порядок слов).
- по фонетической слитности: две словоформы, скорее всего, синтаксически связаны, если образуют единый фонетический комплекс, то есть могут использоваться в речи вместе относительно изолированно и произносятся без пауз. Во многих языках такой комплекс характеризуется единым ударением или различием правил чередования на его внешних и внутренних границах. Не является ни надёжным, ни необходимым, ни достаточным для определения синтаксической связи, ибо, как мы помним из предыдущей главы, исследования 1980-х годов показали, что прямой корреляции между просодической и синтаксической структурой нет.
Как отличить вершину от зависимого?
Эндоцентричность (критерий Базелла)
Эндоцентричность (то есть похожесть) – это когда у всей синтагмы (словосочетания) те же грамматические признаки, что и у её главного слова. Но какие именно свойства можно называть грамматическими признаками? Что должно совпадать у вершины и всего словосочетания?
Селективные признаки и связанные понятия
Понятие селективных признаков напрямую связано с термином “селективные (сочетаемостные) свойства”. Селективные свойства языковой единицы (или их синтактика) – это её способность или неспособность сочетаться с другими языковыми единицами в одной речевой цепочке.
Дистрибуция (позиционное распределение) – это множество синтаксических контекстов (мест, позиций в предложении), где та или иная языковая единица может употребляться. Если мы сравниваем между собой две единицы, то отношение между их множествами (пересечение, включение, совпадение, несовпадение и т.д.) тоже будет называться дистрибуцией.
Таким образом, селективный признак – способность или неспособность синтаксической единицы X встречаться с единицей Y.
Синтаксические валентности
Селективные признаки бывают внутренними (способность быть вершинами и присоединять к себе определённые зависимые) и внешними (способность присоединяться к вершинам в качестве зависимых).
Способность присоединять называется активной синтаксической валентностью.
Способность присоединяться называется пассивной синтаксической валентностью и является наиболее показательной.
Критерий морфосинтаксического локуса
Иные критерии
Доказательства центрального положения глагола
существования Бога