MM_18_HW_Методы структурной лингвистики_S


Методы структурной лингвистики
Вопросы.
Каковы отличительные черты структурной лингвистики?
В чем суть компонентного анализа?
Как в компонентном анализе выделяются дифференциальные признаки?
Как с помощью компонентного анализа можно описать категорию падежа?
Чем интегральные признаки отличаются от дифференциальных?
Выберите любое существительное. Опишите его значение с помощью интегральных и дифференциальных признаков.
Что такое семантические примитивы?
В чем суть метода НС? В чем его преимущества и недостатки?
На каких уровнях языка может применяться дистрибутивный анализ?
В чем отличие дополнительного и контрастного распределения? О чем они свидетельствуют?
На каком основании лингвистические единицы могут объединяться в классы?
1. Общее понятие о структурной лингвистике.
Структурная лингвистика — языковедческая дисциплина, предметом которой является язык, изучаемый с точки зрения своего формального строения и организации его в целом, а также с точки зрения формального строения образующих его компонентов как в плане выражения, так и в плане содержания. Складывается структурное направление в языкознании, в котором язык начинает рассматриваться прежде всего как одна из знаковых систем, и на его исследование распространяется семиологический / семиотический принцип, требующий учитывать при анализе каждого из элементов знаковой системы те его признаки, благодаря которым он оказывается дифференцирован от всех других элементов данной системы и сохраняет тождество самому себе во всех его индивидуальных реализациях, во всех возможных вариантах.
Язык предстает как сложная многоуровневая система, включающая в себя множество взаимосвязанных и взаимообусловленных дискретных элементов (и ряд взаимосвязанных, образующих иерархию в рамках целого подсистем, которые включают в свой состав элементы определенного рода). Преимущественное внимание со стороны представителей этих направлений уделяется не столько субстанции языковых элементов, сколько их реляционным характеристикам, которые они получают, функционируя в структуре языка как члены отношений и зависимостей. Язык сводится в большей или меньшей степени к структуре, т.е. сети отношений между ее элементами. Объявляется зависимость языкового элемента от системы в целом, от его места по отношению к другим элементам и к языковому целому. Дифференциальное содержание (совокупность различительных признаков) элемента выявляется через проверку его противопоставлений (оппозиций и контрастов) другим элементам либо в парадигматическом классе, либо в синтагматической последовательности.
Анализ текста / высказывания в качестве исходного материала проводится с целью: а) выделения в нем обобщенных инвариантных единиц (фонем, морфем, схем предложений), соотносящихся с конкретными речевыми сегментами; б) определения границ варьирования языковых единиц при условии сохранения ими самотождественности; в) установления правил перехода от языковой системы (от глубинного представления) к речевой реализации (к поверхностной структуре). Статическая структурная лингвистика стала потом базой для формирования динамической генеративной лингвистики (прежде всего порождающей трансформационной грамматики Н. Хомского), для первоначальной разработки и решения задач в области машинного перевода, для развития новых областей прикладной лингвистики, для возникновения структурной типологии языков. В структурном языкознании сформировался ряд строгих методов, предназначенных для синхронического описания языка. Лингвисты вновь обратились к принципу логицизма, стали использовать достижения новой (реляционной) логики и прежде всего такие дисциплины, как логический синтаксис, а затем и логическая семантика. Благодаря структурализму в языкознание стали проникать математические методы исследования (математическая логика, теория множеств, топология, теория алгоритмов, теория графов, теория вероятностей, теория информации, математическая статистика и т.д.).
2. Метод компонентного анализа
Метод компонентного анализа был развит Н. С. Трубецким применительно к фонемам и в силу своей эффективности и универсальности распространился на исследование грамматических и затем лексических значений.
Признаки для описания выделяются на основании сопоставления однородных единиц языка. Так, при сопоставлении фонемы <д> и <т> различаются по единственному признаку - звонкости - глухости; все остальные признаки у них общие, интегральные. Напротив, для фонем <д> и <б> признак звонкости-интегральный. Последовательно сопоставляя фонему, например <д>, с другими фонемами - <н>, <д’>, <з>, выделяем дифференциальные признаки неназальности, твердости, взрывности, совокупностью которых и определяется фонема <д>, представляющая собой со структурной точки зрения пучок дифференциальных признаков.
На материале грамматических значений метод компонентного анализа впервые применен Р. О. Якобсоном для описания категории падежа русских существительных .
Описание шести падежей достигается с помощью трех предложенных ученым семантических признаков: направленности, объемности и периферийности. Признак направленности присущ винительному и дательному падежам, значение которых всегда предполагает указание действия на объект (писать письмо, подарить товарищу и т. п.), тогда как для остальных падежей этот признак необязателен. Признак объемности указывает на границы обозначаемого предмета, подчеркивает, что объем содержания предмета, выражаемый, в частности, родительным падежом, меньше общего объема обозначаемого предмета (ср.: кусок хлеба, стакан чаю и т. п.). Другое свойство объемности заключается в невозможности падежа указывать на отсутствие предмета и характерно для предложного падежа. Семантический признак периферийности присущ дательному и творительному падежам, поскольку суть этого признака заключается в дополнительной неглавной информации, выражаемой им. Описание системы русского падежа может быть представлено в виде схемы (рис. 1). Экономность, компактность и наглядность описания предмета исследования с помощью компонентов (признаков) достигается за счет того, что их число меньше числа описываемых явлений (в приведенном примере тремя признаками непротиворечиво и исчерпывающе описывается шесть грамматических явлений). Сусов, И.П. История языкознания. Тверь, 1999. С.138
Такие языковые единицы, как слова, могут исследоваться с помощью компонентного анализа в отдельности и лексическими группами. Описание лексических групп строится путем выделения в содержании входящих в них единиц компонентов, с помощью которых одни слова в группе различаются между собой, другие отождествляются.
Описание значений слов, образующих ту или иную лексическую группу, строится обычно в виде таблицы, в которой по вертикали располагаются анализируемые слова, а по горизонтали - названия семантических признаков, используемых для компонентного анализа. На пересечении слов и названий признаков ставятся знаки + (если признак присущ значению слова) или - (если признак в значении слова отсутствует).
Так, например, группа существительных, обозначающих чувства, может быть описана посредством следующих семантических признаков: 1) первичность (непосредственная реакция на внешнее раздражение); 2) вторичность (эмоция возникает в результате предшествующих эмоций); 3) латентность (скрытая форма, подготавливающая разрядку); 4) эксплозивность (взрывная форма, которой предшествуют латентные эмоции); 5) пассивность протекания эмоций; 6) активность протекания эмоций; 7) контролируемость эмоций сознанием; 8) неконтролируемость эмоций; 9) длительное протекание эмоций; 10) кратковременное протекание эмоций. Рассмотрим на конкретном примере этот метод. Возьмем для анализа слово «журнал». Сначала, надо найти слово или словосочетание, обозначающее род вещей, видом которого является журнал. Такое слово - периодическое издание.
1. Значение этого общеродового понятия (гипероним) будет первым семантическим компонентом, входящим в дефиницию слова «журнал». Он отображает общие признаки журнала с другими изданиями такого рода (2 признака = издание + периодичность). Эти общие признаки называются интегральными семантическими признаками.
2. Ищем все слова, обозначающие другие виды периодических изданий и выявляем те признаки, по которым журналы отличаются от других видов периодики. Такие признаки называют дифференциальными семантическими признаками.
Помимо журналов, периодическими изданиями являются газеты, бюллетени, каталоги. От газет журналы отличаются тем, что они сброшюрованы. Если печатное издание не сброшюровано, оно не является журналом. От бюллетеня и каталога журнал отличается по другим признакам, относящихся не к оформлению издания, а к его содержанию. Например, каталоги создают для публикации данных о товаре. Таким образом, толкование слова «журнал» включает, кроме интегральных признаков, 2 дифференциальных. Для журнала это компоненты, характеризующие его со стороны внешнего вида и со стороны содержания.
Метод компонентного анализа активно развивается за рубежом. Существуют различные теории композиционной семантики (ученые Катц и Фодор - родоначальники, Барбара Патти, Анна Вежбицкая и др.). например, Вежбицкая исходит из того, что значения всех слов во всех языках могут быть описаны с помощью одного и того же ограниченного набора элементов, неразложимых как атомы в физике, т.е. семантических примитивов: многие местоимения, числительные, глаголы (делать, мочь, думать, говорить, знать, иметь), размеры (большой, маленький), наречия (где, после) и т.д.
Это направление развило идею философов и математиков Декарта, Лейбница, физика Ньютона, которые пытались разработать особенный язык смысла, посредством которого могут быть истолкованы значения всех слов.
В основном, для метода компонентного анализа выделяется тезис, что «смысл предложений есть сумма смыслов входящих в него слов».
3. Метод семантических падежей (падежная грамматика, ролевая грамматика)
Падежная грамматика («ролевая грамматика») — метод описания семантики предложения как системы семантических валентностей, через связи «главного глагола» с ролями, диктуемыми значением этого глагола и исполняемыми именными составляющими, например глагол «дать» требует ролей («падежей») дающего ( HYPERLINK "http://tapemark.narod.ru/les/017b.html" агенса), адресата и объекта передачи. П. г., возникла в рамках трансформационной порождающей грамматики в конце 60х гг. 20 в. Ее автор, Чарльз Филмор, принял гипотезу компонентной структуры значения и идею последовательного разложения смысла слова на более простые компоненты вплоть до семантических примитивов или атомов смысла. Разделяя общепринятые взгляды на аргументную структуру предиката, он приходит к выводу, что необходимо указывать не только число аргументов данного предиката, но и их семантическое содержание, т.е. роли, которые также называют семантическими падежами. Ч. Филмор выделяет следующие роли:
1. агент - одушевленный инициатор действия2. объект - вещь, являющаяся объектом действия3. контрагент - сила, против которой направлено действие4. адресат - лицо, для которого совершается действие5. пациент - вещь, которая испытывает эффективность действия6. результат7. инструмент - физическая причина действия/ стимул8. источник - исходное состояние объекта до действия.Теория семантических падежей и семантических словарей развилась в московской семантической школе, которая создала модель «текст - смысл - текст» и в частности толковый комбинаторный словарь современного русского языка. Для такого словаря был разработан аппарат лексических функций, близких по смыслу аппарату семантических падежей Филмора.

4. Дистрибутивный анализ
Дистрибутивный анализ (от лат. distrĭbuĕre — распределять, разделять) — метод исследования языка, основанный на изучении окружения (дистрибуции, распределения) отдельных единиц в тексте и не использующий сведений о полном лексическом или грамматическом значении этих единиц.
Первоначально Д. а. применялся главным образом в фонологии и морфологии. Основные принципы Д. а. были сформулированы Л. Блумфилдом в 20х гг. 20 в., а затем развиты в 30—50х гг. в работах З. Харриса и других представителей дескриптивной лингвистики. Однако отдельные экспериментальные приёмы, вошедшие в состав Д. а., были известны значительно раньше (Ш. Балли, О. Есперсен, Л. В. Щерба и другие).Для Д. а. характерен «дешифровочный» подход к объекту: лингвистическое описание мыслится как результат применения к текстам конкретного языка упорядоченного набора универсальных процедур, которые должны автоматически приводить к открытию структуры этого языка. Помимо текстов исследователь может пользоваться суждениями информанта (в частности, своими собственными, если он является носителем изучаемого языка) о правильности — неправильности предъявляемых ему языковых объектов и о тождестве — различии их значений.
Канонический Д. а. выполняется следующим образом. Сначала текст делится (сегментируется) на элементарные текстовые единицы — фоны (отдельные звуки) и морфы (минимальные последовательности фонем, имеющие значение). Следующей ступенью Д. а. является идентификация — объединение множества текстовых единиц в одну единицу языка (фонему или морфему). Две текстовые единицы принадлежат одной и той же единице языка, если они находятся в дополнительном распределении, т. е. никогда не встречаются в одних и тех же окружениях (таковы, например, закрытый и открытый варианты фонемы /е/ в словах «семь» и «шест»), или в свободном чередовании, т. е. встречаются в одних и тех же окружениях без различия в значениях (таковы окончания творительного падежа ей и ею в словоформах типа «землёй» — «землёю»). Две текстовые единицы принадлежат разным единицам языка, если они находятся в контрастном распределении, т. е. встречаются в одних и тех же окружениях, но с различием в значении (таковы звуки [т] и [д] в словах «том» и «дом»). Выделенные таким образом языковые единицы объединяются в классы с помощью экспериментальной техники субституции (замещения). Разные языковые единицы относятся к одному и тому же классу, если они способны замещать друг друга в одних и тех же окружениях. Так, «диагностическим» контекстом для прилагательных русского языка является положение перед словами типа «дом»: ср. «большой (красный, кирпичный, пятый) дом». Возможность замещения прилагательного в контексте слов типа «очень» даёт подкласс качественных прилагательных, ср. «очень большой (красный)», а возможность замещения в контексте слов типа «двадцать» — подкласс порядковых прилагательных, ср. «двадцать первый (пятый)».В рамках Д. а. Ю. Д. Апресян выделяет следующие техники:
1) Добавление элементов к данной форме.
2) Опущение элементов из данной формы.
Например, можно опустить косвенное дополнение, которое менее тесно связано с глаголом, чем прямое; прямое же дополнение опускать нельзя: «Мартин причинил боль», но не «Мартин причинил мне».
3) Перестановка элементов данной формы.
Так, возможность перестановки двух простых предложений в составе сложного указывает на наличие связи сочинения между ними, а невозможность такой перестановки свидетельствует о подчинительном характере этой связи.
Им можно, а вам нельзя. Вам нельзя, а им можно.
НО: Она подумала, что собака убежала. Собака убежала, что она подумала.
4) Субституция (замена) элемента другим элементом.
Для построения классов (частей речи, словоформ) используется принцип субституции: два элемента входят в один класс, если они способны замещать друг друга в одних и тех же окружениях без нарушения правильности данной фразы. Два элемента x1 и x2 считаются эквивалентными, если для любой правильной фразы вида A1x1A2 существует правильная фраза вида A1x2A2, и наоборот.
В ходе применения Д. а. его общие основания были уточнены на базе теории множеств, результатом чего явилась теоретико-множественная концепция языка. В дополненном и уточнённом виде Д. а. применялся для исследования всех уровней языка, включая синтаксис и семантику; в целом он привёл к осознанию важности экспериментирования с языковым материалом и усовершенствованию техники лингвистического эксперимента.
5. Метод непосредственных составляющих (НС).
Метод НС - метод представления словообразовательной структуры слова и синтаксической структуры словосочетания или предложения в виде иерархии вложенных друг в друга элементов. Его основные принципы были сформулированы Л. Блумфилдом в 20х гг. 20 в., хотя сходные идеи высказывались ранее Ф. де Соссюром. Впоследствии метод НС разрабатывали Р. Уэллс, З. З. Харрис, Ч. Ф. Хоккет и другие американские лингвисты. Представление синтаксической структуры предложения в виде иерархии непосредственных составляющих используется в различных вариантах в формальных моделях языка, в частности в генеративной лингвистике Н. Хомского. В европейской и отечественной традициях к методу НС близок способ представления синтаксической структуры предложения с помощью деревьев зависимостей.
В лингвистической грамматике, составля́ющая (англ. constituent) — структурная единица (отрезок) предложения, целиком составленная из более тесно связанных друг с другом составляющих меньшего размера. Составляющая, включающая более одного слова, называется группой (англ. phrase), а слово, соответствующее корневому узлу в дереве зависимостей, описывающем группу, — вершиной (англ.head) группы.Метод НС основан на допущении, что всякая сложная единица языка или текста складывается из двух более простых и линейно не пересекающихся единиц — её непосредственно составляющих (НС). Последние, в свою очередь, могут дробиться на ещё более мелкие НС и т. д., вплоть до элементарных (неделимых). Границы между НС всегда проводятся так, чтобы получающиеся части были максимально независимы друг от друга, т. е. способны к самостоятельному употреблению и вне данной конструкции. Например, правильное членение на НС слова «исподнизу» — (испод) (низу) с дальнейшим ((ис) (под)) ((низ) (у), а не (ис) (поднизу) или (исподниз) (у), поскольку части «поднизу» и «исподниз» как самостоятельные единицы языка не существуют. При членении на НС словосочетания или предложения применяется ещё один принцип: одна из НС должна быть ядром членимой конструкции (представлять всю конструкцию в её внешних синтаксических связях), а другая — маргинальным элементом. В именной группе «мой брат» ядром является существительное, маргинальным элементом — определение; в глагольной группе «написать статью» ядро — глагол, а маргинальный элемент — именная группа. В соответствии с обоими указанными принципами предложение «Мой брат за день написал большую статью» членится на НС (с упрощениями) следующим образом (в скобки заключаются маргинальные элементы): ((Мой) брат) ((за (день)) (написал ((большую) статью))). Содержательно это членение соответствует разбиению основного состава предложения на группу подлежащего и группу сказуемого, с выделением в последней группы обстоятельства (за день) и остающейся части глагольной группы (написал большую статью) и т. д.
Метод НС используется для получения синтаксической информации и основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение - отношение подчинения; 2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.
Некоторые предпосылки метода НС являются чересчур жёсткими. Существуют слова и конструкции, которые естественно членятся не на две, а на три части: (вз) (морь) (е), (дом) (и) (сад). НС не обязательно вкладываются друг в друга, а могут и пересекаться, например: «такой интересный, что все заслушались», где НС «такой интересный» пересекается с НС «такой, что все заслушались». С точки зрения метода НС оказываются неразличимыми многие конструкции с явно различной синтаксической структурой, ср. субъектные конструкции типа «развитие событий» и объектные конструкции типа «изучение событий».
Тем не менее разработанный в рамках метода НС способ представления синтаксической структуры предложения в виде иерархии НС, благодаря своей относительно лёгкой формализуемости, оказался жизнеспособным и был освоен и развит в формальных моделях языка (Н. Хомский, В. Ингве, И. Бар-Хиллел и в особенности А. В. Гладкий, который предложил комбинировать структуры составляющих со структурами зависимостей). В 60х гг. этот способ стал применяться в системах автоматического перевода для синтаксического анализа и синтеза предложений (свёртывания и развёртывания по НС).

Приложенные файлы

  • docx 8040287
    Размер файла: 52 kB Загрузок: 0

Добавить комментарий