Определение слова «Математическая лингвистика»

Большая советская энциклопедия:

Математическая лингвистика
Математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 50-х годах 20 века в связи с назревшей в языкознании потребностью уточнения его основных понятий. В М. л. используются по преимуществу идеи и методы алгебры, алгоритмов теории (См. Алгоритмов теория) и автоматов теории (См. Автоматов теория). Не являясь частью лингвистики, М. л. развивается в тесном взаимодействии с ней. М. л. называют иногда лингвистические исследования, в которых применяется какой-либо математический аппарат.
Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» — последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Изучение способов математического описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. — теории способов описания синтаксической структуры. Для описания строения (синтаксической структуры) предложения можно либо выделить в нём «составляющие» — группы слов, функционирующие как цельные синтаксические единицы, либо указать для каждого слова те слова, которые от него непосредственно зависят (если такие есть). Так, в предложении «Лошади кушают овёс» при описании по 1-му способу составляющими будут: всё предложение I, каждое отдельное слово и словосочетание С = «кушают овёс» (рис. 1; стрелки означают «непосредственное вложение»); описание по 2-му способу даёт схему, показанную на рисунке 2. Математические объекты, возникающие при таком описании структуры предложения, называются деревом составляющих (1-й способ) и деревом синтаксического подчинения (2-й способ).
Другой раздел М. л., занимающий в ней центр, место,теория формальных грамматик, возникшая главным образом благодаря работам Н. Хомского (См. Хомский). Она изучает способы описания закономерностей, которые характеризуют уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путём построения «формальной грамматики» — абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — так называемая порождающая грамматика, или грамматика Хомского, — упорядоченная система = I, R>, где: V и W — непересекающиеся конечные множества; I — элемент W; R — конечное множество правил вида , где и — цепочки (конечные последовательности) элементов V и W. Если правило грамматики и 1, 2, — цепочки из элементов V и W, то говорят, что цепочка 1 2 непосредственно выводима в из 1 2. Если 0, 1, …, n — цепочки и для каждого i= 1, ..., n цепочка i, непосредственно выводима из i-1, то говорят, что n выводима из 0 в . Множество цепочек из элементов V, выводимых в из I, называется языком, порождаемым грамматикой . Если все правила грамматики имеют вид A, где А — элемент W, называется бесконтекстной, или контекстно-свободной. В лингвистической интерпретации элементы V чаще всего представляют собой слова, элементы W — символы грамматических категорий, I — символ категории «предложение». В бесконтекстной грамматике вывод предложения даёт для него дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного элемента W, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет в числе прочих правила I Sx, у, им Vy, Vy VtySx, y’ вин, Sмyж, ед, вин овёс, Sжен, мн, им лошади, Vtмн кушают, где Vy означает категорию «группа глагола в числе у», Vty — «переходный глагол в числе y», Sx,y,z — «существительное рода х в числе у и падеже z», то приведённое выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей. Формальные грамматики используются для описания не только естественных, но и искусственных языков, в особенности языков программирования.
М. л. изучает также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными (например, множества правильных предложений), производятся формальные построения, дающие некоторые сведения о структуре языка. Приложение методов М. л. к конкретным языкам относится к области лингвистики (см. Языкознание).
Лит.: Хомский Н., Синтаксические структуры, в сборнике: Новое в лингвистике, в. 2, М., 1962; Гладкий А. В.. Мельчук И. А., Элементы математической лингвистики, М., 1969; Маркус С., Теоретико-множественные модели языков, перевод с английского, М., 1970; Гладкий А. В., Формальные грамматики и языки, М., 1973.
А. В. Гладкий.

Рис. 1 к ст. Математическая лингвистика.

Рис. 2 к ст. Математическая лингвистика.

Рис. 3 к ст. Математическая лингвистика.

Математическая энциклопедия:

Математическая дисциплина, предметом к-рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к 50-м гг. 20 в.; она была вызвана к жизни прежде всего внутренними потребностями теоретич. лингвистики, в к-рой к этому времени назрела необходимость уточнения основных понятий, а также задачами, связанными с автоматизацией переработки языковой информации (см. Автоматический перевод). В М. л. широко используются методы теории алгоритмов, теории автоматов и алгебры. Сохраняя свое прикладное значение, М. л. постоянно эволюционирует по пути превращения в теоретическую математич. дисциплину, являющуюся по сути дела одним из ответвлений математич. логики. В то же время круг приложений М. л. расширился — ее методы нашли применение в теории программирования. Лингвистич. концепции, лежащие в основе формальных методов описания строения языка, принадлежат структурной лингвистике. Главнейшая из этих концепций — представление о языке как о "системе чистых отношений", сближающее язык с абстрактными системами, изучаемыми в математике. Это представление конкретизируется в концепции функционирования языка как преобразования нек-рых абстрактных объектов — "смыслов" — в объекты другой природы — "тексты" и обратно. Такая концепция приводит к мысли об изучении указанного преобразования (после уточнения понятий "смысла" и "текста") математич. средствами. Использование этого подхода затруднительно, если пытаться рассматривать преобразование "в целом", ввиду его чрезвычайной сложности, а также ввиду трудности формализации понятия "смысла". Однако содержательные соображения подсказывают расчленение преобразования на этапы. Напр., при одном из наиболее грубых членений нек-рый этап может состоять в переходе от "смыслов" предложений к "синтаксическим структурам без линейного порядка" — наборам элементов предложений, соединенных "синтаксическими связями", но еще не расположенных в линейные последовательности; на следующем этапе получаются линейные последовательности слов, потом они превращаются в цепочки звуков. При более тонких членениях вводятся синтаксич. структуры нескольких уровней, все более отдаляющиеся от "смыслового" и приближающиеся к "текстовому"; "послесинтаксические" этапы также подвергаются дальнейшему расчленению. Такие этапы уже легче описывать математически, уточняя представления об объектах промежуточных уровней и моделируя переходы от одних уровней к другим эффективными отображениями. Правда, рассматриваемое преобразование неоднозначно, и таковы же все или почти все (в зависимости от способа членения) промежуточные этапы; это связано с одной из важнейших особенностей языка — наличием в нем явления синонимии, т. е. возможности выражать одно и то же содержание разными способами. Поэтому приходится строить не детерминированные эффективные системы (алгоритмы), а недетерминированные (исчисления), позволяющие либо для данного объекта нек-рого уровня перечислять отвечающие ему объекты соседнего уровня или объекты (того же уровня), ему синонимичные, либо перечислять множество "правильных" объектов заданного уровня (т. е. таких, к-рые известным регулярным способом сопоставляются объектам предыдущего уровня), либо перечислять множество пар отвечающих друг другу объектов двух заданных соседних уровней (напр., "предложение + его синтаксическая структура") и т. п. Такого рода исчисления известны как грамматики формальные. Одновременно с формальными грамматиками, моделирующими преобразования языковых объектов, возникают конструкции, предназначенные для формального описания самих этих объектов. Кроме того, на множествах объектов одного уровня возникают классификации и отношения, во многом сходные с категориями традиционной грамматики (такими, как часть речи, род, падеж и т. п.) и в ряде случаев совпадающие с ними; без введения таких классификаций и отношений реальное построение формальных грамматик для естественных языков фактически невозможно. Таким образом, можно выделить три аспекта формального описания языка: описание строения языковых объектов различных уровней, описание нек-рых специальных отношений и классификаций на множествах этих объектов и описание преобразований одних объектов в другие, а также строения множеств "правильных" объектов. Этим аспектам отвечают три основных раздела М. л.: 1) разработка и изучение способов описания строения отрезков речи; 2) изучение лингвистически значимых отношений и классификаций на множествах языковых объектов (построенные для этой цели формальные системы обычно называют аналитическими моделями языка);3) теория формальных грамматик. Для описания строения отрезков речи используются синтаксич. структуры, представляющие собой графы или биграфы специального вида, обычно с помеченными вершинами и/или дугами. Лучше всего разработана теория описания "поверхностных" уровней (т. е. наиболее далеких от "смыслового"); на этих уровнях структуры обычно являются деревьями. Интенсивно разрабатываются способы описания более "глубинных" уровней. Для этого, в частности, предложен аппарат т. н. лексических функций, играющих при описании смысловой сочетаемости слов роль, сходную с той, к-рую традиционные категории рода, падежа, числа и т. п. играют при описании синтаксич. сочетаемости. Средств строгого описания "смыслового" уровня пока нет, но многим исследователям представляется вероятным, что на таком пути "последовательного приближения" можно надеяться выработать подход к формальному описанию смысла. Это не исключает и иных подходов; в частности, много исследований посвящено способам выражения в естественных языках предикатов, пропозициональных связок, кванторов, "переводу" с формально-логич. языков на естественные и обратно. Сюда же примыкают работы по конструированию так наз. семантических языков, в к-рых смыслы сопоставляются текстам простыми и строго формальными способами. Аналитич. модели языка важны, в частности, ввиду того, что они позволяют уточнить логич. природу многих понятий и категорий традиционного языковедения. Эти модели не всегда носят характер эффективных процедур, поскольку в них могут входить такие понятия, как (бесконечное) множество грамматически правильных предложений нек-рого языка, считающееся заданным. Однако в ряде моделей все исходные данные представляют собой конечные множества и финитные отношения; в этих случаях входящие в модель процедуры эффективны. К теории аналитич. моделей языка примыкает теория лингвистической д е ш и ф р о в к и: ее предметом является построение процедур, применяемых, подобно аналитич. моделям, к "неупорядоченным" эмпирич. данным о языке, но всегда эффективных и позволяющих получать не только абстрактные определения, но и конкретные сведения о строении конкретных языков (напр., алгоритмы, осуществляющие автоматич. разбиение множества фонем языка на классы гласных и согласных без использования каких-либо сведений о языке, кроме нек-рого достаточно длинного текста). Теория формальных грамматик занимает в М. л. центральное место, т. к. она позволяет моделировать наиболее существенный аспект функционирования языка — переработку смыслов в тексты и обратно — и благодаря этому служит связующим звеном между остальными разделами М. л. По характеру своего аппарата теория формальных грамматик во многом близка к теории алгоритмов и теории автоматов. Более других разработаны те типы формальных грамматик, к-рые служат для характеризации множества грамматически правильных предложений языка и приписывания этим предложениям синтаксич. структур. Предложения при этом моделируются цепочками (словами) в конечном алфавите, элементы к-рого интерпретируются как слова естественного языка (поэтому в М. л. термин "цепочка" предпочитают термину "слово", а алфавит часто называют также словарем), и моделью множества грамматически правильных предложений служит нек-рый формальный язык. К этому типу относятся, в частности, грамматики порождающие. Порождающая грамматика представляет собой по существу частный случай исчисления Поста: она состоит из конечного алфавита, разделенного на две части — основной и вспомогательный алфавиты, конечного множества правил вывода, представляющих собой правила подстановки вида (- цепочки) и одной аксиомы (обычно состоящей из одного вспомогательного символа, называемого начальны м). (Формальный) язык, порождаемый такой грамматикой,- это множество цепочек в основном алфавите, выводимых из аксиомы. Наиболее важный для лингвистич. приложений класс порождающих грамматик — грамматики составляющих, у к-рых каждое правило имеет вид где — цепочки в объединении основного и вспомогательного алфавитов, А — вспомогательный символ и 6 непуста. Грамматика составляющих позволяет естественным образом сопоставлять цепочкам порождаемого ею языка размеченные системы составляющих. Этот класс грамматик наиболее важен и в чисто математич. отношении, т. к. языки, порождаемые грамматиками составляющих, представляют собой простой и весьма важный подкласс класса примитивно рекурсивных множеств. Среди грамматик составляющих в свою очередь особенно важны как в теоретическом, так и в прикладном аспектах грамматики бесконтекстные, у к-рых правила имеют вид где А — вспомогательный символ. К бесконтекстным грамматикам близки грамматики доминационные, также порождающие формальные языки, но сопоставляющие цепочкам этих языков деревья подчинения, и грамматики категориальные, характеризующиеся особым способом задания информации о синтаксич. свойствах слов. Принципиально иной тип формальных грамматик представляют собой грамматики трансформационные;. они служат для осуществления преобразований синтаксич. структур, не "привязанных", вообще говоря, К цепочкам; эти грамматики представляются наиболее перспективными для описания строения естественных языков, т. к. позволяют рассматривать синтаксические и линейные отношения между словами раздельно, что лучше отражает языковую реальность. Теория формальных грамматик наряду с "традиционными" для нее лингвистич. приложениями нашла применение в теории программирования для описания языков программирования и трансляторов. Особенно широко применяются для этих целей бесконтекстные грамматики, но используются и грамматики более общего вида. Лит.:[1] Xомский Н., в кн.: Новое в лингвистике, в. 2, М., 1962, с. 412-527; [2] Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969. А. В. Гладкий.

Смотреть другие определения →


© «СловоТолк.Ру» — толковые и энциклопедические словари, 2007-2020

Top.Mail.Ru
Top.Mail.Ru