Математическая энциклопедия

Аналитическая Модель Языка

Анализирующая модель языка,- один из типов математич. конструкций, используемых в математической лингвистике для описания строения естественных языков. Эти конструкции служат для формального моделирования основных категорий лингвистики, а также самого процесса лингвистич. исследования, иначе говоря — для получения по нек-рым совокупностям "неупорядоченных" данных о языке (точнее, о речи) тех или иных сведений о строении механизма языка, т. е. о его грамматике в широком смысле слова. "Работа" такой модели не всегда носит характер эффективного построения, поскольку совокупность исходных данных может не быть конструктивным объектом; в принципе это не уменьшает значения таких моделей. В наиболее полно разработанных А. м. я. в качестве совокупности исходных данных выступает объект, моделирующий множество грамматически правильных предложений естественного языка, а именно нек-рый формальный язык в заданном алфавите (словаре) . Если — язык в словаре и то говорят, что цепочка замещаема на цепочку уотносительно если каждая из двух цепочек и узамещаема на другую относительно то говорят, что хи у взаимозамещаемы относительно Понятие взаимозамещаемости имеет простой лингвистич. смысл: если понимается как множество грамматически правильных предложений нек-рого естественного языка, то взаимозамещаемые цепочки представляют собой "синтаксически эквивалентные", т. е. выполняющие одни и те же синтаксич. функции, словосочетания. В частности, если односимвольная цепочка а(в лингвистич. интерпретации — слово) взаимозамещаема с цепочкой хдлины то хявляется "потенциальной составляющей", т. е. может входить в лингвистически естественные системы составляющих грамматически правильных предложений данного языка (см. Синтаксическая структура);в этом случае цепочку хназ. конфигурацией 1-го ранга языка Lс результирующим а. Так, для русского языка цепочку "равномерно непрерывная" можно считать конфигурацией 1-го ранга с результирующим "непрерывная". Однако конфигурациями 1-го ранга не исчерпываются все "потенциальные составляющие": напр., словосочетание "непрерывная функция" не является конфигурацией 1-го ранга, т. к. на него замещаемы только такие слова, как "функция", "производная", ..., но само оно ни на одно из этих слов не замещаемо ("f(x) есть равномерно непрерывная функция" — правильное предложение, а f(x) есть равномерно функция" — нет). Поэтому вводится следующее определение: если есть натуральное число и для каждого определено понятие конфигурации языка ранга то цепочка длины наз. конфигурацией ранга r языка Lс результирующим а, где если: а замещаема на хотносительно если не содержит вхождений конфигураций рангов, меньших г, перекрывающихся с выделенным вхождением х, но не содержащихся в нем целиком, то В русском языке словосочетание "непрерывная функция" можно считать конфигурацией 2-го ранга с результирующим "функция" (а также, напр., "производная"). Можно показать, что в нек-ром смысле язык вполне определяется совокупностью своих конфигураций. Конфигурационная модель принадлежит к так наз. синтагматическим А. м. я., предназначенным для описания отношений между элементами отрезков речи (в лингвистике такие отношения наз. синтагматическими). Другой класс А. м. я. составляют парадигматические модели, предназначенные для описания парадигматич. отношений, т. е. отношений между элементами языка в его системе. В таких моделях обычно строятся те или иные отношения на словаре, часто (но не всегда) являющиеся отношениями эквивалентности. В частности, с помощью парадигматич. А. м. я. строятся формальные аналоги традиционных лингвистич. категорий таких, как часть речи, падеж, род, фонема и т. п. "Исходным материалом" во многих парадигматич. А. м. я. также служит множество грамматически правильных предложений; в ряде моделей этого типа используется понятие замещаемости. Простейшее из получаемых таким образом отношений эквивалентности — ограниченное словарем отношение взаимозамещаемости; классы эквивалентности по этому отношению наз. семействами. Если ввести еще одно отношение на словаре, интерпретируемое как "быть формами одного слова" (точнее, одной лексемы; в таком отношении находятся, напр., слова "предел" и "пределом", "число" и "числу"; при этом производится идеализация — считается, что слово может быть формой только одной лексемы; соответствующие классы эквивалентности наз. окрестностями), то с помощью указанных двух отношений удается ввести нек-рые другие классификации, к-рые можно рассматривать как приближения к формальным аналогам понятия части речи и других традиционных грамматических понятий, в частности понятий падежа и рода существительного. Последние два понятия являются объектом особенно интенсивных исследований; для их формализации предложен ряд моделей, основывающихся на понятии грам-матич. правильности, а также моделей иного характера. Имеется, в частности, модель, в к-рой каждый падеж трактуется как множество "одинаково управляемых" форм существительных, а каждый род — как множество "одинаково управляющих" существительных. Исходными данными для определения падежа служат в этой модели словарь, множество окрестностей, множество существительных и бинарное отношение "потенциального подчинения" на словаре: апотенциально подчиняет b, если в нек-ром "лингвистически естественном" дереве подчинения (см. Синтаксическая структура).грамматически правильного предложения данного языка из к.-л. вхождения аидет дуга в нек-рое вхождение b;для определения рода добавляются еще нек-рые исходные данные аналогичного характера. Модели, основанные на "потенциальном подчинении" или иных понятиях, относящихся к деревьям, позволяют, видимо, дать более адекватную формализацию традиционных грамматич. категорий, чем модели, имеющие дело только с цепочками, поскольку в "древесных" моделях синтаксич. отношения отделены от линейных (ср. Граммаmика трансформационная). Математич. аппарат, используемый при построении А. м. я., обычно сравнительно несложен. Для нек-рых моделей он сводится к простейшим понятиям теории множеств (такие модели часто наз. теоретико-множественными; иногда это назв. распространяют на все А. м. я.), в других случаях используются алгебраич. понятия, в особенности понятия теории полугрупп и алгебры бинарных отношений (в связи с чем теорию А. м. я. иногда наз. алгебраической лингвистикой). Лит.:[1] Кулагина О. С., "Проблемы кибернетики", 1958, вып. 1, с. 203-14; [2] Успенский В. А., "Бюллетень Объединения по проблемам машинного перевода", 1957, №5, с. 11 -18; [3] его же, "Вопросы языкознания", 1964, №6, с. 39-53; 14] Маркус С., Теоретико-множественные модели языков, пер. с англ., М., 1970; [5] Ревзин И. И., Метод моделирования и типология славянских языков, М., 1967; [6] Гладкий А. В., "Вопросы языкознания", 1969, № 2, с. 110-23; [7] его же, Формальные грамматики и языки, М., 1973. А. В. Гладкий.



ScanWordBase.ru — ответы на сканворды
в Одноклассниках, Мой мир, ВКонтакте