Реферат на тему

Застосування математичних методів у мовознавстві


ПЛАН

1. Поняття та історія математичної методики в лінгвістиці.

2. Лінгвостатистика.

3. Застосування математичних теорій.

4. Використана література


1. Поняття та історія математичної методики в лінгвістиці.

Застосування математичного (точніше, кількісного) критерію в мовознавчих дослідженнях відоме з давніх часів. Такі лінгвістичні поняття, як фонетичний закон, продуктивність морфем, критерій спорідненості мов то­що ґрунтувалися певною мірою на кількісних харак­теристиках. Звукові відповідники, що часто фіксу­ються в мові чи декількох споріднених мовах, є законо­мірними на відміну від аномалій, котрі є рідкісними. Ті морфеми, що часто використовуються для творення нових слів, є продуктивними. Спорідненими мовами є такі, які мають більше спільних рис, ніж неспоріднені. Однак раніше математичний критерій використову­вали стихійно і спорадично. Зараз його застосовують свідомо і цілеспрямовано.

Активне використання математичних методів у ви­вченні мови почалося в середині XX ст. Стимулом для цього послужили перспективи машинного перекладу. У процесі обробки текстів для їх уведення в машину бу­ло одержано різноманітні кількісні оцінки окремих фактів мови, які згодом виявилися корисними не тіль­ки для створення математичних моделей мови, а й для лінгвістичної теорії. Оскільки мова — це ймовірнісна, а не жорстко детермінована система, то для її пізнання квантитативні методи, пов'язані з дослідженням час­тотних, ймовірнісних, градуальних та інших нелогіч­них характеристик, не тільки бажані, але й необхідні.

Розрізняють кількісні й статистичні методи. Кіль­кісні методи зводяться до простого підрахунку час­тоти вживання мовних одиниць. Статистичні ме­тоди передбачають використання різних формул для виявлення правил розподілу мовних одиниць у мов­ленні, для виміру зв'язків між мовними елементами, для встановлення тенденцій у розвитку та функціону­ванні мови та для встановлення залежності між якіс­ними й кількісними характеристиками мови.

Математичні методи мають самостійну цінність у дослідженні мови і, крім того, можуть входити як складова частина в інші методи. Останнім часом вико­ристання цих методів до вивчення мовного матеріалу значно зросло, і можна говорити, що в математичній лінгвістиці виокремилися два розділи, або напря­ми, — лінгвостатистика і стилостатистика.


2. Лінгвостатистика.

Основна увага лінгвостатистики звернена на дос­лідження того, що в мові визначається правом вибору мовця, а що зумовлено її іманентною структурою і як ці два параметри кількісно співвідносяться між собою. Виявляється, що одиниці будь-якого мовного рівня ма­ють сталі для певного періоду кількісні показники їх використання. Подібність між членами одного мовно­го колективу полягає не тільки в тому, які мовні оди­ниці (фонеми, лексеми, граматичні форми і синтаксич­ні конструкції) вони використовують, а й у тому, як часто вони їх уживають. Отже, стає зрозуміло, чому нині такого великого поширення набули так звані частотні словники, у яких слова розташовані не за алфавітом, а за спадом частот, тобто першим іде найбільш частотне слово, за ним слово нижче рангом за частотою від пер­шого і т.д. Відомі такі частотні словники: Yosselson H. The Russian Word Count and Frequency Analysis of Grammatical Categories of Standard Literary Russian. — Detroit, 1953; Штейнфельдт Э. А. Частотный словарь современного русского литературного языка. — Таллинн, 1963 (перевидавався в Москві в 1969 і 1973 pp.); Частотный словарь русского языка / Под ред. Л. Н. Засориной. — М., 1977. В Україні в 1981 р. вийшов дво­томний «Частотний словник сучасної української ху­дожньої прози». Частотні словники мають велике практичне значення. На їх основі створюють підруч­ники іноземних мов, тексти яких будуються на най­більш уживаній лексиці, і словники-мінімуми. Якщо зважити на те, що 1100 (за іншими даними — 1000) найбільш частотних слів покриває 80% тексту, то зна­чення частотних словників для лінгводидактики не­оціненне: варто знати 1100 слів і можна розмовляти іноземною мовою, читати й розуміти тексти (значення 20% невідомих слів можна якоюсь мірою визначити за контекстом).

Статистичні закономірності лежать в основі органі­зації словника і тексту будь-якої мови. Американсь­кий дослідник Дж. Ципф дійшов висновку, що існує залежність між числом різних значень одного слова і його відносною частотою вживання. Кількість значен­ня наближається до квадратного кореня від частоти слова: т = -Jf , де т — число значень, а / — відносна частота. Інша закономірність, встановлена Ципфом (у науці вона відома як закон Ципфа), має таке форму­лювання: відношення рангу слова в частотному слов­нику до частотності слова в мові становить постійну величину (константу) rf = с, де г — ранг слова в час­тотному словнику, / — частота слова, с — постійна ве­личина. Слід зазначити, що тісний зв'язок існує також між частотними характеристиками слова в пам'яті та в словнику [Фрумкина 1971: 14 і наст.].

Статистична організація тексту полягає в тому, що покриття тексту різними словами відповідає такій за­кономірності: на початку тексту різних слів більше, а далі їх менше [Пап 1961: 96—100].

Найширше застосовують статистичні методи для визначення семантичної відстані між словами. Най­частіше з цією метою статистичній обробці піддають слова, які сполучаються з аналізованим словом.

На основі статистичних формул, які враховують ви­падки зникнення в мовах слів основного фонду, можна встановити абсолютну хронологію диференціації мов­них сімей (метод глотохронології М. Сводеша, про який уже йшлося).

Стилостатистика — це визначення і характерис­тика стилістичних особливостей окремих творів або авто­рів через кількісні відношення використаних мовних елементів. В основі статистичного підходу до досліджен­ня стилістичних явищ лежить розуміння літературного стилю як індивідуального способу володіння засобами мо­ви. При цьому дослідник абстрагується від питання про якісну значеннєвість обчислюваних мовних елементів, зосереджуючи свою увагу тільки на кількісному аспекті.

Найпростішим різновидом статистичного підходу до вивчення мови письменників або окремих творів є під­рахунок уживаності слів, оскільки багатство словника певним чином характеризує їхню мову. Досить порів­няти такі факти: словниковий запас пересічної людини становить 7—10 тисяч слів, у творах О. Пушкіна вжито 21280 слів, а в російськомовних творах Т. Шевченка — 21548 слів.

Для кожного письменника, як і будь-якого мовця, характерна своя специфічна частотність мовних елемен­тів, іншими словами, кожному авторові притаманні свої улюблені, а тому й частотні слова, словосполучення, фрази, синтаксичні конструкції тощо. Так, скажімо, 56 найчастотніших слів у творах О. Пушкіна покривають 40 відсотків тексту, 1000 слів — 70 відсотків, 8000 — 95 відсотків, інші 13280 слів — усього лише 5 відсот­ків тексту. Саме тому середня частотність використо­вується також для встановлення справжнього авторст­ва виявлених без зазначення автора творів, а також для датування окремих творів того самого автора на основі попередньо проведеного підрахунку середньої частоти вживання ним слів у різні періоди його твор­чості. Специфічними для кожного автора є й рідко­вживані слова.

Як засіб стильової характеристики використовують критерій стабільності середньої частоти найуживані­ших слів. Доведено, що, незважаючи на різні перипетії сюжету в усіх частинах твору, середня частота вжи­вання слів є стабільною. Звідси випливає такий висно­вок: стиль автора можна охарактеризувати певним співвідношенням змінності середньої частоти вживан­ня слова до загальної для певної мови частоти його вживання.

Якщо ж у творі письменника чи його якійсь части­ні є суттєві відхилення вибіркових частот від харак­терної для нього середньої частоти, то це свідчить про зумисне, цілеспрямоване, зумовлене фабулою викорис­тання чи невикористання певних мовних засобів. Як інструмент для визначення випадковості чи суттєвості

У вивченні мовних функціональних стилів засто­совують два різновиди статистики: ймовірнісний і сим­птоматичний. Ймовірнісна статистика допомагає встановити ступінь достовірності одержаних результа­тів, величину й кількість вибірок для аналізу із зада­ною точністю, вибрати об'єктивні критерії для дифе­ренціації різних стилів, визначити відстань між стиля­ми. Симптоматичну статистику застосовують у статистичному описі функціональних стилів, оскільки за її допомогою можна виявити процентне співвідно­шення між різними типами мовних явищ.

Статистичну методику використали вчені відділу структурно-математичної лінгвістики Інституту мово­знавства ім. О. О. Потебні НАН України під керівниц­твом В. С. Перебийніс (див.: Статистичні параметри стилів. — К., 1967, де різні функціональні стилі оха­рактеризовані за частотними параметрами фонем, ти­пів складів, кінцевих афіксів, дієслівних форм, дієслів­ного оточення, сполучників, префіксів і префіксальних словоформ, розділових знаків, а також за розподілом довжини речення).

Крім статистичних методів, у мовознавстві застосо­вують методи теорії інформації, математичної логіки, теорії ймовірностей і теорії множин.



Информация о работе «Застосування математичних методів у мовознавстві»
Раздел: Иностранный язык
Количество знаков с пробелами: 17324
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
70287
0
0

... слів у межах певної частини мови, для яких характерна спільна семантична ознака (збірність, речовинність, зворотність тощо). Лексикографія (грец. Іехікбп — словник і grapho — пишу) — розділ мовознавства, пов'язаний зі створенням словників та опрацюванням їх теоретичних засад. Лёксико-семантична група — тісне об’єднання слів у межах лексико-семантичного поля. Лексико-семантична система — один із ...

Скачать
29367
0
1

... до його втілення засобами мови. З мовознавст­вом і літературознавством (філологією) тісно пов'яза­на герменевтика — мистецтво тлумачення текстів, учення про принципи їх інтерпретації, розуміння. Із природничих наук мовознавство пов'язане з біо­логією, анатомією, фізіологією, психологією, медици­ною, географією, семіотикою, фізикою, математикою, кібернетикою, інформатикою. Ще на початку XIX ст. ...

Скачать
15938
0
0

... дає змогу матеріально обґрунтувати контури мовних союзів, виявити субстратні явища в певній мові, повніше використати то­понімічні й гідронімічні дані в дослідженнях історії мов та їх носіїв (наочно показати шляхи розселення певних етносів). 2. Зіставний метод Будь-який лінгвістичний опис, пов'язаний із вихо­дом за межі однієї мови, передбачає встановлення їх подібностей і відмінностей. Для ...

Скачать
19765
0
0

... ктивніше вивчати й описувати мовні явища. Оскіль­ки результати цього аналізу можна формалізувати, то во­ни можуть бути інтерпретовані мовою математики. Практичне застосування дистрибутивний аналіз знайшов не тільки в лінгвістичних дослідженнях, а й у машинному перекладі (перш ніж перекласти речення з багатозначним словом чи омонімами, машина на основі їх оточення повинна визначити значення цих ...

0 комментариев


Наверх