Окремі аспекти квантитативних досліджень української мови
DOI: http://dx.doi.org/10.30970/uam.2019.27.1063
Анотація
С таттю присвячено окремим аспектам статистичних досліджень.
Коротко описано необхідність використання таких методів
у лінгвістиці та охарактеризовано основні напрями їхнього засто-
сування, до яких належать: різноманітні обчислення кількости тих чи тих
лінгвальних явищ; побудова на основі обчислених кількісних даних сто-
хастичних моделей мовних явищ; перевірка гіпотез про різні лінгвальні
явища статистичними методами; впровадження одержаних результатів
у різні галузі, що пов’язані з використанням та вивченням природних
мов. Зазначено, що кожну лінгвальну одиницю досліджують як ком-
поненту мовної системи. Зокрема, це її будова та належність до грама-
тичного класу, лексична та синтаксична сполучуваності, місце одиниці
в мовній системі і її підсистемах та накладені на неї мовною системою об-
меження (наприклад, відсутність деяких словозмінних форм іменників,
відсутність ступенів порівняння прикметників і прислівників, неповна
дієслівна парадигма і под)., семантичні особливості тощо. Підкреслено,
що проведення нових досліджень над наявними та новими збірками тек-
стів дає змогу як підтвердити раніше виявлені, так і визначити нові ста-
тистичні параметри та закономірності будови текстів, структурних осо-
бливостей різних мов. Дослідження такого типу є основою статистичної
типології текстів та мов. Виокремлено такий напрям статистичних до-
сліджень, як атрибуція текстів (встановлення авторства текстів). Подано
результати окремих статистичних досліджень творів Василя Стефаника,
Михайла Яцкова, Ліни Костенко та Петра Карманського, які здійснено
на кафедрі прикладної лінгвістики Національного університету «Львівська політехніка». Для вказаних творів обчислено частотність символів,
їхню милозвучність, визначено можливий мінімальний обсяг вибірки
щодо обсягу всіх текстів автора. Стверджено, що таку вибірку необхідно
формувати випадковим вибором фраґментів тексту з усіх творів автора.
Перевірено й одержано неґативний результат стосовно гіпотези про те,
що частотність символів у творах автора може бути індикатором автор-
ства. Для творів В. Стефаника та М. Яцкова статистично опрацьовано
кількість абзаців у творах, довжину абзаців у реченнях, довжину речень
у словоформах та довжину словоформ. Зроблено висновки.
Ключові слова: лінгвостатистика, українська мова, В. Стефаник, П. Карманський, частотність, квантитативні дослідження.
Коротко описано необхідність використання таких методів
у лінгвістиці та охарактеризовано основні напрями їхнього засто-
сування, до яких належать: різноманітні обчислення кількости тих чи тих
лінгвальних явищ; побудова на основі обчислених кількісних даних сто-
хастичних моделей мовних явищ; перевірка гіпотез про різні лінгвальні
явища статистичними методами; впровадження одержаних результатів
у різні галузі, що пов’язані з використанням та вивченням природних
мов. Зазначено, що кожну лінгвальну одиницю досліджують як ком-
поненту мовної системи. Зокрема, це її будова та належність до грама-
тичного класу, лексична та синтаксична сполучуваності, місце одиниці
в мовній системі і її підсистемах та накладені на неї мовною системою об-
меження (наприклад, відсутність деяких словозмінних форм іменників,
відсутність ступенів порівняння прикметників і прислівників, неповна
дієслівна парадигма і под)., семантичні особливості тощо. Підкреслено,
що проведення нових досліджень над наявними та новими збірками тек-
стів дає змогу як підтвердити раніше виявлені, так і визначити нові ста-
тистичні параметри та закономірності будови текстів, структурних осо-
бливостей різних мов. Дослідження такого типу є основою статистичної
типології текстів та мов. Виокремлено такий напрям статистичних до-
сліджень, як атрибуція текстів (встановлення авторства текстів). Подано
результати окремих статистичних досліджень творів Василя Стефаника,
Михайла Яцкова, Ліни Костенко та Петра Карманського, які здійснено
на кафедрі прикладної лінгвістики Національного університету «Львівська політехніка». Для вказаних творів обчислено частотність символів,
їхню милозвучність, визначено можливий мінімальний обсяг вибірки
щодо обсягу всіх текстів автора. Стверджено, що таку вибірку необхідно
формувати випадковим вибором фраґментів тексту з усіх творів автора.
Перевірено й одержано неґативний результат стосовно гіпотези про те,
що частотність символів у творах автора може бути індикатором автор-
ства. Для творів В. Стефаника та М. Яцкова статистично опрацьовано
кількість абзаців у творах, довжину абзаців у реченнях, довжину речень
у словоформах та довжину словоформ. Зроблено висновки.
Ключові слова: лінгвостатистика, українська мова, В. Стефаник, П. Карманський, частотність, квантитативні дослідження.
Повний текст:
PDFПосилання
- Поки немає зовнішніх посилань.