РОЗРІЗНЮВАЛЬНІ КВАНТИТАТИВНІ ПАРАМЕТРИ АВТОРСЬКОЇ МОВИ ТА СТИЛЮ (НА МАТЕРІАЛІ ВЕЛИКОЇ ПРОЗИ ІВАНА ФРАНКА)
Анотація
Статтю присвячено детальному аналізу розрізнювальних кількісних параметрів мови та стилю автора. Таке дослідження проведено вперше для великої прози Івана Франка. На матеріалі електронного корпусу текстів зі зовнішньою та внутрішньою розміткою укладено частотний словник усіх дев’яти українських романів Івана Франка. Його можна розглядати як статистичну комплексну модель стилю І. Франка, а також як мовно-статистичний портрет його великої прози. Отримано такі параметри: обсяг словника лексем, індекси різноманітності, винятковості, концентрації, кількість hapax legomena та їх відсоткову частку у тексті й словнику, кількість слів з частотою 10 і вище та їх відсоткову частку у тексті й словнику. Ці характеристики зіставлено з відповідними даними “Частотного словника сучасної української художньої прози”. Запропоновано новий розрізнювальний статистичний параметр для мови та стилю письменника. Це процентне співвідношення hapax legomena і найчастотнішої лексики. Ця характеристика допомогла з’ясувати і детальніше описати важливі особливості авторського стилю. У перспективі заплановано також обчислити Закон Ціпфа, закон Менцерата-Альтмана, h-point і k-point, розподіл послідовностей частин мови, “температуру” тексту.
Ключові слова: лінгвостатистика, корпус текстів, статистичні параметри, квантитативні характеристики тексту, частотний словник, слововживання, лема (лексема), лексичне багатство словника.
Повний текст:
PDF (English)DOI: http://dx.doi.org/10.30970/vpl.2019.70.9785
Посилання
- Поки немає зовнішніх посилань.