Кількісний аналіз систем письма: алфавіт нко

Andrij ROVENCHAK


DOI: http://dx.doi.org/10.30970/uam.2019.27.1066

Анотація


Р еґіон Західної Африки для вивчення походження й розвитку писем-
ности цікавий тим, що протягом XIX–XX століть тут створили низку
писемностей для місцевих мов, насамперед – із родини манде (сила-
барії вай, менде, кпелле, лоома, бамана). У 1949 р. ґвінейський просвітник
Соломана Канте розробив алфавіт нко для мов манден, що належать до
родини манде і включають, зокрема, мови бамана, джула та манінка. Назва
«нко» походить від фрази N ko «я кажу» мовами манден. Переважно цю
писемність використовують для мови манінка в Ґвінеї (манінка-морі), яка
є рідною для понад 3,5 млн осіб у Ґвінеї, Малі та Сьєрра-Леоне. Алфавіт нко
також поширений у Ліберії, Кот-д’Івуарі й у діяспорі (переважно в Ніґерії та
Єгипті), а кількість користувачів може сягати від сотні тисяч до мільйона.
У статті наведено інформацію про різні  аспекти  дослідження  алфа-
віту нко, які можна відобразити кількісними параметрами. Насамперед
за певними принципами обчислено складність графічних форм кожної
з 27 літер, наприклад, крапці відповідає 1, прямому відрізку – 2, а дузі – 3;
також певні ваги присвоюють різним типам з’єднання і перетину ліній.
Далі зроблено частотний аналіз розподілу літер у корпусі текстів мовою
манінка, записаних алфавітом нко, обсягом понад 3,1 млн слів. Це дало,
зокрема, можливість простежити, наскільки складність графічної форми
знаків корелює з їхньою частотністю. Виявилося, що така кореляція не
надто істотна: коефіцієнт кореляції становить –0,38, тоді як, наприклад,
для азбуки Морзе в англійських текстах він сягає –0,82. Повній зворотній
кореляції, коли завжди простіші знаки використовують для частотніших
літер, відповідає значення –1. Також показано, що частотний аналіз може
слугувати додатковим обґрунтуванням деяких ортографічних принципів
у нко, зокрема в позначенні тонів.

Наступної задачею був розрахунок так званої ортографічної невизначе-
ности: в ідеальному алфавіті, де є однозначна відповідність між фонемами
(звуками) графемами (знаками) ця невизначеністю дорівнює нулеві. В ал-
фавіті нко її значення досить малі: 0,37 без урахування позначення тонів
та 0,22 з їх урахуванням. Для порівняння можна вказати значення, що від-
повідають «старими» писемностям: в українському алфавіті – 1,12, а дещо
простіша італійська ортографія забезпечує невизначеність на рівні 0,56.
Одержані результати можуть бути корисні для вивчення фонотакти-
ки, просодичних елементів, досліджень з історії письма та лексикографії,
а також для порівняльних і контрастивних студій.
Ключові  слова:  алфавіт;  мови  манден;  манінка;  ортографія;  складність
графічної форми знаків.


Повний текст:

PDF

Посилання

  • Поки немає зовнішніх посилань.