Журнал «ТАМЫР», №46, август-декабрь 2017 г., Журнал Тамыр

Джавдет Ш. Сулейманов. Об алфавитах для тюркских языков

Уважаемые коллеги,

ознакомившись с проектом казахской латиницы, являясь одним из активных сторонников и разработчиков татарской латиницы в Татарстане течение  10 лет – с 1990 по 2000 годы,  решил поделиться своими мыслями, которые, возможно, будут вам интересны при обсуждении окончательного варианта вашего алфавита.

Остановлюсь только на двух принципиальных моментах.

  1. Об отображении мягких гласных «ә» как «ae», «ү» как «ue», «ө» как «oe». Такой подход написания гласных букв с дополнительным символом – оператором «смягчения» предлагался и для татарского языка. Обсуждались разные варианты, в том числе варианты с буквами-операторами «v», «h» и с апострофом « ’ » – «av», «ah», «a’», «uv», «uh», «u’», «ov», «oh», «o’».   Однако, после серьезных обсуждений, было решено отказаться от такого варианта. Главной причиной послужили два явления в татарском языке, практически общих для тюркских языков, это сингармонизм гласных и агглютинативность морфологии, приводящие к большой частотности использования этих двойных букв, а также к искусственному удлинению словоформы при присоединении аффиксов с этими буквами. Таким образом, текст не только удлиняется, но и практически становится нечитабельным. Особенно проблемным, практически ломающим стройность алфавита и вносящим путаницу, является использование апострофа «’» в качестве оператора изменения звучания, причем, c различной функциональной нагрузкой – и для «смягчения» гласных – «a’», и для образования «шипящих» –  «s’», и для сонорной графемы «n’» .

Эти и другие аспекты перехода на латиницу я подробно описал в своей статье, которую прилагаю к письму.

  1. О едином тюрко-язычном пространстве. Этот момент особенно важный. Еще вначале ХХ века казахи, татары, турки и др. тюркские народы свободно читали общие газеты и журналы. С тех пор по разным обстоятельствам и причинам происходит отдаление тюркских народов. Одним из инструментов, который может как отдалять и далее, так и приближать, является алфавит.

Сейчас казахский язык находится именно на таком рубеже. На рубеже, когда принятый алфавит будет способствовать развитию казахского языка и, одновременно, сближению тюркских народов в информационном пространстве, или же, наоборот, станет искусственным тормозом. Это, как вы понимаете, крайне важно и актуально для всех тюркских языков, а далее и народов, в условиях неизбежной глобализации мира. В этом заинтересованы все мы, все тюркские народы, и в первую очередь,  именно по этой причине я решил к вам обратиться.

Сегодня мы еще достаточно близки и по алфавитам, и по лексикону, по понятиям и терминологии, хотя процесс отдаления происходит с очень большой скоростью. Единое информационное поле это наша сила. И как бы я сегодня поступил, если вернуться к 90-м годам, когда обсуждался татарский алфавит.

Я бы взял турецкий алфавит за основу. Определил бы буквы, которых не хватает и нашел бы для них эквивалент в других алфавитах на латинической основе (немецкий, испанский, английский, французский, чешский), чтобы не придумывать дополнительных символов, отсутствующих в кодовых таблицах, чтобы не создавать себе технических и технологических сложностей. При этом обязательно посоветовался бы с учеными других тюркских народов, в языках которых имеются аналогичные специфичные звуки, чтобы согласованно принять ее отображение на латинице.  Тем более с теми учеными, которые уже прошли такой путь разработки алфавита.

Татары 10 лет спорили о вариантах адекватного алфавита на основе латиницы, главным образом, как я сейчас понимаю, по несущественным мелочам, и в итоге оказались без своего алфавита.

Желаю успехов.

 

ПРИЛОЖЕНИЕ

Сулейманов Д.Ш. Об адекватном алфавите для татарского языка: латиница или кириллица // В сб. Трудов Первой международной конференции «Компьютерная обработка тюркских языков». – Астана: ЕНУ им. Л.Н. Гумилева, 2013. – С. 75-84.

 

Приведем отрывки из этой статьи:

Очевидно, что простая смена алфавита, его упорядочение и приведение в соответствие с базовыми закономерностями языка не является гарантией дальнейшего развития языка и его широкого применения. Привлекательность и живучесть языка — в его активности, и прежде всего в том, насколько язык является языком наук, информационных технологий, языком общения на официальном государственном уровне, языком  передачи и усвоения знаний, языком межнационального и международного общения. Вместе с тем, адекватный алфавит, представляющий собой систему базовых элементов языка на стыке слышимого и видимого, является важным фактором, упорядочивающим вербальное проявление языка. Для  укрепления фонетического иммунитета языка, для обеспечения его устойчивости важно, чтобы графемы соответствовали фонемам языка, и в алфавите не было «мертвых» графем, не имеющих соответствующих фонем в языке.

Построение адекватного алфавита воспринимается нами как упорядочение основ орфоэпии и орфографии языка, приведение в соответствие фонетического и графемного рядов, очистка от «неработающих» букв, соответственно, создание условий для развития языка.

  1. Технологический аспект

Рассмотрим ряд аргументов в пользу татарского алфавита на основе латинской графики.

Во-первых, и это, возможно, самое важное, особенно в аспекте обучения языкам,  переход на латиницу приводит к четкому графическому разграничению фонетических систем татарского и русского языков.

Очевидно, графическое разграничение фонетических систем татарского и русского языков полезно как для татарского, так и для русского языков. Непосредственное и постоянное соседство двух сильно различающихся фонетических систем в рамках одного алфавита приводит к диффузии, размыванию фонем, соответственно, к разрушению обоих языков.  Чуть ли не все буквы кириллического алфавита, имеющие одинаковые начертания, по-разному звучат в русском и татарском языках. Например, как в следующих словах: акын, Казан,  тын, чик, кол, кот, товар,  карга, кит, тир, кара,  имеющих определенные значения на русском и на татарском языках. В зависимости от того, к какому языку они относятся, татарскому или русскому, эти слова читаются совершенно по-разному.

Необходимо отметить следующее: здесь важно даже не столько переход на латиницу – сколько разграничение с кириллицей, т.е. переход на алфавит, отличный от кириллицы. То есть проблема разграничения татарского и русского алфавитов стоит даже независимо от того, к каким графемам переходить. Если бы татарский язык и английский были в такой же близости как русский и татарский, а русский был бы языком географически далекого народа как народы с английским языком, то с теми же обоснованиями в интересах татарского языка можно было бы переходить на кириллицу или на любой другой, отличный от латиницы, алфавит.

Но реальная ситуация такова, что стоит проблема разграничения именно татарского и русского алфавитов, базирующихся на кириллической графике. Латиница в данном случае устраивает по следующим причинам: 1) латиницу используют практически все народы, формирующие сегодня мировую науку, 2) на латинице базируются также и информационные технологии, 3) нет активного коммуникативного пересечения, близкого соседства, и активного и широкого взаимовлияния татарского и английского языков.

Дифференциация алфавитов по принципу:  разные графемы — разные фонемы  является удобным и при изучении языков. Переход на латиницу является выигрышным при изучении татарского языка как для татар, для которых русский язык, соответственно, и русский алфавит являются первым языком, первым алфавитом, так и для русских, желающих изучать татарский язык – легче будут усваиваться новые фонемы.

Во-вторых, для того чтобы выжить и развиваться в настоящее время (а в скором будущем тем более) татарский язык, должен войти в компьютерные технологии как язык накопления, обработки и передачи информации.

Очевидно, чем ближе алфавит татарского языка к алфавиту языка информационных технологий, каковым сегодня является латиница, и  чем меньше промежуточных конвертаций (программных транслитераций — переводов с одного алфавита на другой) – тем он эффективнее, т.к. это приводит к экономии памяти для хранения и сокращению времени обработки – а значит, и экономически выгодно. Уменьшение  промежуточных модулей (конверторов, таблиц перехода) приводит к увеличению надежности системы (меньше элементов – больше надежность). Как известно, в технических системах, время, память, надежность – это одни из самых критичных и важных показателей. Для татарского языка на основе латиницы – меньше проблем при использовании программ, обрабатывающих чисто латинические тексты. Меньше проблем с совместимостью и адаптацией данных и программ для обработки языковых блоков, с сортировкой, отображением на экране информации, с конвертацией текстов. Меньше проблем с татарской локализацией новых пакетов программ  и операционных систем.

В-третьих, сокращение количества графем позволяет разработать более подходящую раскладку клавиатуры для татарского языка.

В-четвертых, упрощается общение в компьютерных сетях на татарском языке. Тексты на латинице, в отличие от кириллицы, читаются всегда корректно. В принципе, эта проблема для кириллического текста разрешима и разрешается, однако требует дополнительных усилий по поддержке корректного отображения кириллических букв.

С переходом на латиницу татарские тексты будут читаться стабильно. Во всяком случае, если даже и не будет соответствующих драйверов и шрифтов, и не все буквы будут отображаться корректно, текст будет понятен, а это при переписке, а также и при ознакомлении с некоторым текстом, зачастую, самое главное: понять, что же там написано.

В-пятых, в настоящее время подготовлена необходимая документальная и программная база, регламентирующая использование татарской латиницы в компьютерных технологиях. Разработана опытно-эксплуатационная версия пакета драйверов и шрифтового обеспечения для татарского языка на основе латиницы. Академией наук Татарстана подготовлены соответствующие материалы и принято Постановление Кабинета Министров РТ «О стандартах кодировки символов татарского алфавита на основе латинской графики и базовых программах для компьютерных применений»  N 625 от  27 сентября 2000 года.

Разработана и реализована базовая версия конвертера татарского текста с кириллицы на латиницу и наоборот.

В-шестых, практически все языки развитых информационных технологий используют латиницу.

Татарский язык, в силу исключительной регулярности грамматики и агглютинативности, является удобным и весьма перспективным языком для компактного хранения и  эффективной обработки языковой информации [1, 2, 3]. Следовательно, переход татарского языка на латиницу обеспечит естественное вхождение его в компьютерную среду, упростит использование татарского языка в качестве программного инструментария при создании интеллектуальных систем.

В-седьмых, почему нельзя просто модифицировать кириллический (русский) алфавит, адаптируя его к татарскому фонемному ряду?

Одна из причин, почему нельзя обойтись простым изменением кириллицы, «подгонкой» кириллического алфавита, заключается в следующем. Анализ кириллического алфавита с точки зрения соответствия русских букв татарскому фонемному ряду показывает, что для приведения кириллического алфавита в соответствие с татарской фонемной системой необходимо внести в алфавит  не менее 20 изменений, т.е., добавить в русский алфавит не менее 20 новых символов, причем, удалив оттуда ряд «чужих» для татарского языка (таких как, «е, ё, я, ю, ц, щ, э, ь, ъ»). Изменению подлежат даже такие буквы как «а», «о», «в», «ч», «ы». Очевидно, это уже будет не измененный кириллический алфавит, а полная эклектика, т.е. новый алфавит, далекий как от кириллицы, так и от латиницы.

 

  1. Лингвистический аспект

В данном разделе статьи осуществляется анализ татарского алфавита на основе латинской графики из 34 букв, утвержденного Указом Президента РТ и признанного в настоящее время экспериментальным вариантом, и предлагается новый вариант алфавита, состоящий из 26 букв…

 

Заключение

 

На семинарах Лаборатории проблем искусственного интеллекта АНТ и КГУ  обсуждались разные варианты латиницы, и даже был выпущен специальный сборник [4], в котором, в частности,  анализируется ряд вариантов алфавита на основе латиницы и предлагается некий собственный алфавит, предложенный специалистами лаборатории. Однако, поддерживая переход на латиницу в принципе, и беспокоясь, что в мелких спорах (и как оказалось — обоснованно) можно потерять саму возможность перехода на латинскую графику, мы практически отказались от продвижения своего варианта.

Пользуясь тем, что эксперимент по поводу перехода на латиницу продолжается, в данной статье проанализированы технические и лингвистические аспекты перехода на латиницу, и предложен новый вариант татарского алфавита на основе латиницы, состоящий из 26 букв.

        

Литература

 

  1. Сулейманов Д.Ш. Формальная элегантность и естественная сложность морфологии татарского языка // Электронная конф.: Информационные технологии в гуманитарных науках (Казань, 5-31 мая, 1998г). -Казань, 1998. -HTTP://www.kcn.ru/_tat_ru/universitet/gum_ konf/ot7.htm.
  2. Сулейманов Д.Ш. (Кыпчак И.И.). Татарский язык — язык компьютерных технологий // Материалы научн.-практ. конференции “Языковая ситуация в республике Татарстан: состояние и перспективы” (17 ноября 1998 года). В 2 частях. Ч.1. -Казань: Изд-во “Мастер Лайн”, 1999. -196-198.
  3. Suleymanov D.S. Natural possibilities of the Tatar morphology as a formal base of the NLP // In Proceedings of the First International Workshop “Computerisation of Natural Languages” (Varna, Sept. 3-7, 1999). –Sofia (Bulgaria): Information Services Plc, 1999. -P.113-117.
  4. Татарский язык и информационные технологии. Вып.2. Изд-во Каз.гос. ун-т. –1995. – 122 с.
  5. Гыйматдинова Н. Пәри утарында // «Идел» журналы, № 10, 1996. – 4-17, 32-39 б.
  6. Папюсъ. Каббала или наука о боге, вселенной и человеке /Пер. С фр. А.В.Трояновского. Издание В.Л.Богушевского. –СПБ, 1910. – 359 с.
  7. Плешанов А.Д. Русский алфавит как инструмент научного познания вселенной. –М.: Новый Центр, 2000. — 68 c.

Приведем в качестве примера конвертирование Песни об Аттиле из исторического романа Г.В.Томского (Тюрген Билге), переведенного на казахский язык Жаңалық Балтабаевой и Анаргүл Кабдылкызы:

  1. Tomski G. Chant sur Attila : Le plus ancien oeuvre daté de la poèsie turco-mongole / CONCORDE, N 5, p. 56-76.
  2. 1 Томский Г.В. ДРУЗЬЯ АТТИЛЫ: Исторический роман, 2016 (Amazon Kindle). — 221 c.
  3. 1 Tomski G. Les amis d’Attila. — Editions du JIPTO, 2005. — 360 p.

 

 

ПРИМЕР 1. Конвертировано на основе татарской латиницы Yanalif2, принятой в Республике Татарстан по Указу Президента РТ и Закону РТ 15 сентября 1999 года. Через год экспериментального внедрения алфавит был запрещен Госдумой. (Вторая и третья  столбцы в таблице).

***

Qudıretti de jeke-dara, o, Tәŋirim!
Mundzuktan tuğan Attila xan,
Eŋ aybındı ğun edi.
Küş-quatı tasığan bar xalıqqa bas boldı,
Soltüstikke bilik etip, Germaniyәnı ielendi,
Aralğa deyin atoy salıp,
Keŋ dalanı dür silkintti.
Auızdıqtap eki rimdik imperiyәnı,
Qalalarına kәrin tөkti.
Bas igenderge mәrt bolıp,
Az alımmen şekteldi.
Alapat urıstardan aman şıqtı,
Jau oğınan jaralanbay,
Eşbir satqındıq jasalmay,
Däuleti xalqınıŋ asqan şaqta,
Tittey de sezinbesten tәn jarasın,
Dünieden ozdı alıp tulğa, seniŋ şeksiz raqımıŋmen,
O, qudıretti, jarılqauşı Tәŋirim!
Kek qaytaru jadıdan şıqqan,
Aq өlim emes dep, bunı kim aytar!

 

***

Құдыретті де жеке-дара, о, Тәңірім!
Мундзуктан туған Аттила хан,
Ең айбынды ғұн еді.
Күш-қуаты тасыған бар халыққа бас болды,
Солтүстікке билік етіп, Германияны иеленді,
Аралға дейін атой салып,
Кең даланы дүр сілкінтті.
Ауыздықтап екі римдік империяны,
Қалаларына кәрін төкті.
Бас игендерге мәрт болып,
Аз алыммен шектелді.
Алапат ұрыстардан аман шықты,
Жау оғынан жараланбай,
Ешбір сатқындық жасалмай,
Дәулеті халқының асқан шақта,
Титтей де сезінбестен тән жарасын,
Дүниеден озды алып тұлға, сенің шексіз рақымыңмен,
О, құдыретті, жарылқаушы Тәңірім!
Кек қайтару жадыдан шыққан,
Ақ өлім емес деп, бұны кім айтар!


 

ПРИМЕР 2. Конвертировано на основе татарской латиницы, которая многие годы активно используется на Радио Азатлык (Свобода) (Прага,Чехия) @lif (Azatliq.org) – четвертая и пятая столбцы в предшествующей таблице.

 

***

Qudıretti de jeke-dara, o, Täñirim!
Mundzuktan tuğan Attila xan,
Eñ aybındı ğun edi.
Küş-quatı tasığan bar xalıqqa bas boldı,
Soltüstikke bilik etip, Germaniyänı ielendi,
Aralğa deyin atoy salıp,
Keñ dalanı dür silkintti.
Auızdıqtap eki rimdik imperiyänı,
Qalalarına kärin tökti.
Bas igenderge märt bolıp,
Az alımmen şekteldi.
Alapat urıstardan aman şıqtı,
Jau oğınan jaralanbay,
Eşbir satqındıq jasalmay,
Däuleti xalqınıñ asqan şaqta,
Tittey de sezinbesten tän jarasın,
Dünieden ozdı alıp tulğa, seniñ şeksiz raqımıñmen,
O, qudıretti, jarılqauşı Täñirim!
Kek qaytaru jadıdan şıqqan,
Aq ölim emes dep, bunı kim aytar!


 

ПРИМЕР 3. Конвертировано на основе татарской латиницы, предложенной нами (Сулеймановым Д.Ш.) как альтернатива. Главные преимущества: 1) всего 26 букв (вместо 34 в других татарских алфавитах); 2) все буквы имеются в кодовых страницах операционных систем и широко используются европейскими национальными языками (это означает, что нет проблем с разнообразием шрифтов и снимаются технические аспекты отображения и распознаваемости символов на электронных устройствах).

 

***

Kudyretti de zheke-dara, o, Tänhirim!
Mundzuktan tugan Attila han,
Enh ajbyndy gun edi.
Küsh-kuaty tasygan bar halykka bas boldy,
Soltüstikke bilik etip, Germanijäny ielendi,
Aralga dejin atoj salyp,
Kenh dalany dür silkintti.
Auyzdyktap eki rimdik imperijäny,
Kalalaryna kärin tökti.
Bas igenderge märt bolyp,
Az alymmen shekteldi.
Alapat urystardan aman shykty,
Zhau ogynan zharalanbaj,
Eshbir satkyndyk zhasalmaj,
Däuleti halkynynh askan shakta,
Tittej de sezinbesten tän zharasyn,
Dünieden ozdy alyp tulga, seninh sheksiz rakymynhmen,
O, kudyretti, zharylkaushy Tänhirim!
Kek kajtaru zhadydan shykkan,
Ak ölim emes dep, buny kim ajtar!

 

YanalifSLT Произношение Кириллица
А, а A А, а
Ä, ä ә Ә, ә
B, b Be Б, б
C, c Che Ч, ч
D, d De Д, д
E, e E Е, е (э)
F, f Ef Ф, ф
G, g Ge Г, г
H, h He Һ, һ
I, i I И, и
J, j Jod Й, й
К, к Ke К, к
L, l El Л, л
M, m Em М, м
N, n En Н, н
O, o O О, о
Ö, ö ө Ө, ө
P, p Pe П, п
R, r Er Р, р
S, s Es С, с
T, t Te Т, т
U, u U У, у
Ü, ü Ü Ү, ү
W, w We В, в (у)
Y, y Ы Ы, ы
Z, z ze З, з

 

Ц – Ts, Җ – Jh, Ш – Sh, Щ – Tc/ Tsh, Ж – Zh, Ң – Nh

 

ПРИМЕР 4.  На проекте нового казахского алфавита:

 

***

Qudyrеttі dе jеке-dаrа, о, Тa’n’іrіm!

Мy’ndzu’ktаn tу’g’аn Аttilа hаn,

Еn’ аi’byndy g’un еdі.

Кu’s’-kу’аty tаsyg’аn bаr hаlyqqа bаs bоldy,

Sоltustіkkе bilіk еtіp, Gеrmаnii’any i’iеlеndі,

Аrаlg’а dеi’іn аtоi’ sаlyp,

Kеn’ dаlаny dү’r sіlkіnttі.

Ау’yzdyqtаp еkі rimdіk impеri’ii’any,

Qаlаlаrynа ka’rіn to’ktі.

Bаs igеndеrgе ma’rt bоlyp,

Аz аlymen s’еktеldі.

Аlаpаt urystаrdаn аmаn s’yqty,

Jаu’ оg’ynаn jаrаlаnbаi’,

Еs’bіr sаtqyndyq jаsаlmаi’,

Da’lеtі hаlqynyn’ аsqаn s’аqtа,

Тittei’ dе sеzіnbеstеn ta’n jаrаsyn,

Duniеdеn оzdy аlyp тulg’а, sеnіn’ s’еksіz rаqymyn’mеn,

О, kudyrеttі, jаrylqау’s’y Тa’n’іrіm!

Кеk qаi’tаry’ jаdydаn s’yqqаn,

Аq o’lім еmеk dеp, buny kіm аi’tаr!

 

ПРИМЕР 5.  В заключение приведем перевод на турецкий язык, выполненный

Gülseven Sonumut:

 

***

Ey Tangra, tek ve kudretli Tanrı!

Mundzuk’un oğlu İmperator Attila,

Cesur halkların efendisi,

Kendisinden öncekilerin  hepsinden daha kudretli,

Asya’dan Germanie’ya kadar Kuzey İmperatorluğunu yarattı.

Doğu ve Batı Roma’yı dize getirdi

Ve sayısız ülkleyi fethetti.

Bütün bu görevler tamamaldı

Sadece senin yardımınla Ulu Tangra,

Bütün bu zaferleri kazandı

Öldü, düşmanının darbelerinden değil,

Ne de kendine ihanet edenlerden,

Bir bayram sevinci içinde

Halkının bağrında

En küçük bir ıstırap duymadan.