Огласовки в арабском письме

(перенаправлено с «Кясра»)

Огласо́вки (араб. حركات‎ «движения», ед.ч. حركةха́рака) — система надстрочных и подстрочных диакритических знаков, используемых в арабском письме для обозначения кратких гласных звуков и других особенностей произношения слова, не отображаемых буквами. Расстановку огласовок в тексте называют ташки́ль (араб. تشكيل‎). Поскольку буквами арабского алфавита обозначаются только согласные и долгие гласные (матрес лекционис)[1], то неогласованный текст невозможно «читать вслух»: можно лишь «угадывать произношение» записанных в нём слов. Текст с расставленными огласовками, напротив, содержит всю необходимую для его прочтения информацию.

Чёрным цветом изображены буквы арабского алфавита, серым — огласовки.

Употребление

править

Обычно в текстах огласовки не проставляются. Исключением являются: Коран, случаи, когда это нужно для различения смысла, огласовки обычно ставятся над одной или несколькими буквами слова, детские и учебные книги, словари и т. д.[1], — подобно расстановке ударений в текстах на русском языке. Когда нужно точно передать звучание незнакомого слова, огласовки ставятся над всеми согласными этого слова. Для сравнения: русский текст, из которого удалены обозначения гласных звуков (например, вкпдй свбднй нцклпдй), невозможно прочитать человеку, не владеющему в достаточной степени русским языком, однако этот текст легко читается человеком, знающим все «зашифрованные» в этом тексте слова. С другой стороны, если известно произношение слова, то его запись однозначно определяется этим произношением — в этом состоит отличие консонантного письма от идеографического, в котором запись и произношение слова не имеют связи.

Кроме того, текст с пропущенными гласными на семитских языках, где гласные несут в основном грамматическую и словообразовательную информацию, читается носителем языка легче, чем в случае, когда пропускаются гласные в словах индоевропейских языков, где они являются такими же равноправными, как и согласные, элементами корня. С содержательной точки зрения соответствием арабского текста без огласовок в европейских языках является сокращённая запись слов без окончаний или даже некоторых суффиксов (свобод. многоязыч. энциклопед., в котор. кажд. мож. измен. или дополн. люб. стат.). Разумеется, это не относится к несемитским языкам, использующим арабскую графику (например, индоевропейскому персидскому или тюркскому уйгурскому); для них огласовки могут в ряде случаев играть бо́льшую роль.

Знаки гласных

править
Знаки
фатха кясра дамма сукун
◌َ ◌ِ ◌ُ ◌ْ

Когда за согласным звуком следует гласный (краткий или долгий), над согласным ставится знак-огласовка, соответствующая следующему гласному. Если этот гласный долгий, то он дополнительно обозначается буквой (т. н. харф мад — буква удлинения), следующей за согласной[2].

Если после согласного звука нет гласного (перед следующим согласным либо в конце слова), то над ним ставится огласовка сукун.

При полной огласовке текста (например, в Коране) при каждой букве, обозначающей согласный, должен стоять один из 4 знаков, приведённых ниже. Эти знаки не могут стоять при буквах, обозначающих удлинение гласных.

 
Дамма, фатха, кясра
Фатха
Черта над буквой (◌َ, фатх̣а, араб. فتحة‎ «раскрывание») обозначает звук а. Соответствующая буква удлинения — ا (алиф).
Кясра (касра)
Черта под буквой (◌ِ, кясра, араб. كسرة‎ «ломание») обозначает звук и. Соответствующая буква удлинения — ﻱ (йа').
Дамма
Крючок над буквой (◌ُ, д̣амма, араб. ضمة‎ «соединение») обозначает звук у. Соответствующая буква удлинения — و (уау).
Сукун
Кружок над буквой (◌ْ, сукӯн, араб. سكون‎ «тишина») обозначает отсутствие гласного звука.

Танвин

править
 
Сукун, шадда, шадда, танвин-кясра

Удвоение в конце слова одной из трёх огласовок, обозначающих гласные звуки (танвӣн, араб. تنوين‎), образует падежное окончание (’и‘ра̄б, араб. إﻋﺮﺍﺏ‎), обозначающее неопределённое состояние этого слова и произносящееся ан, ин либо ун в зависимости от удваиваемой огласовки. Танвин в качестве и`раб присутствует также в некоторых именах собственных, например مُحَمَّدٌмухаммадун, «Мухаммад». В классическом арабском языке падежное окончание не произносится в конце фразы или перед паузой; в разговорной речи он не произносится вовсе[2].

Танвин-фатха может стоять только над буквами алиф, хамза и та-марбута. В остальных случаях в конце слова пишется непроизносимая буква алиф, и танвин-фатха пишется над ней.

Шадда представляет собой W-образный знак над буквой (шадда, араб. شدة‎ «усиление») и обозначает удвоение буквы[3]. Она ставится в двух случаях: для обозначения удвоенного согласного (то есть сочетания вида X-сукун-X) либо в сочетаниях из долгой гласной и согласной, обозначаемых одной и той же буквой (таких сочетаний два: ӣй и ӯв). Огласовка удвоенного согласного фатхой или даммой изображается над шаддой, кясрой — под буквой или под шаддой[1].

 
Васла, мадда

Волнистая линия над буквой алиф (мадда, араб. مدة‎ «удлинение») обозначает комбинацию хамза-алиф либо хамза-хамза, когда по правилам написания хамзы она пишется с подставкой алиф[4]. Правила арабской орфографии запрещают следование в одном слове двух букв алиф подряд, поэтому в случаях, когда возникает такая комбинация букв, она заменяется буквой алиф-мадда. По той же причине в комбинации алиф-мадда (алиф-хамза-алиф) алиф-мадда не пишется — вместо этого хамза пишется без подставки.

Мадда обязательна к использованию даже в неогласованных текстах — как и хамза, которую она заменяет. Поэтому можно спорить, относится ли она к огласовкам, или, подобно хамзе, является самостоятельным знаком арабского письма.

Знак, похожий на букву сад (ٱ), над алифом в начале слова (вас̣ла, араб. وصلة‎ «объединение») обозначает, что этот алиф не произносится, если предыдущее слово заканчивалось на гласный звук[5]. Буква алиф-васла встречается в небольшом количестве слов, а также в приставке аль-. Поскольку в нередуцированном положении алиф-васла обозначает хамзу, то другое название этой буквы — хамзату-ль-васл (араб. همزة الوصل‎, «хамза объединения»).

Надстрочный алиф

править
 
Надстрочный алиф над шаддой в слове Аллах

Знак в форме буквы алиф над текстом (араб. ألف خنجرية’алиф х̮анджарӣйя, «кинжальный алиф») обозначает долгий звук а̄ в словах, где обычный алиф не пишется по орфографической традиции. Сюда относятся в основном имена собственные (включая слово Аллах), а также несколько указательных местоимений (например, هٰذَاха̄з̱а̄ «этот»). При полной огласовке надстрочный алиф ставится также над буквой алиф-максура, чтобы показать, что она читается как долгий а̄[1].

Надстрочный алиф — очень редкий знак, и кроме как в Коране, он обычно не употребляется. Более того, в Коране надстрочный алиф встречается иногда даже в тех словах, в которых по правилам пишется обычный алиф. Например, во фразе араб. بسم الله الرحمن الرحيم‎ («бисмилляхи р-рахмани р-рахим»), с которой начинается каждая сура, в слове «рахман» пишется надстрочный алиф (رَحْمٰن‎) — несмотря на то, что во всех остальных случаях это слово пишется с обычным алифом (رَحْمَان‎)[6].

 
Надстрочный алиф, формы хамзы (с разными подставками и без подставки)

Хотя хамза (араб. همزة‎ «сжимание») не относится к огласовкам и обозначает согласный звук (гортанную смычку), она обычно пишется как диакритический знак, и была введена в употребление одновременно с огласовками. Таким образом, она занимает промежуточное положение между буквами арабского алфавита и вспомогательными знаками арабского письма. В частности, написание хамзы обязательно даже в неогласованном тексте.

Способ написания хамзы задаётся правилами арабской орфографии[1]:

  • если за хамзой в начале слова следует алиф, то вместо обеих этих букв пишется алиф-мадда;
  • иначе хамза в начале слова пишется над буквой алиф (с огласовкой фатха или дамма) или под ней (с огласовкой кясра);
  • иначе, если одна из огласовок, смежных с хамзой, — кясра, то хамза ставится над буквой йа, которая в этом случае пишется без диакритических точек;
  • иначе, если одна из огласовок, смежных с хамзой, — дамма, то хамза пишется над буквой вав;
  • иначе, если за хамзой следует алиф, то вместо обеих этих букв пишется алиф-мадда;
  • иначе, если перед хамзой идёт алиф, то хамза пишется на строке (без подставки);
  • иначе хамза пишется над буквой алиф.

Из этих правил есть ряд исключений, в которых сохраняется традиционный способ написания хамзы: до того, как для неё появился собственный знак, она изображалась в виде буквы алиф, либо вовсе не записывалась.

Все слова в классическом арабском языке начинаются с согласных звуков; поэтому не возникает проблемы с написанием огласовки без базовой согласной. Поскольку в разговорной речи начальная хамза не произносится, такие слова в транслитерации начинаются с гласных букв. На самом же деле часть таких слов (например, имена Ахмад и Усама) начинаются с хамзы, и огласовка, соответствующая начальному гласному звуку слова, ставится над этой хамзой. Кроме того, ряд слов, начинающихся в транслитерации с гласных букв (например, имена Иса и Али), начинаются на самом деле со звука, обозначаемого буквой `айн и не имеющего аналогов в европейских языках. Хотя в большинстве арабских диалектов этот звук произносится, для него нет устоявшегося способа транслитерации, и поэтому он при транслитерации часто опускается.

История

править
 
Коран X века с ташкилем Насра и Яхьи (красные точки)

Изначально в арабском письме не использовались точки над и под буквами; алфавит состоял из 15 букв, восходящих к финикийскому алфавиту, и большинство из букв обозначало сразу несколько звуков. По легенде, первый ташкиль, состоящий в добавлении к омографичным буквам разноцветных точек для обозначения их звучания, был изобретён куфийцем Абу аль-Асвадом ад-Ду’али по указанию халифа Али, когда тот увидел копию Корана с ошибками и потребовал кодифицировать правила арабского языка. Добавление точек к основным формам букв для их разделения по звучанию (нак̣т̣, араб. نقط‎) не является, видимо, собственным изобретением ад-Ду’али, поскольку известен папирус, датируемый 643 годом, в котором такие точки уже используются[7].

 
Коран с современными огласовками (начало XX века)

Отдельные знаки для огласовок появились позже, во второй половине VII века, когда по указанию правителя Ирака Аль-Хаджжаджа ибн Юсуфа (661714), переведшего делопроизводство в Ираке с пехлеви на арабский язык, была создана система обозначения кратких гласных маленькими красными точками. Для обозначения хамзы, как и в системе ад-Ду’али, использовались жёлтые точки. Создателями новой системы были двое учеников ад-Ду’али: Наср ибн `Асым (ум. 707) и Яхья ибн Я`мур (ум. 746). Неудобство их системы состояло в необходимости использования трёх цветов для записи огласованного текста, чтобы точки-огласовки можно было отличать от накта — точек-элементов букв.

Система огласовок в современном виде была создана к 786 году оманцем Халилем ибн Ахмадом аль-Фарахиди (718791), составителем первого словаря арабского языка. Он же придумал современный знак для обозначения хамзы. К началу XI века использование системы аль-Фарахиди стало общепринятым[8].

Компьютерная обработка

править

Представление в Юникоде

править

В Юникоде огласовки представлены как в виде комбинируемых диакритических знаков, так и в виде монолитных символов. Монолитные символы делятся на три класса: комбинация буквы и огласовки; комбинация пробела и огласовки; комбинация кашиды (горизонтальной черты) и огласовки[9].

 
Арабская пишущая машинка

В таблицах приведены также соответствия кодов Юникода позициям наиболее распространённых арабских кодовых страниц: ASMO-708, DOS-720, DOS-864, ISO 8859-6 (она же ECMA-114 и CP-28596), Windows-1256 и Macintosh Arabic (она же CP-10004). Позиции базовых арабских букв и огласовок в страницах ASMO, ISO/ECMA и Macintosh совпадают, поэтому в таблице они совокупно обозначены как ISO. Остальные из названных кодовых страниц обозначены в таблице как DOS-720, DOS-864 и Windows соответственно.

Кодовые страницы ASMO и DOS относятся к OEM-кодировкам, включающим символы псевдографики. При этом DOS-864 уникальна тем, что кодирует не буквы, а графические элементы арабского письма — позиционные формы букв и их отдельных частей. В этой кодовой странице не хватило места для кодировки большей части огласовок. Представление текста в DOS-864 аналогично его набору на арабской пишущей машинке, имеющей отдельные клавиши для всех элементов арабского письма, и не позволяющей огласовывать печатаемый текст.

Модифицирующие знаки

править

В качестве базового символа здесь использован буллит (•).

Знак Код Название Соответствия в кодовых страницах
ً•  Танвин-фатха U+064B Arabic Fathatan EB (ISO), F1 (DOS-720), F0 (Windows)
ٌ•  Танвин-дамма U+064C Arabic Dammatan EC (ISO), F2 (DOS-720), F1 (Windows)
ٍ•  Танвин-кясра U+064D Arabic Kasratan ED (ISO), F3 (DOS-720), F2 (Windows)
َ•  Фатха U+064E Arabic Fatha EE (ISO), F4 (DOS-720), F3 (Windows)
ُ•  Дамма U+064F Arabic Damma EF (ISO), F5 (DOS-720, Windows)
ِ•  Кясра U+0650 Arabic Kasra F0 (ISO), F6 (DOS-720, Windows)
ّ•  Шадда U+0651 Arabic Shadda F1 (ISO, DOS-864), 91 (DOS-720), F8 (Windows)
ْ•  Сукун U+0652 Arabic Sukun F2 (ISO), 92 (DOS-720), FA (Windows)
ٓ•  Мадда U+0653 Arabic Maddah Above
ٰ•  Надстрочный алиф U+0670 Arabic Letter Superscript Alef

Комбинации с буквами

править
Комбинация Код Название Комментарий, разложение, соответствия
آ Алиф-мадда U+0622 Arabic Letter Alef With Madda Above = U+0627 U+0653; = С2 (ISO, Windows), 99 (DOS-720)
ٱ Алиф-васла U+0671 Arabic Letter Alef Wasla
Алиф-васла U+FB50 Arabic Letter Alef Wasla Isolated Form начальное начертание, ≈U+0671
Алиф-васла U+FB51 Arabic Letter Alef Wasla Final Form срединное начертание, ≈U+0671
Заль, надстрочный алиф U+FC5B Arabic Ligature Thal With Superscript Alef Isolated Form изолированное/начальное начертание, ≈U+0630 U+0670
Ра, надстрочный алиф U+FC5C Arabic Ligature Reh With Superscript Alef Isolated Form изолированное/начальное начертание, ≈U+0631 U+0670
Алиф-максура, надстрочный алиф U+FC5D Arabic Ligature Alef Maksura With Superscript Alef Isolated Form изолированное начертание, ≈U+0649 U+0670
Алиф-максура, надстрочный алиф U+FC90 Arabic Ligature Alef Maksura With Superscript Alef Final Form конечное начертание, ≈U+0649 U+0670
Ха, надстрочный алиф U+FCD9 Arabic Ligature Heh With Superscript Alef Initial Form начальное начертание, ≈U+0647 U+0670
Алиф, танвин-фатха U+FD3C Arabic Ligature Alef With Fathatan Final Form конечное начертание, ≈U+0627 U+064B
Алиф, танвин-фатха U+FD3D Arabic Ligature Alef With Fathatan Isolated Form изолированное начертание, ≈U+0627 U+064B
Алиф-мадда U+FE81 Arabic Letter Alef With Madda Above Isolated Form изолированное/начальное начертание, ≈U+0622; =C2 (DOS-864)
Алиф-мадда U+FE82 Arabic Letter Alef With Madda Above Final Form срединное/конечное начертание, ≈U+0622; =A2 (DOS-864)
Лям, алиф-мадда U+FEF5 Arabic Ligature Lam With Alef With Madda Above Isolated Form изолированное/начальное начертание, ≈U+0644 U+0622; =F9 (DOS-864)
Лям, алиф-мадда U+FEF6 Arabic Ligature Lam With Alef With Madda Above Final Form срединное/конечное начертание, ≈U+0644 U+0622; =FA (DOS-864)

Комбинации с пробелом

править
Знак Код Название Разложение
Шадда, танвин-дамма U+FC5E Arabic Ligature Shadda With Dammatan Isolated Form = U+0020 U+064C U+0651
Шадда, танвин-кясра U+FC5F Arabic Ligature Shadda With Kasratan Isolated Form = U+0020 U+064D U+0651
Шадда, фатха U+FC60 Arabic Ligature Shadda With Fatha Isolated Form = U+0020 U+064E U+0651
Шадда, дамма U+FC61 Arabic Ligature Shadda With Damma Isolated Form = U+0020 U+064F U+0651
Шадда, кясра U+FC62 Arabic Ligature Shadda With Kasra Isolated Form = U+0020 U+0650 U+0651
Шадда, надстрочный алиф U+FC63 Arabic Ligature Shadda With Superscript Alef Isolated Form = U+0020 U+0651 U+0670
Танвин-фатха U+FE70 Arabic Fathatan Isolated Form = U+0020 U+064B
Танвин-дамма U+FE72 Arabic Dammatan Isolated Form = U+0020 U+064C
Фатха U+FE76 Arabic Fatha Isolated Form = U+0020 U+064E
Танвин-кясра U+FE74 Arabic Kasratan Isolated Form = U+0020 U+064D
Дамма U+FE78 Arabic Damma Isolated Form = U+0020 U+064F
Кясра U+FE7A Arabic Kasra Isolated Form = U+0020 U+0650
Шадда U+FE7C Arabic Shadda Isolated Form = U+0020 U+0651
Сукун U+FE7E Arabic Sukun Isolated Form = U+0020 U+0652

Комбинации с кашидой

править
Знак Код Название Разложение
Шадда, фатха U+FCF2 Arabic Ligature Shadda With Fatha Medial Form = U+0640 U+064E U+0651
Шадда, дамма U+FCF3 Arabic Ligature Shadda With Damma Medial Form = U+0640 U+064F U+0651
Шадда, кясра U+FCF4 Arabic Ligature Shadda With Kasra Medial Form = U+0640 U+0650 U+0651
Танвин-фатха U+FE71 Arabic Tatweel With Fathatan Above = U+0640 U+064B
Фатха U+FE77 Arabic Fatha Medial Form = U+0640 U+064E
Дамма U+FE79 Arabic Damma Medial Form = U+0640 U+064F
Кясра U+FE7B Arabic Kasra Medial Form = U+0640 U+0650
Шадда U+FE7D Arabic Shadda Medial Form = U+0640 U+0651; =F0 (DOS-864)
ﹿ Сукун U+FE7F Arabic Sukun Medial Form = U+0640 U+0652

Ввод с клавиатуры

править
 
Арабская раскладка клавиатуры (огласовки выделены красным цветом)

В скобках указаны клавиши стандартной латинской раскладки (QWERTY), соответствующие называемым клавишам.

  • Знаки гласных (в том числе с танвином) набираются в верхнем регистре клавишами, расположенными в левой части блока буквенных клавиш. (Q, W, E, R, A, S, X)
  • Шадда набирается в верхнем регистре клавишей, расположенной слева блока цифровых клавиш. (тильда)
  • Алиф-мадда и лям-алиф-мадда набираются в верхнем регистре клавишами, расположенными в нижней части блока буквенных клавиш. (B, N)
  • Ввод мадды (отдельно от алифа), васлы (с алифом или отдельно) и надстрочного алифа при помощи стандартной раскладки невозможен.

Символы, которые невозможно ввести с клавиатуры непосредственно, можно ввести, используя их коды, приведённые выше. В Windows для этого используется комбинация Alt+[шестнадцатеричный код символа в Юникоде], например Alt+653 для ввода мадды, Alt+670 для ввода надстрочного алифа, Alt+671 для ввода алиф-васла. Цифры можно набирать на основной или на дополнительной клавиатуре, независимо от состояния NumLock. Остальные способы ввода символов по их кодам приведены в статье Unicode.

См. также

править

Примечания

править
  1. 1 2 3 4 5 Ковалев А. А., Шарбатов Г. Ш., Учебник арабского языка, 3 изд., Москва, Восточная литература, 1998
  2. 1 2 Кузьмин С. А., Учебник арабского языка, Москва, Восточная литература, 2001
  3. Классический арабский. Дата обращения: 3 ноября 2009. Архивировано из оригинала 4 июля 2010 года.
  4. Мадда. Дата обращения: 2 ноября 2009. Архивировано 7 июня 2013 года.
  5. Любимый взору и слуху (о некоторых особенностях арабской письменности и фонетики). Дата обращения: 2 ноября 2009. Архивировано из оригинала 24 января 2010 года.
  6. Коран
  7. Jones Alan. The Dotting Of A Script And The Dating Of An Era: The Strange Neglect Of PERF 558 : [арх. 16 августа 2015] // Islamic Culture. — 1998. — Vol. LXXII, no. 4. — P. 95—103.
  8. The Reform of Arabic Writing. Дата обращения: 19 января 2007. Архивировано из оригинала 21 января 2007 года.
  9. All Unicode Symbols. Дата обращения: 3 ноября 2009. Архивировано из оригинала 24 января 2010 года.

Ссылки

править