Пробел нулевой ширины () представляет собой непечатаемый символ, используемый в компьютеризированном наборе текста для обозначения границ слов в системах обработки текста в сценариях, которые не используют явный пробел, или после символов (таких как косая черта), за которыми не следует видимый пробел, но после которого, тем не менее, может быть разрыв строки. Он также используется с языками без видимого пробела между словами, например, с японским[1]. Обычно это невидимое разделение, но при выравнивании страницы по обеим краям эти пробелы могут расширяться[2]. Для его обозначения используется аббревиатура ZWSP[3][4].
Использование
правитьНа HTML-страницах пробел нулевой ширины можно использовать для обозначения потенциального разрыва строки без переноса, как и HTML-элемент <wbr>
. Для переноса строки через дефис используется мягкий дефис. Пробел нулевой ширины не поддерживался в некоторых старых веб-браузерах[5].
Чтобы показать эффект пробела нулевой ширины, следующие слова разделены пробелами нулевой ширины:
LoremIpsumDolorSitAmetConsecteturAdipiscingElitSedDoEiusmodTemporIncididuntUtLaboreEtDoloreMagnaAliquaUtEnimAdMinimVeniamQuisNostrudExercitationUllamcoLaborisNisiUtAliquipExEaCommodoConsequatDuisAuteIrureDolorInReprehenderitInVoluptateVelitEsseCillumDoloreEuFugiatNullaPariaturExcepteurSintOccaecatCupidatatNonProidentSuntInCulpaQuiOfficiaDeseruntMollitAnimIdEstLaborum
А следующие слова не разделяются этими пробелами:
LoremIpsumDolorSitAmetConsecteturAdipiscingElitSedDoEiusmodTemporIncididuntUtLaboreEtDoloreMagnaAliquaUtEnimAdMinimVeniamQuisNostrudExercitationUllamcoLaborisNisiUtAliquipExEaCommodoConsequatDuisAuteIrureDolorInReprehenderitInVoluptateVelitEsseCillumDoloreEuFugiatNullaPariaturExcepteurSintOccaecatCupidatatNonProidentSuntInCulpaQuiOfficiaDeseruntMollitAnimIdEstLaborum
В браузерах, поддерживающих пробелы нулевой ширины, изменение размера окна приведёт к повторному разрыву первого текста только по границам слов, в то время как второй текст вообще не будет разорван или будет разорван произвольно.
Запрет на использование в URL
правитьПравила ICANN и большинство браузеров запрещают включать в доменные имена неотображаемые символы, такие как пробел нулевой ширины, поскольку они могут использоваться для атаки омографа (фишинга), когда вредоносный URL-адрес визуально неотличим от настоящего[6][7].
Кодирование
правитьСимвол пробела нулевой ширины обозначается в Unicode как ZERO-WIDTH SPACE, имеет шестнадцатеричный код 200B и десятичный код 8203[8].
Представление в TeX — \hskip0pt ; представление в LaTeX — \hspace{0pt}
;[9] и представление в groff — \:
[10].
Его семантика и реализация HTML аналогичны мягкому дефису, за исключением того, что мягкие дефисы отображают символ дефиса в точке разрыва строки.
См. также
править- Пробел — включает таблицу, в которой сравниваются различные символы пробела.
- Разделитель слов
- Перенос слов
Литература
править- Unicode Consortium, "Special Areas and Format Characters" (Глава 16), The Unicode Standard (Стандарт Юникод) , Версия 5.2.
- Майр, Виктор Генри[англ.], Yongquan Liu, Characters and computers, IOS Press, 1991.
Примечания
править- ↑ Zones spéciales et caractères de formatage (фр.). Hapax Quebec. — «Les espaces sans chasse sont conçues pour les langues qui ne séparent pas les mots à l’aide d’espaces visibles, comme le thaï ou le japonais.» Дата обращения: 31 июля 2019. Архивировано 27 декабря 2005 года.
- ↑ The Unicode Standard 6.1 Архивная копия от 6 сентября 2018 на Wayback Machine, p. 366
- ↑ Источник . Дата обращения: 25 декабря 2022. Архивировано 25 декабря 2022 года.
- ↑ ZWSP | copy a zero-width space to your clipboard . Дата обращения: 25 декабря 2022. Архивировано 24 декабря 2022 года.
- ↑ Dunae. Better Web Typography with Spaces and Hyphens . dunae.ca. Дата обращения: 3 декабря 2009. Архивировано 14 декабря 2010 года.
- ↑ Network.IDN.blacklist_chars . mozillaZine. Дата обращения: 7 февраля 2018. Архивировано 8 февраля 2018 года.
- ↑ Unicode Character 'Zero Width Space' . FileFormat.Info. Дата обращения: 7 февраля 2018. Архивировано 8 февраля 2018 года.
- ↑ General Punctuation – Unicode . Дата обращения: 20 июля 2013. Архивировано 3 марта 2016 года.
- ↑ The LaTeX Companion. Chapter 3: Basic Formatting Tools . Дата обращения: 16 июля 2019. Архивировано 16 июля 2019 года.
- ↑ groff(7) – Linux manual page . Дата обращения: 8 февраля 2014. Архивировано 3 марта 2021 года.