Стандарт Unicode
Стандарт Unicode был разработан с целью создания единой
кодировки символов всех современных и многих древних письменных
языков. Каждый символ в этом стандарте кодируется 16 битами, что
позволяет ему охватить несравненно большее количество символов,
чем принятые ранее 7- и 8-битовые кодировки. Стандарт Unicode позволяет
охватить до 65,536 кодов.
Unicode включает много наборов символов, с кодами знаков пунктуации,
математических символов, технических символов, стрелок и др. Это
обеспечивает наличие кодов для диакритов, которые используются как
модификации знаков типа тильды и появляются в соединении с другими
знаками. Всего Unicode обеспечивает коды для более чем 29,000 знаков
от мировых алфавитов, наборов иероглифов и символов.
Unicode содержит более чем 29,000 неиспользованных кодов для расширения,
позволяющие включить новые знаки. В будущем это может позволить
включить в стандарт исторические знаки типа иероглифов и возможные
расширения существующих алфавитов и/или наборов символов. Кроме
того, Unicode резервирует более чем 6,000 кодов для частного использования,
которые разработчики программного обеспечения и аппаратных средств
могут использовать для собственных знаков и символов.
Весь диапазон кодов разбит на несколько стандартных подмножеств,
каждое из которых соответствует либо алфавиту какого-то языка, либо
группе специальных символов, сходных по своим функциям.
Подробное описание стандарта Unicode можно найти по адресу http://www.unicode.org/
.
|