ISO 8859-5

lateinischer und kyrillischer Zeichensatz, basierend auf ASCII
ISO 8859
-1 Latin-1, Westeuropäisch
-2 Latin-2, Mitteleuropäisch
-3 Latin-3, Südeuropäisch
-4 Latin-4, Nordeuropäisch
-5 Kyrillisch
-6 Arabisch
-7 Griechisch
-8 Hebräisch
-9 Latin-5, Türkisch
-10 Latin-6, Nordisch
-11 Thai
-12 (existiert nicht)
-13 Latin-7, Baltisch
-14 Latin-8, Keltisch
-15 Latin-9, Westeuropäisch
-16 Latin-10, Südosteuropäisch

ISO 8859-5, genauer ISO/IEC 8859-5 auch bekannt als Kyrillisch, ist ein von der ISO zuletzt 1998 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der fünfte Teil der Normenfamilie ISO/IEC 8859.

Die mit sieben Bit kodierbaren Zeichen entsprechen US-ASCII mit führendem Nullbit. Zusätzlich zu den 95 darstellbaren ASCII-Zeichen (2016–7E16) kodiert ISO 8859-5 96 weitere (A016–FF16), also insgesamt 191 von theoretisch möglichen 256 (= 28). Den Positionen 0016–1F16 und 7F16–9F16 sind in ISO/IEC 8859 und damit ISO/IEC 8859-5 keine Zeichen zugewiesen. Dieser Bereich wurde bewusst freigehalten, um die entsprechenden Bytes für die Gerätesteuerung nutzen zu können oder sicherzustellen, dass diese bei einer unzureichend spezifizierten Codierung nicht in Konflikt mit solchen Steuerzeichen geraten. Die von der IANA definierte Bezeichnung ISO-8859-5 (mit Bindestrich) steht für die Kombination der Zeichen dieser Norm mit nicht darstellbaren Steuerzeichen gemäß ISO/IEC 6429.

ISO 8859-5 versucht, alle Zeichen der kyrillischen Alphabete abzudecken. Aus verschiedenen Gründen sind aber KOI8-R (Russisch), KOI8-U (Ukrainisch) und Windows-1251 weiter verbreitet. Im Juni 2014 verwenden 2,4 % aller Websites Windows-1251, ISO-8859-5 wird von weniger als 0,1 % verwendet.[1]

ISO-8859-5 inklusive der in ISO/IEC 8859-5 nicht enthaltenen Steuerzeichen
Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1… DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~ DEL
8… PAD HOP BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS3
9… DCS PU1 PU2 STS CCH MW SPA EPA SOS SGCI SCI CSI ST OSC PM APC
A… NBSP Ё Ђ Ѓ Є Ѕ І Ї Ј Љ Њ Ћ Ќ SHY Ў Џ
B… А Б В Г Д Е Ж З И Й К Л М Н О П
C… Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
D… а б в г д е ж з и й к л м н о п
E… р с т у ф х ц ч ш щ ъ ы ь э ю я
F… ё ђ ѓ є ѕ і ї ј љ њ ћ ќ § ў џ

SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.

Siehe auch

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Comparison of the usage statistics of Windows-1251 vs. ISO-8859-5 for websites. Abgerufen am 25. Juni 2022 (englisch).