Diskussion:UTF-32

Byte ist eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen der englischen Sprache aus dem Basis-Zeichensatz aufzunehmen. (bei ASCII: 1 Zeichen = 8 Bit = 1 Byte; bei UTF-32: 1 Zeichen = 32 Bit = 4 Oktette = 1 Byte ! Oder nicht? (nicht signierter Beitrag von 85.182.66.62 (Diskussion | Beiträge) 00:29, 17. Sep. 2005 (CEST)) Beantworten

Nein. Bei ASCII waeren es 7 bit, bei Unicode 21. RedNifre 02:34, 15. Feb. 2008 (CET)Beantworten

Das war früher mal. Heutzutage gilt 1 Byte = 8 Bit. (nicht signierter Beitrag von 80.135.161.31 (Diskussion | Beiträge) 06:34, 25. Feb. 2009 (CET)) Beantworten

Falsch. Vgl. Datenwort, Byte. --Benji 00:18, 26. Feb. 2009 (CET)Beantworten

Auch ASCII Zeichen werden in 8 Bit codiert, wobei nur die hinteren 7 verwendet werden, beim erweiterten ASCII / ANSI sind es die vollen 8 Bit (z.B. im ISO-8859-n) Interessant bei UTF-16 und UTF-32 ist auch daß Nullbytes enthalten sein können. Textinterpreter, welche das Nullbyte als String-Ende interpretieren, können hier Probleme bekommen. Auch ein wichtiger Aspekt für C-Programmierer. (nicht signierter Beitrag von 37.209.77.237 (Diskussion) 22:47, 12. Dez. 2012 (CET))Beantworten

Angeblicher Vorteil des O(1)-Zugriffes Bearbeiten

Letzter Kommentar: vor 14 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Der Vorteil existiert nur, wenn man 1 Zeichen = 1 Codepoint festlegt. Je nach Unicode-Normalisierungsform brauchen Zeichen mit Diakritika aber mehr als einen Codepoint, etwa wenn ein Ü als <U+0055 U+0308> kodiert wird (wie es z.B. bei OS X geschieht). Für viele Zeichen-Diakritika-Kombinationen existieren auch gar keine "pre-composed" Zeichen, so dass man diese mit mehreren Codepoints ausdrücken muss, etwa kyrillische Vokale mit Betonungszeichen. Wer also meint, mit der Verwendung von UTF-32 müsse er sich um Zeichenkodierungen mit variabler Länge nicht mehr herumplagen, macht es sich zu einfach oder unterstützt (ggf. unwissentlich) nur eine Teilmenge von Unicode. :-( --RokerHRO 10:42, 15. Mär. 2010 (CET)Beantworten

Unicode Standard Bearbeiten

Letzter Kommentar: vor 5 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

"Im aktuellen Unicode Standard 5.1 [...]", das ist doch nicht mehr im Ansatz aktuell, oder? Wir sind inzwischen bei v11. Felix D. (Diskussion) 11:40, 9. Sep. 2018 (CEST)Beantworten

Abschnitt hinzufügen