Portal Diskussion:Unicode/Archiv/2019

Letzter Kommentar: vor 5 Jahren von Antonsusi in Abschnitt Alleinstehende kombinierende Zeichen

*descender" – einheitliche deutsche Bezeichnung?

In Portal_Diskussion:Russland#Deutsche_Bezeichnung_für_den_"descender"_des_Buchstabens_Щ? kam gerade die Frage, ob es einen üblichen/etablierten deutschen Namen für das "Häkchen" an manchen kyrillischen (aber auch lateinischen) Buchstaben gäbe. Dabei fiel mir auf, dass die engl. Bezeichnung "descender" in unseren Unicode-tAbellen völlig verschiedene Übersetzungen liefert. Soll das so bleiben? Woher kommen diese Übersetzungen? Von (verschiedenen) Autoren quellenlos ausgedacht? Irgendwie finde ich den jetzigen Zustand unbefriedigend. --RokerHRO (Diskussion) 12:19, 29. Apr. 2019 (CEST)

 
“descender” visualisiert als „Pferdeschwanz“
 
Ш und Щ
Diese „Häkchen“ ist ja das Gestaltungsmerkmal, das den kyrillischen Buchstaben Щ vom Ш unterscheidet, und das dann auch im 20. Jahrhundert in der Sowjetunion bei der Alphabetisierung verschiedener Minderheitensprachen für aus vorhandenen Formen abgeleitete neue lateinische und kyrillische Buchstaben verwendet wurde.
Ich kann mich erinnern, vor einigen Jahren irgendwo die Bezeichnung „Pferdeschwanz“ gelesen zu haben, habe das Dokument aber nicht wiedergefunden (es kann auch eine Google-Übersetzung aus einem russischen oder sonst einem Text gewesen sein). Mir schien diese Bezeichnung treffend (gerade weil typografische Bezeichnungen manchmal sehr bildhaft sind). Wenn sich ein Beleg wiederfinden lässt, hätten wir eine eindeutige und prägnante Bezeichnung. -- Karl432 (Diskussion) 15:02, 29. Apr. 2019 (CEST)

Wieviel Bits hat ein Unicode-Zeichen

Auf der Suche nach "Wieviele Bits hat Unicode?" fand ich hier nur nette Worte über Ascii, dessen Bit-Zahl, über Internationales, über Ziele, das gewohnt Ausführliche von Wikipedia halt. Schade. Aber vielleicht habe ich nicht lang genug gesucht. – Fritz Jörn (Diskussion) 10:16, 16. Jun. 2019 (CEST)

@Fritz Jörn: Du must unter UTF-8 nachlesen, denn so nennt sich die häufigste Codierung für Unicode-Zeichen. Gruß von ÅñŧóñŜûŝî (Ð) 00:56, 18. Jun. 2019 (CEST)
Genau das führt m.E. in die Irre bezw. zurück zu 8-Bit-Zeichen. Ich geb’ ja zu, dass das die häufigste Kodierung ist – aber gerade eben nicht, das man gemeinhin als Unicode versteht. Weil’s die 8-Bit-Zeichen schon vor Unicode gab, ist Unicode die Erweiterung: Bei typischem Unicode sind’s 2 Byte = 16 Bit. Dass Unicode von UTF-8 bis UTF-32 von 8 bis 32 Bit lang sein kann, hilft einem nicht weiter, die Sache zu verstehen. Da kann man gleich sagen, Unicode ist ein Container, und da kann dann alles und vieles drin sein … – Fritz Jörn (Diskussion) 00:15, 30. Jun. 2019 (CEST)
Unicode ist eine Kodierung, die den jeweiligen Zeichen eine Zahl (=Codepoint) – zwischen 0 und 10FFFhex – zuweist. In wie viele Bits diese Zahlen nun kodiert werden, ist Sache des "Unicode Transfer Formates": UTF-32 kodiert jedes Zeichen in 32 Bit (daher der Name), UTF-16 in eine oder zwei 16-Bit-Pakete und UTF-8 in 1…4 8-Bit-Bytes. --RokerHRO (Diskussion) 23:50, 2. Jul. 2019 (CEST)

Alleinstehende kombinierende Zeichen

Wenn man ein kombinierendes Zeichen alleine mit gepunktetem Kreis darstellen will, wie es in den Unicodetabellen gemacht ist, muss man bei manchen Zeichen nur das Zeichen alleine schreiben, bei anderen muss man das Basiszeichen ◌ explizit schreiben, richtig? Aber hier gibt es jetzt ein Problem: bei den indischen Zeichen springt das Aussehen um, je nachdem, was davor im Text für Zeichen stehen. Siehe z.B. im Artikel Indian Script Code for Information Interchange mit dem dort Halant genannten Zeichen Virama (U+094D), das hat da manchmal einen gepunkteten Kreis und manchmal nicht, wobei es im Quelltext immer ohne drinsteht. Ist das ein Problem mit den installierten Schriftarten (hier: Windows 10/Firefox)? Welche Variante ist hier gewollt?

mit/ohne Basiszeichen: ohne mit
Allein in Tabelle: ◌्
Nach Buchstabe: A ् A ◌्
Nach Ziffer: 0 ् 0 ◌्

--androl ☖☗ 16:41, 5. Jul. 2019 (CEST)

In der Tabelle sollte immer auch der Kreis drin sein. Wenn er ohne explizite Angabe drin ist, dann ist der Kreis im Font drin oder der Browser (?) setzt ihn dorthin. Kennst du Babelmap? Damit kann man instalierte Fonts und andere Anzeigen. Zu finden hier. ÅñŧóñŜûŝî (Ð) 18:53, 5. Jul. 2019 (CEST)