• "Studienservice.de, eine Seite von und für Fernstudenten der FernUni Hagen, ersetzt den Smalltalk in der Mensa" Handelsblatt Karriere

DDM / KE1 / Kodierungsformat - Verständnisfrage

Unser Sponsor SAP 4 Students
kann mir jemand diesen Absatz erklären?
Das Unicode-Designprinzip der Effizienz lässt sich auf Ebene von Kodierungs-formaten erläutern. Für jedes der beiden Unicode-Kodierungsformate UTF8 und UTF16 lässt sich in einem Strom von Positionsdarstellungen von jeder Kodierungseinheit aus der Anfang der zugehörigen Positionsdarstellung mit beschränktem Backup finden. Im Falle von UTF16 muss höchstens um eine Kodierungseinheit zurückgegangen werden, im Falle von UTF8 höchstens um drei Positionen.
Quelle: DDM, KE1, Seite 40
Was heißt "zurückgehen"?
Was heißt "mit beschränktem Backup"?
 
Das soll bedeuten, wenn du ein beliebiges Byte in einem UTF8 oder UTF16 Datenstrom betrachtest, kannst du erkennen, welche anderen Bytes zusammen mit dem betrachteten Byte ein binär kodiertes Zeichen aus der Codetabelle darstellen. Da maximal 4 Bytes verwendet werden muss man ggf nur beschränkt auf max. 4 Bytes zurückgehen, um den Anfang des Zeichens zu finden.
 
Dr Franke Ghostwriter
Achso! D.h. wenn ich z.B. bei UTF 8 das byte 10xxxxxx betrachte, dann muss ich 1,2 oder max. 3 bytes (= kodeeinheiten) zurückgehen um alle Kodeeinheiten des Zeichens zu haben, im Falle von 3 wäre das dann 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

Verstanden.
 
Oben