IT Werkstatt

Dominiks IT Werkstatt! Mein Blog und Dienstleistungen über Webdesign, 3D Animationen, Java, HTML5, PHP, CSS, Blender 3D, GIMP und vieles mehr.


Ärger mit der BOM

Der BOM (Byte Order Mark - Bytereihenfolge-Markierung) dient dazu mitzuteilen, mit wievielen Bit die Zeichen des folgenden Datenstroms kodiert sind. Dies ist bei den Zeichensätzen UTF-16 und UTF-32 besonders erforderlich. Das Ärgerliche dabei ist, dass dieses Zeichen in normalen Editoren nicht sichtbar ist.

Gerade bei der Verarbeitung mit Java kann es hier zu Problemen kommen, da Java das BOM nicht automatisch erkennt und entfernt.

Eine einfache und schnelle Methode zur Überprüfung und Entfernung des BOMs sieht so aus:

String value = "Ein String mit BOM am Anfang.";
if ( (int) value.charAt( 0 ) == 65279 )
{
    //BOM wird entfernt
    value = value.substring( 1 );
}

Mehr Informationen zum BOM gibt es im entsprechenden Wikipedia-Artikel.

3.gif0.gif9.gif8.gif4.gif