medani-pixel
news
10
Feb 11

Internationalisierung einer Webseite - Encoding

Richtige Codierung bzw. richtiges Encoding einer Webseite ist das Wichtigste für internationale Auftritte. Richtig codierte Webseiten ermöglichen erst einen funktionierenden mehrsprachigen Internetauftritt.

Viele Unternehmen haben ein großes Portfolio. Gerade wenn das Unternehmen wächst, muss dieses internationaler auftreten und die eigene Webseite in mehreren Sprachen zur Verfügung stellen.

 

Die Internationalisierung ist oft ein leicht unterschätztes Unterfangen. Sicher sind allen Internetusern schon Seiten begegnet, wo anstelle der Umlaute und Sonderzeichen nur große Fragezeichen und Platzhalter entgegenleuchten, die die Lesbarkeit des Textes stark beeinträchtigen.

Gerade Sprachen die keine lateinischen Schriftzeichen beinhalten oder von rechts nach Links gelesen werden, treiben den Aufwand und damit die Kosten für eine multinationale Webseite stark in die Höhe.

Die Lösung nennt sich UTF-8 Codierung. Diese Zeichencodierung ist (so sollte man meinen) mittlerweile Standard für internationalisierte Webseiten. Gute Webdesigner und Webdeveloper setzen diese standardmäßig ein. Leider sind immer noch viele alte Webseiten nicht in dieser Codierung. Zusätzlich muss nicht nur die Webseite sondern auch die dazugehörige Datenbank richtig formatiert werden. Bei Datenbanken gilt generell: utf-8_unicode_ci ist die richtige Codierung. Dadurch werden Zeichen im UTF-8 Format codiert, Umlaute und Sonderzeichen werden richtig dargestellt.

Eine große Fehlerquelle beim Codieren sind Multi-Byte-Zeichen. Japanische Zeichen (Kanji) sind zum Beispiel solche Multi-Byte Zeichen. Die Fehler sind dabei meist erst ersichtlich, wenn man plötzlich vor der Fehlermeldung „Internal Server Error“ anstatt des Inhalts steht. Ebenfalls zu beachten ist, dass die am Server verfügbare Schrift UTF-8 fähig sein muss. Anderenfalls sind serverseitig generierte (dynamische) PDF Datein zwar in Deutsch und English lesbar, bestehen im Russischen, Arabischen oder Chinesischen nur aus Platzhalterzeichen. Auch im Deutschen können Umlaute dann oft nicht richtig dargestellt werden.

Hat man diese Hürde bewältigt, muss man die Seite noch fit für ältere Browser machen. Die richtige Angabe der Codierung im HTML- und HTTP-Header ist gerade für ältere Browser (ältere Internet Explorer Versionen zum Beispiel) ausgesprochen wichtig, um eine fehlerfreie Wiedergabe der Webseite zu gewährleisten.

UTF-8 Codierung einer Webseite

 

Hat man all diese Dinge erfolgreich umgesetzt und ein valides multinationales Webdesign oder Webapplikation erstellt, kann man das Design testen. Nicht vergessen, alle Sprachen ausgiebig zu testen, denn wer weiß, vielleicht hat sich ja doch noch wo ein Fehler eingeschlichen.

SENDEN
SENDEN