Punycode

Punycode

© Copyright Shutterstock / Paolo De Gasperis

Was ist Punycode?

Punycode ist ein standardisiertes Kodierungsverfahren, welches die Unicode (UTF-8) Zeichenkette in ASCII-Zeichen konvertiert. Es kann ebenso die umgekehrte Konversion vornehmen. Das Zeichenset ASCII ist ein 7-Bit-Code, der bereits in den 1960ern eingefĂŒhrt wurde und zur Darstellung von Domain- und Hostnamen genutzt wird. Mittels dieses Konvertierungsverfahrens ist es möglich auch Umlaute und Akzente bei Domainnamen zu verwenden.

Hintergrund und Geschichte

Als das Domain Name System (DNS) in den frĂŒhen 80er Jahren konzipiert wurde, wurden keine Schriftzeichen vorgesehen, die nicht zum lateinischen Alphabet gehören. Lange Zeit war es nicht möglich internationale Domainnamen als Domain zu registrieren. Diakritische Zeichen, Umlaute und Buchstaben aus anderen Alphabeten konnten nicht verwendet werden. Der Bedarf nach einem neuen Internetstandard wuchs schließlich mit der fortlaufenden Weiterentwicklung des Internets. Bereits im Jahr 2000 diskutierte die Internet Engineering Task Force ĂŒber Lösungsmöglichkeiten. Es wurde zunĂ€chst UTF-5 vorgeschlagen. Unicode sollte auf diese Weise in fĂŒnf Bit Positionen umgewandelt werden. Die UTF-5 VerschlĂŒsselungsmethode hatte allerdings einige Nachteile. Einfache Wörter aus anderen Sprachen, etwa Japanisch oder Koreanisch, wurden zu ellenlangen und kryptischen URL-Namen umgewandelt.

Im Jahr 2003 erarbeitete die Network Working Group schließlich den Entwurf fĂŒr ein neues Kodierungsverfahren, das den Namen Punycode erhielt. Zeitgleich erschien mit IDNA2003 ein neuer Internetstandard, der die Bezeichnung Internationalizing Domain Names in Applications (IDNA) trĂ€gt. Dieser wurde 2008 mit IDNA2008 ergĂ€nzt und aktualisiert. Der in dem Dokument vorgeschlagene Algorithmus namens Bootstring leitet aus den gemachten Eingaben einen eigenen String ab.

Wenn Sie noch Fragen bezĂŒglich Algorithmus haben, dann können Sie gerne den jeweiligen Glossar dazu besuchen und sich ĂŒber das Thema informieren.

Anwendung

Sobald ein Nutzer in der Browserzeile eine Eingabe macht, wird die Zeichenkette automatisch vom Browser erfasst. Gibt er beispielsweise “mĂŒnchen.de” ein, so wird die Eingabe direkt mit Punycode in “xn--mnchen-3ya.de” umgewandelt. ZunĂ€chst normalisiert der Browser die Eingabe. Großbuchstaben werden in Kleinbuchstaben umgewandelt. Seit der EinfĂŒhrung von IDNA2008 findet dieser Normalisierungsprozess bereits auf der Benutzerseite statt. Bei der Normalisierung werden ebenfalls Ă€hnliche Zeichen ausgetauscht. Der Accent bei “CafĂ©” wird in “Cafe” umgewandelt und angeglichen. Insgesamt werden bei dem Konvertierungsverfahren sechs Prinzipien berĂŒcksichtigt. Eines der Prinzipien ist die Lesbarkeit von Domainnamen. Aus diesem Grund werden die Buchstaben aus dem lateinischen Alphabet, also die Zeichen von A bis Z, nicht angetastet.

Sobald die Normalisierungsphase abgeschlossen ist, werden alle Zeichen aus dem Domainnamen entfernt, die nicht zur ASCII-Zeichenkette gehören. Punycode fĂŒgt nun einen eigenen String ein. Bei der Bildung des Strings gelten mehrere Prinzipien. Der neu gebildete Domainname muss eindeutig bleiben und darf nicht lĂ€nger sein als der Ausgangsname. Jeder einmal umgewandelte Domainname muss zurĂŒckkonvertiert werden können. GrundsĂ€tzlich muss jeder Domainname umwandelbar sein. Das gesamte Konvertierungsverfahren muss einfach und nachvollziehbar bleiben.

Punycode versteht als gĂŒltige Basiszeichen die Buchstaben von A bis Z, sowie die Ziffern von 0 bis 9 und das Bindestrich-Minus. Verwendet ein Domainname ein Nicht-Basiszeichen, etwa einen Umlaut oder ein diakritisches Zeichen, so wird dem neu gebildeten String der PrĂ€fix “xn--” vorangestellt. Dieser deutet an, dass es sich um einen internationalen Domainnamen handelt, was im IDNA-Standard festgehalten wurde.

Die Nicht-Basiszeichen haben grundsĂ€tzlich einen eigenen Zahlenwert. In der Normalisierungsphase werden die Basiszeichen aneinandergehĂ€ngt. Das Wort “hĂ€sslich” wird so in “hsslich” umgewandelt. Da der Umlaut “Ă€” im Wort “hĂ€sslich” ein Nicht-Basiszeichen ist, wird diesem ein eigener Zahlenwert zugeordnet. Bei der Bildung dieser Zahl spielt die Position in der ursprĂŒnglichen Zeichenkette eine Rolle. Die 36 Basiszeichen stellen schließlich diese Zahl dar und werden nach der erfolgten Konvertierung einfach an den Text angehĂ€ngt. Es entsteht aus dem Wort “hĂ€sslich” der Code “xn--hsslich-5wa”.

Das Punycode Konvertierungsverfahren ermöglichte die Nutzung von Emoji-Domains. Diese relativ neuartige Domainform enthĂ€lt im Namen ein Emoji. Die Anmeldung einer solchen Domain muss in der Regel ĂŒber einen Punycode Converter erfolgen, der bei allen Vergabestellen in der Regel angeboten wird.

Relevanz in der SEO

Punycode spielt in der SEO nur bei der Anmeldung eines Domainnamen eine Rolle. Die Anmeldung findet ĂŒber eine der Domain-Vergabestellen statt. In Deutschland wĂ€re etwa die DENIC dafĂŒr verantwortlich. Bei der Vergabestelle kann man eine eigene Punycode-Schreibweise festlegen, was fĂŒr die spĂ€tere Referenzierung der Webseite wichtig ist. Denn einige Tools sind nicht in der Lage Sonderzeichen, Umlaute oder diakritische Zeichen auszulesen. Die richtige Referenzierung ist auch bei wichtigen Marketingtools wie Google Analytics von Bedeutung.

Suchmaschinen durchsuchen das Netz bereits mithilfe von internationalen ZeichensĂ€tzen. Automatisch werden Suchanfragen in Punycode umgewandelt. Internationale Domainnamen erleiden so beim SEO keinen Nachteil und werden genauso gefunden wie Webseiten, die nur die Basiszeichen verwenden. Trotzdem gibt es ein paar Fallstricke, auf die Webseitenbetreiber Acht geben sollten. Registriert man beispielsweise den Domainnamen “bĂŒcher.com”, aber nicht “buecher.com”, so besteht das Risiko, dass Konkurrenten oder sogar BetrĂŒger dies ausnutzen könnten. Aus diesem Grund wird allgemein empfohlen, dass man sich ebenso die möglichen Alternativnamen sichert.

Tipp

Wenn Sie noch Fragen bezĂŒglich eines Online Marketing Themas haben, dann können Sie gerne unseren Glossar besuchen und sich ĂŒber das Thema informieren, wo Sie noch speziell Fragen haben.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte