Punycode

Was ist Punycode?

Punycode ist ein standardisiertes Kodierungsverfahren, welches die Unicode (UTF-8) Zeichenkette in ASCII-Zeichen konvertiert. Es kann ebenso die umgekehrte Konversion vornehmen. Das Zeichenset ASCII ist ein 7-Bit-Code, der bereits in den 1960ern eingef├╝hrt wurde und zur Darstellung von Domain- und Hostnamen genutzt wird. Mittels dieses Konvertierungsverfahrens ist es m├Âglich auch Umlaute und Akzente bei Domainnamen zu verwenden.

Hintergrund und Geschichte

Als das Domain Name System (DNS) in den fr├╝hen 80er Jahren konzipiert wurde, wurden keine Schriftzeichen vorgesehen, die nicht zum lateinischen Alphabet geh├Âren. Lange Zeit war es nicht m├Âglich internationale Domainnamen als Domain zu registrieren. Diakritische Zeichen, Umlaute und Buchstaben aus anderen Alphabeten konnten nicht verwendet werden. Der Bedarf nach einem neuen Internetstandard wuchs schlie├člich mit der fortlaufenden Weiterentwicklung des Internets. Bereits im Jahr 2000 diskutierte die Internet Engineering Task Force ├╝ber L├Âsungsm├Âglichkeiten. Es wurde zun├Ąchst UTF-5 vorgeschlagen. Unicode sollte auf diese Weise in f├╝nf Bit Positionen umgewandelt werden. Die UTF-5 Verschl├╝sselungsmethode hatte allerdings einige Nachteile. Einfache W├Ârter aus anderen Sprachen, etwa Japanisch oder Koreanisch, wurden zu ellenlangen und kryptischen URL-Namen umgewandelt.

Im Jahr 2003 erarbeitete die Network Working Group schlie├člich den Entwurf f├╝r ein neues Kodierungsverfahren, das den Namen┬áPunycode┬áerhielt. Zeitgleich erschien mit IDNA2003 ein neuer Internetstandard, der die Bezeichnung Internationalizing Domain Names in Applications (IDNA) tr├Ągt. Dieser wurde 2008 mit IDNA2008 erg├Ąnzt und aktualisiert. Der in dem Dokument vorgeschlagene Algorithmus namens Bootstring leitet aus den gemachten Eingaben einen eigenen String ab.

Tipp

Wenn Sie noch Fragen bez├╝glich Algorithmus haben, dann k├Ânnen Sie gerne den jeweiligen Glossar dazu besuchen und sich ├╝ber das Thema informieren.

Anwendung

Sobald ein Nutzer in der Browserzeile eine Eingabe macht, wird die Zeichenkette automatisch vom Browser erfasst. Gibt er beispielsweise “m├╝nchen.de” ein, so wird die Eingabe direkt mit┬áPunycode┬áin “xn--mnchen-3ya.de” umgewandelt. Zun├Ąchst normalisiert der Browser die Eingabe. Gro├čbuchstaben werden in Kleinbuchstaben umgewandelt. Seit der Einf├╝hrung von IDNA2008 findet dieser Normalisierungsprozess bereits auf der Benutzerseite statt. Bei der Normalisierung werden ebenfalls ├Ąhnliche Zeichen ausgetauscht. Der Accent bei “Caf├ę” wird in “Cafe” umgewandelt und angeglichen. Insgesamt werden bei dem Konvertierungsverfahren sechs Prinzipien ber├╝cksichtigt. Eines der Prinzipien ist die Lesbarkeit von Domainnamen. Aus diesem Grund werden die Buchstaben aus dem lateinischen Alphabet, also die Zeichen von A bis Z, nicht angetastet.

Sobald die Normalisierungsphase abgeschlossen ist, werden alle Zeichen aus dem Domainnamen entfernt, die nicht zur ASCII-Zeichenkette geh├Âren.┬áPunycode┬áf├╝gt nun einen eigenen String ein. Bei der Bildung des Strings gelten mehrere Prinzipien. Der neu gebildete Domainname muss eindeutig bleiben und darf nicht l├Ąnger sein als der Ausgangsname. Jeder einmal umgewandelte Domainname muss zur├╝ckkonvertiert werden k├Ânnen. Grunds├Ątzlich muss jeder Domainname umwandelbar sein. Das gesamte Konvertierungsverfahren muss einfach und nachvollziehbar bleiben.

Punycode┬áversteht als g├╝ltige Basiszeichen die Buchstaben von A bis Z, sowie die Ziffern von 0 bis 9 und das Bindestrich-Minus. Verwendet ein Domainname ein Nicht-Basiszeichen, etwa einen Umlaut oder ein diakritisches Zeichen, so wird dem neu gebildeten String der Pr├Ąfix “xn--” vorangestellt. Dieser deutet an, dass es sich um einen internationalen Domainnamen handelt, was im IDNA-Standard festgehalten wurde.

Die Nicht-Basiszeichen haben grunds├Ątzlich einen eigenen Zahlenwert. In der Normalisierungsphase werden die Basiszeichen aneinandergeh├Ąngt. Das Wort “h├Ąsslich” wird so in “hsslich” umgewandelt. Da der Umlaut “├Ą” im Wort “h├Ąsslich” ein Nicht-Basiszeichen ist, wird diesem ein eigener Zahlenwert zugeordnet. Bei der Bildung dieser Zahl spielt die Position in der urspr├╝nglichen Zeichenkette eine Rolle. Die 36 Basiszeichen stellen schlie├člich diese Zahl dar und werden nach der erfolgten Konvertierung einfach an den Text angeh├Ąngt. Es entsteht aus dem Wort “h├Ąsslich” der Code “xn--hsslich-5wa”.

Das┬áPunycode┬áKonvertierungsverfahren erm├Âglichte die Nutzung von Emoji-Domains. Diese relativ neuartige Domainform enth├Ąlt im Namen ein Emoji. Die Anmeldung einer solchen Domain muss in der Regel ├╝ber einen┬áPunycode┬áConverter erfolgen, der bei allen Vergabestellen in der Regel angeboten wird.

Relevanz in der SEO

Punycode┬áspielt in der SEO nur bei der Anmeldung eines Domainnamen eine Rolle. Die Anmeldung findet ├╝ber eine der Domain-Vergabestellen statt. In Deutschland w├Ąre etwa die DENIC daf├╝r verantwortlich. Bei der Vergabestelle kann man eine eigene┬áPunycode-Schreibweise festlegen, was f├╝r die sp├Ątere Referenzierung der Webseite wichtig ist. Denn einige Tools sind nicht in der Lage Sonderzeichen, Umlaute oder diakritische Zeichen auszulesen. Die richtige Referenzierung ist auch bei wichtigen Marketingtools wie Google Analytics von Bedeutung.

Suchmaschinen durchsuchen das Netz bereits mithilfe von internationalen Zeichens├Ątzen. Automatisch werden Suchanfragen in┬áPunycode┬áumgewandelt. Internationale Domainnamen erleiden so beim SEO keinen Nachteil und werden genauso gefunden wie Webseiten, die nur die Basiszeichen verwenden. Trotzdem gibt es ein paar Fallstricke, auf die Webseitenbetreiber Acht geben sollten. Registriert man beispielsweise den Domainnamen “b├╝cher.com”, aber nicht “buecher.com”, so besteht das Risiko, dass Konkurrenten oder sogar Betr├╝ger dies ausnutzen k├Ânnten. Aus diesem Grund wird allgemein empfohlen, dass man sich ebenso die m├Âglichen Alternativnamen sichert.

Tipp

Wenn Sie noch Fragen bez├╝glich eines Online Marketing Themas haben, dann k├Ânnen Sie gerne unseren Glossar besuchen und sich ├╝ber das Thema informieren, wo Sie noch speziell Fragen haben.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte