Skip to main content

IDN-Domain

Was ist eine IDN-Domain?

Mit IDN-Domains haben Sonderzeichen wie etwa Umlaute (ä, ö, ü) Einzug in die Welt der Domain-Namen gehalten. Die Abkürzung IDN steht für Internationalized Domain Name. Umgangssprachlich bezeichnet man diese Domains auch als Umlaut-Domains oder Sonderzeichen-Domains. Standardmäßig können weder Browser noch E-Mail-Programme Sonderzeichen lesen, weshalb sie intern über verschiedene Verfahren in lesbare Zeichen umgewandelt werden.

Was sind Sonderzeichen in einer IDN-Domain?

Ursprünglich unterstützten Domains lediglich den ASCII-Zeichensatz, also das lateinische Alphabet, die zehn arabischen Ziffern und den Bindestrich. Jedes Zeichen, das darüber hinaus geht, wird als Sonderzeichen klassifiziert. Hierzu gehören Umlaute und das Zeichen “ß” im Deutschen, darüber hinaus diakritische Zeichen wie etwa Akzente (á, à, é, è und so weiter) in den romanischen Sprachen. Auch viele andere Sprachen besitzen einen eigenen Satz an Sonderzeichen. Arabische, asiatische und afrikanische Sprachen haben zum Teil kaum Übereinstimmungen mit dem lateinischen Alphabet und bestehen somit aus Sicht des ASCII-Zeichensatzes komplett aus Sonderzeichen. Emojis, also Symbolbilder wie etwa Smileys, bilden einen relativ neuen Satz an Sonderzeichen.

Normalisierung der IDN-Domain mit IDNA

Serverseitig werden bei Domain-Namen bis heute nur ASCII-Zeichen unterstützt. Da jedoch zunehmend Bedarf an Domains aufkam, die beispielsweise das Zeichen “ß” verwenden, wurde nach einer Lösung gesucht, diese Domains in ASCII umzuwandeln. Sie werden dabei der ASCII-Norm angepasst, weshalb man auch von Normalisierung spricht. Zu diesem Zweck wurde der Internetstandard Internationalizing Domain Names in Applications, kurz IDNA, geschaffen. Er definiert allgemein gültige Regeln zur Übersetzung von Sonderzeichen in ASCII.

IDNA2003 stellte den ersten Ansatz zur Normalisierung von Domains dar. Hierbei kommt zunächst das Nameprep-Verfahren zum Einsatz. Es wandelt alle Großbuchstaben in Kleinbuchstaben um. Anschließend wird beispielsweise das Zeichen “ß” in “ss” umgewandelt. Hierbei ergab sich jedoch das Problem, dass Domain-Namen mit “ss” schon existierten. Wurde nun ein Domain-Name mit “ß” umgewandelt, kam es teilweise zu Konflikten mit schon bestehenden Domains.

2008 bis 2010 wurde der Standard daher überarbeitet und findet nun mit IDNA2008 seine Anwendung. Die Umwandlung von Großbuchstaben in Kleinbuchstaben ist nicht länger verpflichtend, wird jedoch empfohlen und außerhalb des Standards durchgeführt. Das Nameprep-Verfahren wird nicht länger innerhalb des Standards eingesetzt, sodass etwa “ß” nicht mehr automatisch in “ss” übersetzt wird. Stattdessen wird der Buchstabe nun als Unicode-Zeichen “Latin small letter sharp s” normalisiert.

IDNA2008 ist nicht in allen Fällen kompatibel zu IDNA2003. Manche Domains sind ausschließlich in IDNA2003 gültig, jedoch nicht in IDNA2008. Andere wiederum sind ausschließlich in IDNA2008 erlaubt, während wieder andere in beiden Standards unterstützt werden, aber zu unterschiedlichen Zielen führen.

Punycode zur Umwandlung von Sonderzeichen in der IDN-Domain

Jede IDN-Domain darf serverseitig nur ASCII-Zeichen (a-z, 0-9 und Bindestrich) enthalten. Alle darüber hinausgehenden Zeichen werden daher in Punycode umgewandelt. Dieses Kodierungsverfahren schafft für jedes Unicode-Zeichen eine eindeutige Abbildung in ASCII. Mit Punycode werden verschiedene Vorgaben umgesetzt, um etwa die im Rahmen von IDNA2003 aufgetretenen Probleme zu beheben. So muss jede Domain in Punycode umgewandelt werden können. Sie muss eine eindeutige Kodierung bekommen, die jederzeit in Unicode zurückgewandelt werden kann. Dabei soll der Punycode nicht viel länger als der Unicode sein, die Kodierung soll relativ einfach anwendbar sein und das Ergebnis im Punycode soll möglichst noch lesbar bleiben.

Bei der Umwandlung in Punycode werden aus dem Domain-Namen zunächst alle Nicht-ASCII-Zeichen entfernt. Jedes dieser Zeichen wird anschließend in ASCII umgewandelt und erhält zudem einen Code für seine Position im ursprünglichen Domain-Namen. Theoretisch kann es nun vorkommen, dass eine umgewandelte IDN-Domain mit einer bereits bestehenden Domain im ASCII-Zeichensatz übereinstimmt. Um sie zu unterscheiden, enthält der Punycode jeder IDN-Domain den Präfix “xn--“. Dieses Ergebnis wird auch ACE-String (ACE = ASCII Compatible Encoding) genannt.

Sonderzeichen in Top Level Domains

Mit der Einführung neuer Domain-Endungen hielt auch in diesem Bereich die Internationalisierung Einzug. Während Top-Level-Domains zunächst nur lateinische Zeichen enthalten durften, stieg nun der Bedarf an Endungen, die beispielsweise chinesische oder arabische Zeichen unterstützen. Sonderzeichen in Domain-Endungen werden, wie im eigentlichen Domain-Namen auch, in Punycode umgewandelt. Die Regeln für die Kodierung sind identisch. Man spricht in diesem Fall von IDN TLD, also einer internationalisierten Top-Level-Domain.

Verwendung einer IDN-Domain in E-Mail-Adressen

Während die meisten Browser Domains mit Sonderzeichen inzwischen problemlos unterstützen, sieht es in Sachen E-Mail leider noch anders aus. Noch immer können nicht alle E-Mail-Clients Adressen mit Sonderzeichen unterstützen. Zudem ist beim Versand einer Nachricht nicht klar, ob das System des Empfängers mit der IDN-Domain klarkommt. Im Zweifelsfall sollte deshalb statt der Adresse mit Sonderzeichen lieber der entsprechende ACE-String der E-Mail-Adresse verwendet werden.

Spoofing unter Verwendung einer IDN-Domain

Der Begriff Spoofing bedeutet so viel wie “Manipulation” oder “Vortäuschung”. Ein Spoofer manipuliert dabei die eigene Identität und gibt sich als eine andere Partei aus. Im Unicode-Zeichensatz existieren verschiedene Zeichen, die einander täuschend ähnlich sehen. Diesen Umstand nutzt Spoofing aus. Beispielsweise werden Domains registriert, deren Unicode-Schreibweise fast genau so aussieht wie jene einer bestehenden Domain im ASCII-Zeichensatz. Für Personen, die lediglich auf einen Link klicken, ist der Unterschied kaum auszumachen. Jedoch werden sie auf eine andere Webseite als die ursprünglich erwartete weitergeleitet. Dort findet sich für gewöhnlich Malware oder es werden Login-Daten ausgespäht.

IDN-Domain und Suchmaschinenoptimierung

Inzwischen kann jede gängige Suchmaschine eine IDN-Domain verarbeiten. Die Domain erfährt keinen Nachteil, wenn es um organische Suche geht. Jedoch empfiehlt sich bei der manuellen Eintragung in Tools wie etwa Google Analytics die Verwendung der Punycode-Schreibweise der Domain. Nur so kann sie eindeutig referenziert werden. Außerdem können nicht alle für die Suchmaschinenoptimierung verwendeten Tools mit Sonderzeichen in Domain-Namen umgehen. Auch hier sollte also immer der Punycode verwendet werden.

Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG