Skip to main content

URL Encoding

Was ist URL Encoding?

Die URL-Adresse einer Website, auch bekannt als Website-Adresse, wird von einem Benutzer in den Browser eingegeben, um auf diese Website zuzugreifen. Bei der Eingabe der Adresse dürfen nur zulässige ASCII-Zeichen verwendet werden. Zu den zulässigen Zeichen gehören alphabetische Zeichen, Ziffern und einige Sonderzeichen, die in der URL-Adresse eine bestimmte Bedeutung haben. Alle anderen Zeichen, wie zum Beispiel deutsche Umlaute müssen so codiert sein, dass der Browser oder Server sie ohne Schwierigkeiten versteht und die gesuchten Seiten oder Ressourcen finden kann. Dieses Verfahren wird URL Encoding genannt.

Was URL Encoding bedeutet

URL-Adressen, die andere Zeichen enthalten, als im elementaren Englisch gebräuchlich, werden vom Browser nicht verstanden, wenn nicht angegeben wird welches URL Encoding verwendet wurde. Durch eine fehlende oder falsch angegebene Zeichencodierung leidet nicht nur die Lesbarkeit einer Adresszeile, es kann auch zur Folge haben, dass Inhalte von Suchmaschinen nicht gefunden werden.
Alle Zeichen, die ein Computer verarbeiten kann, werden in einem Zeichensatz (engl. character set) zusammengefasst. Jedes Zeichen dieses Zeichensatzes ist einer Nummer zugeordnet, die im Computer durch eine Anzahl Bytes repräsentiert werden. Für die URL-Adresse einer Website wird die heute gültige UTF-8 Zeichencodierung verwendet. Dieser auch Unicode genannte Zeichencode enthält so gut wie alle Zeichen, die in den Schriften der Welt anzutreffen sind.

URL Encoding basiert auf dem ASCII-Zeichensatz und bietet dem Benutzer die Möglichkeit, Sonderzeichen oder Leerzeichen in einer URL-Adresse zu verwenden. Enthält eine URL-Adresse Buchstaben oder Zeichen außerhalb des ASCII-Codes, müssen diese in der Adresse von einem Prozentzeichen “%” gefolgt von einem Zwei-Zeichen-Code codiert werden.

URL Encoding in der Praxis

Das am häufigsten codierte Zeichen in einer URL ist das Leerzeichen. Normalerweise interpretiert der Browser ein Leerzeichen als Ende der Adresse. Ein Leerzeichen inmitten einer Adresse würde zu einem Fehler führen, weil der Browser an der Stelle des Leerzeichens mit der Interpretation abbricht. Um dieses zu vermeiden wird bei der URL Encoding das Leerzeichen durch den Code %20 oder ein Pluszeichen ersetzt. Auch das Pluszeichen repräsentiert ein Leerzeichen, das auf einem bestimmten Platz in der Adresse zu finden ist. Ein Beispiel für die Codierung eines Leerzeichens:

http://meine.site.de/Dies+ist+ein+Beispiel

http://meine.site.de/Dies%20ist%20ein%20Beispiel

Bei dieser URL Encoding würde das Leerzeichen durch ein Pluszeichen oder %20 ersetzt werden. Das Ergebnis wäre das gleiche. Um ein Zeichen in der URL zu codieren, wird das Sonderzeichen durch eine Kodierungszeichenfolge ersetzt.

Welche Zeichen sollten durch URL Encoding ersetzt werden?

Zeichen, die in einer URL-Adresse ohne Probleme verwendet werden können sind Buchstaben A-Z oder a-z, Ziffern 0 bis 9 sowie die Zeichen – _ . ~. Alle anderen Zeichen innerhalb einer URL-Adresse, wie zum Beispiel # % ” < > { } \ | ^ [ ] `, müssen deshalb immer codiert werden. In der Regel werden Sonderzeichen in einer Adresse aber nur sehr selten verwendet, eine Ausnahme bilden deutsche Umlaute. Die meisten Adressen enthalten jedoch nur einfache ASCII-Zeichen, sodass überhaupt keine Kodierung benötigt wird.
Für jedes Zeichen, bei dem es sich nicht um ein alphabetisches Zeichen, eine Zahl oder ein ASCII-Sonderzeichen handelt, muss ein URL Encoding erfolgen. In der folgenden Tabelle finden Sie Zeichen, die in einer Adresse gefunden werden können, sowie deren Codierung:

URL Encoding für reservierte Zeichen

  • : Separates Protokoll (http) von Adresse % 3B
  • / Separate Domain und Verzeichnisse % 2F
  • # Separate Anker % 23
  • ? Separate Abfragezeichenfolge % 3F
  • & Getrennte Abfrageelemente % 24
  • @ Trennen Sie Benutzername und Passwort von der Domain % 40
  • % Zeigt ein codiertes Zeichen an % 25
  • + Zeigt ein Leerzeichen an % 2B
  • Nicht in URLs empfohlen % 20 oder +

Beachten Sie, dass URL Encoding andere Codes verwendet als bei HTML-Sonderzeichen. Wenn Sie beispielsweise eine URL mit einem kaufmännischen Und-Zeichen (&) codieren müssen, verwenden Sie % 24, wie es in der oben stehende Tabelle angezeigt wird. Wenn Sie in HTML ein kaufmännisches Und-Zeichen zum Text hinzufügen möchten, können Sie % 24 nicht verwenden. Stattdessen müssen Sie entweder “& amp;” oder “& # 38;” verwenden, damit die Zeichen auf einer HTML-Seite richtig dargestellt werden. Dies mag auf den ersten Blick verwirrend erscheinen, aber es ist im Grunde der Unterschied zwischen dem Text, der auf der Seite selbst erscheint und Teil des HTML-Codes ist. Dagegen ist die URL-Zeichenfolge eine separate Einheit und unterliegt daher unterschiedlichen Regeln. Die Tatsache, dass das Zeichen “&” sowie viele andere Zeichen in jeder Codierung erscheinen können, sollte nicht mit der unterschiedlichen Bedeutung der Zeichen verwechselt werden.

Reservierte Zeichen mit besonderer Bedeutung

Eine Ausnahme gilt auch für diese reservierten Zeichen, die eine besondere Bedeutung für den Dateipfad haben. Diese sind:

! # $ % & ‘ ( ) * + , / : ; = ? @ [ ]

URL Encoding ist für das SEO Marketing ausgesprochen wichtig, damit Benutzer, Browser und Server die Adresse richtig interpretieren können. Fehlerhafte URLs werden von den Suchmaschinen ignoriert. Im Web finden Sie zahlreiche Tools, die eine Adresse mit Sonderzeichen schnell in eine gültige Adresse umwandeln.

Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG