URL Encoding

Was ist URL Encoding?

Die URL-Adresse einer Website, auch bekannt als Website-Adresse, wird von einem Benutzer in den Browser eingegeben, um auf diese Website zuzugreifen. Bei der Eingabe der Adresse d├╝rfen nur zul├Ąssige ASCII-Zeichen verwendet werden. Zu den zul├Ąssigen Zeichen geh├Âren alphabetische Zeichen, Ziffern und einige Sonderzeichen, die in der URL-Adresse eine bestimmte Bedeutung haben. Alle anderen Zeichen, wie zum Beispiel deutsche Umlaute m├╝ssen so codiert sein, dass der Browser oder Server sie ohne Schwierigkeiten versteht und die gesuchten Seiten oder Ressourcen finden kann. Dieses Verfahren wird URL Encoding genannt.

Was URL Encoding bedeutet

URL-Adressen, die andere Zeichen enthalten, als im elementaren Englisch gebr├Ąuchlich, werden vom Browser nicht verstanden, wenn nicht angegeben wird welches URL Encoding verwendet wurde. Durch eine fehlende oder falsch angegebene Zeichencodierung leidet nicht nur die Lesbarkeit einer Adresszeile, es kann auch zur Folge haben, dass Inhalte von Suchmaschinen nicht gefunden werden.
Alle Zeichen, die ein Computer verarbeiten kann, werden in einem Zeichensatz (engl. character set) zusammengefasst. Jedes Zeichen dieses Zeichensatzes ist einer Nummer zugeordnet, die im Computer durch eine Anzahl Bytes repr├Ąsentiert werden. F├╝r die URL-Adresse einer Website wird die heute g├╝ltige UTF-8 Zeichencodierung verwendet. Dieser auch Unicode genannte Zeichencode enth├Ąlt so gut wie alle Zeichen, die in den Schriften der Welt anzutreffen sind.

URL Encoding basiert auf dem ASCII-Zeichensatz und bietet dem Benutzer die M├Âglichkeit, Sonderzeichen oder Leerzeichen in einer URL-Adresse zu verwenden. Enth├Ąlt eine URL-Adresse Buchstaben oder Zeichen au├čerhalb des ASCII-Codes, m├╝ssen diese in der Adresse von einem Prozentzeichen “%” gefolgt von einem Zwei-Zeichen-Code codiert werden.

URL Encoding in der Praxis

Das am h├Ąufigsten codierte Zeichen in einer URL ist das Leerzeichen. Normalerweise interpretiert der Browser ein Leerzeichen als Ende der Adresse. Ein Leerzeichen inmitten einer Adresse w├╝rde zu einem Fehler f├╝hren, weil der Browser an der Stelle des Leerzeichens mit der Interpretation abbricht. Um dieses zu vermeiden wird bei der URL Encoding das Leerzeichen durch den Code %20 oder ein Pluszeichen ersetzt. Auch das Pluszeichen repr├Ąsentiert ein Leerzeichen, das auf einem bestimmten Platz in der Adresse zu finden ist. Ein Beispiel f├╝r die Codierung eines Leerzeichens:

http://meine.site.de/Dies+ist+ein+Beispiel

http://meine.site.de/Dies%20ist%20ein%20Beispiel

Bei dieser URL Encoding w├╝rde das Leerzeichen durch ein Pluszeichen oder %20 ersetzt werden. Das Ergebnis w├Ąre das gleiche. Um ein Zeichen in der URL zu codieren, wird das Sonderzeichen durch eine Kodierungszeichenfolge ersetzt.

Welche Zeichen sollten durch URL Encoding ersetzt werden?

Zeichen, die in einer URL-Adresse ohne Probleme verwendet werden k├Ânnen sind Buchstaben A-Z oder a-z, Ziffern 0 bis 9 sowie die Zeichen – _ . ~. Alle anderen Zeichen innerhalb einer URL-Adresse, wie zum Beispiel # % ” < > { } | ^ [ ] `, m├╝ssen deshalb immer codiert werden. In der Regel werden Sonderzeichen in einer Adresse aber nur sehr selten verwendet, eine Ausnahme bilden deutsche Umlaute. Die meisten Adressen enthalten jedoch nur einfache ASCII-Zeichen, sodass ├╝berhaupt keine Kodierung ben├Âtigt wird.
F├╝r jedes Zeichen, bei dem es sich nicht um ein alphabetisches Zeichen, eine Zahl oder ein ASCII-Sonderzeichen handelt, muss ein URL Encoding erfolgen. In der folgenden Tabelle finden Sie Zeichen, die in einer Adresse gefunden werden k├Ânnen, sowie deren Codierung:

URL Encoding f├╝r reservierte Zeichen

  • : Separates Protokoll (http) von Adresse % 3B
  • / Separate Domain und Verzeichnisse % 2F
  • # Separate Anker % 23
  • ? Separate Abfragezeichenfolge % 3F
  • & Getrennte Abfrageelemente % 24
  • @ Trennen Sie Benutzername und Passwort von der Domain % 40
  • % Zeigt ein codiertes Zeichen an % 25
  • + Zeigt ein Leerzeichen an % 2B
  • Nicht in URLs empfohlen % 20 oder +

Beachten Sie, dass URL Encoding andere Codes verwendet als bei HTML-Sonderzeichen. Wenn Sie beispielsweise eine URL mit einem kaufm├Ąnnischen Und-Zeichen (&) codieren m├╝ssen, verwenden Sie % 24, wie es in der oben stehende Tabelle angezeigt wird. Wenn Sie in HTML ein kaufm├Ąnnisches Und-Zeichen zum Text hinzuf├╝gen m├Âchten, k├Ânnen Sie % 24 nicht verwenden. Stattdessen m├╝ssen Sie entweder “& amp;” oder “& # 38;” verwenden, damit die Zeichen auf einer HTML-Seite richtig dargestellt werden. Dies mag auf den ersten Blick verwirrend erscheinen, aber es ist im Grunde der Unterschied zwischen dem Text, der auf der Seite selbst erscheint und Teil des HTML-Codes ist. Dagegen ist die URL-Zeichenfolge eine separate Einheit und unterliegt daher unterschiedlichen Regeln. Die Tatsache, dass das Zeichen “&” sowie viele andere Zeichen in jeder Codierung erscheinen k├Ânnen, sollte nicht mit der unterschiedlichen Bedeutung der Zeichen verwechselt werden.

Reservierte Zeichen mit besonderer Bedeutung

Eine Ausnahme gilt auch f├╝r diese reservierten Zeichen, die eine besondere Bedeutung f├╝r den Dateipfad haben. Diese sind:

! # $ % & ‘ ( ) * + , / : ; = ? @ [ ]

URL Encoding ist f├╝r das SEO Marketing ausgesprochen wichtig, damit Benutzer, Browser und Server die Adresse richtig interpretieren k├Ânnen. Fehlerhafte URLs werden von den Suchmaschinen ignoriert. Im Web finden Sie zahlreiche Tools, die eine Adresse mit Sonderzeichen schnell in eine g├╝ltige Adresse umwandeln.

Tipp

Wenn Sie noch Fragen bez├╝glich eines Online Marketing Themas haben, dann k├Ânnen Sie gerne unseren Glossar besuchen und sich ├╝ber das Thema informieren, wo Sie noch speziell Fragen haben.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte