Wer sich im Internet bewegt, sollte wissen, wie sich die Adressen und Verknüpfungen zu Webseiten eigentlich genau zusammensetzen und was sie bedeuten. Diese Kenntnisse sind vor allem nützlich, um betrügerische Webseiten oder Verknüpfungen zu solchen Webseiten in sogenannten Phishing-E-Mails zu erkennen.
Die Eingabezeile
Alle Web-Browser, also Programme, die Webseiten anzeigen, haben eine Eingabezeile, in die man die Adresse einer Webseite eingeben kann, um sie zu besuchen. Der folgende stilisierte Browser zeigt, welche Zeile gemeint ist:
Der Bereich, in dem hier „Eingabezeile für Adressen“ steht, ist in den meisten aktuellen Browsern gleichzeitig für Adressen und für Suchbegriffe zuständig. Wenn man eine unvollständige Webseiten-Adresse eingibt, wird eine Suche ausgelöst, die Suchergebnisse auflistet, bei einer vollständigen Adresse wird direkt die Webseite geöffnet.
Die vollständige Adresse einer Webseite besteht aus mehreren Elementen, nicht jedes Element muss vorhanden sein. Jedes Element steht an einer genau definierten Position. Leider zeigen Browser heutzutage oft nicht mehr die gesamte Adresse an, sondern nur noch einen Teil. Oft verschweigen sie das Protokoll, das genutzt wird; doch dazu später mehr.
Name und Top-Level Domäne
Die grundlegende Adresse der Webseite, auf der Sie sich gerade befinden, lautet:
computer-service-remscheid.de
Bei den meisten Browsern dürften Sie diese Adresse im oberen Bereich des Browsers jetzt in der Eingabezeile sehen. Sie steht dort aber nicht allein, weil Sie sich derzeit auf einer anderen Seite als der Startseite befinden. Aber sehen wir uns zunächst diese Adresse an.
Sie besteht aus zwei Elementen, die durch einen Punkt getrennt sind. Das Element vor dem Punkt (computer-service-remscheid) ist der eigentliche Name der Webseite. Dieser Name ist ein wichtiges Identifikationsmerkmal. Innerhalb des Namens können, wie im Beispiel, Bindestriche verwendet werden, jedoch keine Punkte oder andere Sonderzeichen.
Das Element nach dem Punkt ist die sogenannte Top-Level Domäne (de). Diese Domäne steht für „Deutschland“, es handelt sich also um eine deutsche oder in Deutschland beheimatete Webseite. Es gibt viele weitere Top-Level Domänen, nicht nur Kürzel für Länder wie .it (Italien), .co.uk (zweiteilig für Commonwealth United Kingdom) usw., sondern auch für thematische Grobeinteilungen wie .com (kommerziell), .mil (Militär), .gov (Regierungen), .org (nicht-kommerzielle Organisationen), .net (Netzwerke) und viele mehr. Es gibt auch neuere Top-Level Domänen wie .info oder .museum, die mehr als drei Buchstaben enthalten können.
Diese Kombination aus Name und Top-Level Domäne ist der wichtigste Bestandteil einer Webseiten-Adresse. Nur sie identifiziert die Seite und bestätigt, dass Sie wirklich auf der richtigen Seite sind.
Beispiel: Die Adresse des Internet-Bezahldienstleisters PayPal lautet paypal.com. Eine Webseite, die pay-pal.com, pay.pal.com oder paypal.webseite.com heißt, ist nicht die korrekte Webseite von PayPal. PayPal hat sich Länder-Domänen wie paypal.de auch gesichert, weshalb diese Adresse auf paypal.com weiterleitet, aber bei kleineren Webseiten ist nicht davon auszugehen, dass der Betreiber sich alle Top-Level Domänen sichern kann.
Jemand anders könnte zum Beispiel computer-service-remscheid.com registrieren und dort eine Kopie meiner Webseite anlegen, die dann vielleicht Schadsoftware verteilt. Deshalb ist es wichtig, auch immer auf die korrekte Top-Level Domäne zu achten.
Subdomänen
Nicht selten steht noch etwas durch Punkt getrennt vor dem eigentlichen Webseitennamen. Das nennt man dann eine Subdomäne. Wer eine große Webseite betreibt, der unterteilt seine Seite vielleicht mithilfe solcher Subdomänen, zum Beispiel shop.webseite.de für den Webshop oder blog.infoportal.de für ein Blog. Sehr häufig sieht man noch die früher weithin übliche Subdomäne www, die für „world wide web“ steht und grafische Inhalte für den Browser damals von anderen Inhalten trennen sollte, die über das entstehende Internet verteilt wurden, aber nicht für Browser gedacht waren. Auch meine Webseite ist sowohl unter computer-service-remscheid.de als auch unter www.computer-service-remscheid.de erreichbar, weil viele Leute das www für einen unverzichtbaren Bestandteil einer Web-Adresse halten.
Anders als der eigentliche Name der Webseite hat die Subdomäne aber keine identifizierende Bedeutung. Jeder Webseiten-Besitzer kann Subdomänen ganz nach Wunsch einrichten. So könnte ich ohne weiteres auch paypal.computer-service-remscheid.de einrichten – ich würde zwar wohl Ärger mit PayPal bekommen, wenn ich das täte, aber technisch steht dem nichts im Wege.
Achten Sie also darauf, dass nichts zwischen dem vermuteten Namen der Webseite und der Top-Level Domäne steht, denn sonst handelt es sich um einen Trick, bei dem eine Subdomäne verwendet wird, um den Namen des eigentlichen Ziels wenigstens irgendwo anzuführen.
Das Protokoll
Als Protokoll bezeichnet man bestimmte Kommunikationsabläufe zwischen Computern oder Programmen. Solche Kommunikation läuft nach sehr komplizierten Regeln ab, die genau definiert sein müssen, damit sich Computer und Programme verstehen können.
Das Protokoll, über das Browser mit Webservern (Computern, die Webseiten bereitstellen) sprechen, heißt „Hypertext Transfer Protocol“ oder abgekürzt http. Bei vollständigen Adressangaben für Webseiten steht die Protokollangabe immer ganz vorne und sieht so aus:
http://www.computer-service-remscheid.de
Die Notation mit Doppelpunkt und ein bis drei Schrägstrichen begegnet Ihnen vielleicht auch noch in anderen Bereichen.
Für unsere Zwecke ist von Belang, dass „http“ kein sicheres Protokoll ist, vor allem verschlüsselt es keine Inhalte. Deshalb gibt es für wichtige Webseiten die Möglichkeit, eine sichere und verschlüsselte Variante der Seite auszuliefern. Das geschieht über das Protokoll https. Das s steht für „sicher“, „secure“.
Bei einer Webseite, die entweder von Anfang an oder ab dem Moment, wo Sie persönliche Daten eingeben (vor allem Anmeldungen), https verwendet, wird durch ein beglaubigtes Zertifikat bestätigt, dass es sich wirklich um die betreffende Seite handelt. Sollte mit dem Zertifikat etwas nicht stimmen, dann löst das eine entsprechende Warnung im Browser aus:
Die Umschaltung auf https führt der Webserver, von dem die Webseite ausgeliefert wird, selbst durch. Wenn Sie eine Seite, die https nicht unterstützt, mit https aufrufen, dann wird einfach keine Seite gefunden, so, als hätten Sie sich beim Namen verschrieben.
Leider zeigen moderne Browser den Teil der Adresse, der sich auf das Protokoll bezieht, meist nicht an. Stattdessen markieren sie eine sichere Verbindung anders, zum Beispiel durch ein grünes Vorhängeschloss – oder ein rotes, falls die Seite nicht sicher ist, bzw. ein graues mit einem Warnhinweis, falls Teile der Seite nicht per https gesichert sind, was bei unvollständiger Umstellung vorkommen kann.
Ab 2017 sollen die Browser verstärkt dazu übergehen, vor nicht sicheren Verbindungen zu warnen. Firefox 51 warnt z.B. vor Logins auf Seiten ohne https mit einem grauen, rot durchgestrichenen Vorhängeschloss. Es ist möglich, dass irgendwann auch eine generelle Warnung bei nicht sicherer Verbindung ausgegeben wird.
Öffnen Sie in einer neuen Registerkarte oder Instanz des Browsers https://paypal.com. Vergleichen Sie dort die Adressanzeige in der Eingabeleiste: so markiert der von Ihnen verwendete Browser Seiten, die https korrekt einsetzen. Hier handelt es sich sogar um ein Zertifikat, das soweit verifiziert ist, dass es den Namen der Inhaber-Firma anzeigt. Kleinere Webseiten wie z.B. meine haben das in dieser Form nicht.
Da https mit zusätzlichen technischen Mitteln auf dem Webserver umgesetzt wird und außerdem Geld kostet, sieht noch längst nicht jeder Webseitenbetreiber eine Notwendigkeit, auf https zu setzen. Dies wird sich aber womöglich in Zukunft immer mehr ändern, um die Sicherheit im Internet insgesamt etwas zu erhöhen. Dazu werden Anbieter kostenloser, aber trotzdem vertrauenswürdiger Zertifikate beitragen.
Update Januar 2017: Mittlerweile sind viele größere Hoster dazu übergegangen, ein SSL-Zertifikat kostenlos bei Hosting-Paketen mit anzubieten. Dabei handelt es sich meist um ein grundlegendes und völlig ausreichendes Zertifikat, das die Domäne mit und ohne vorangestelltes www absichert.
Unterverzeichnisse und Seitennamen
Auch hinter der Adresse der Webseite, im Anschluss an die Top-Level Domäne, stehen oft weitere Elemente. Ein Schrägstrich / leitet diese Elemente ein. Es handelt sich um die Namen von Verzeichnissen oder Seiten. Die Seite, die Sie gerade lesen, hat zum Beispiel die Adresse:
https://computer-service-remscheid.de/wie-sind-webseiten-verknuepfungen-aufgebaut
Auch hier gilt, dass der Name keine identifizierende Bedeutung hat. computer-service-remscheid.de/paypal.html ist genausowenig eine korrekte Seite von PayPal wie das weiter oben angeführte Beispiel einer Subdomäne.
Seitennamen sind oft daran zu erkennen, dass sie einen Punkt und eine Endung enthalten. Meist ist das .htm, .html, .php oder .asp. Es gibt auch andere mögliche Endungen. In allen Fällen handelt es sich aber um irgend eine Datei, deren Namen beliebig gewählt werden konnte.
Wenn es keine Endung gibt, dann handelt es sich nicht selten um ein Verzeichnis, ganz wie die Verzeichnisse oder Ordner in Ihrem Dateisystem. Auch dies wird aus Gründen der Übersichtlichkeit oft so eingerichtet, damit bestimmte Themen oder Bereiche in eigenen Unterverzeichnissen liegen. In keinem Fall haben diese jedoch zwingende identifizierende Bedeutung.
Parameter
Eine weitere Besonderheit sind Parameter. Parameter folgen nach einem ? irgendwo nach der Top-Level Domäne, z.B.:
computer-service-remscheid.de/?website=http://paypal.com
Auf diese Weise werden zum Beispiel Formulardaten übergeben oder bestimmte Anweisungen an die Webseite gegeben. Auch hier gilt, dass diese keine Webseite identifizieren. Zwar steht in diesem Beispiel auch die Adresse von PayPal, aber erst nach dem Fragezeichen. Das bedeutet, dass tatsächlich computer-service-remscheid.de geöffnet wird und dieser Seite der Parameter „website“ mit dem Wert „http://paypal.com“ übergeben wird.
Ein weiteres Sonderzeichen ist die Raute #, die auf einen Anker auf der gleichen Webseite hinweist, das ist eine anspringbare Stelle. Zum Beispiel ist diese Webseite so gestaltet, dass sie durch Aufruf der aktuellen Seite mit dem Zusatz #Parameter direkt diesen Absatz mit der Überschrift „Parameter“ anzeigt, also automatisch hierher scrollt:
https://computer-service-remscheid.de/wie-sind-webseiten-verknuepfungen-aufgebaut#Parameter
Probieren Sie es aus, indem Sie diese Zeile in die Adressleiste des Browser kopieren und dort öffnen. Auch die Angabe eines Ankers identifiziert die Seite jedoch nicht.
IP-Adressen
Zu guter Letzt gibt es noch die sogenannten IP-Adressen. Der Name paypal.com zum Beispiel ist schön und gut für Menschen, aber leider verstehen Computer diese Namen nicht. Computer wollen sogenannte IP-Adressen, die entweder im IPv4- oder IPv6-Format angegeben werden.
Wenn Sie in Ihren Browser die Adresse paypal.com eingeben, die Sie sich (hoffentlich) merken können, dann kommuniziert Ihr Browser zunächst einmal mit einem sogenannten DNS-Server, der diesen Namen in eine IP-Adresse umwandelt. Im Falle von paypal.com ist das Ergebnis zum Beispiel 66.211.169.3. Diese Nummer kann der Computer verarbeiten, aber sie ist für Menschen nur schwierig zu merken.
In vielen Fällen ist es möglich, eine Webseite auch durch Angabe der IP-Adresse anstelle des eigentlichen Namens zu öffnen, aber aus verschiedenen technischen Gründen nicht immer. Betrachten Sie zum Beispiel folgende Verknüpfung:
http://94.123.267.12/paypal
Um nicht zufällig eine real existierende IP-Adresse zu verunglimpfen, ist das Beispiel technisch nicht korrekt, Zahlengruppen über 255 kommen in der Realität nicht vor.
Hier gibt es keinen Webseitennamen und auch keine Top-Level Domäne, trotzdem identifiziert die IP-Adresse eine eindeutige Webseite. Leider können Sie kaum herausfinden, welche Webseite das ist. Deshalb ist bei Verknüpfungen, in denen IP-Adressen vorkommen, besondere Vorsicht geboten.
Übung
Wenn Sie überprüfen möchten, ob Sie die Ausführungen verstanden haben, schauen Sie sich mal die folgenden Verknüpfungen an und entscheiden Sie, welche Verknüpfungen wirklich auf die Seite trustme.bsp zeigen (Eine Top-Level Domäne .bsp gibt es derzeit nicht, sie dient hier nur zu Beispielszwecken).
Die Lösung finden Sie, wenn Sie das Feld „Lösungen“ unter der Liste anklicken und aufklappen.
https://trustme-bsp.shadysite.de/payments?trustme=true
http://shadysite.trustme-bsp.de/payments
http://payments.trustme.bsp/shadysite
http://94.123.267.12/payments
https://www.trustme.bsp/?p=1234
http://trustme.bsp/index.htm#abschnitt
http://www.shadysite.de/trustme.bsp.html
Ich hoffe, dass Ihnen diese Ausführungen dabei geholfen haben, Verknüpfungen zu Webseiten besser zu verstehen, und dass Sie mit diesem Wissen Phishing E-Mails und Webseiten leichter erkennen können.