TechTalk

Thema: Betriebsysteme (Praxis)

Problemloesungen

Thema: Werbung auf Webseiten mit Bordmitteln blockieren

Hassen wir sie nicht alle, die blinkenden Werbe-Banner? Ist uns nicht auch schon aufgefallen, dass Internetseiten mit besonders viel Werbung teilweise ewig lange braucht um zu laden?
Nun, es gibt Abhilfe und man braucht noch nicht mal ein Werbeblocker-Programm dafür, nur ein wenig Geduld und Wissen.

Vorab möchte ich daher erklären, wie ein Rechner überhaupt an eine Webseite und die ganzen Werbebanner kommt. Dazu muss ich freilich erst mal ein paar grundsätzliche Dinge erklären, aber keine angst, es ist nicht schwer zu verstehen und ich versuche nicht zu sehr ins Detail zu gehen.

Von dem Namen zur Adresse

Das DNS.

Nein, ich rede nicht von der “Desoxyribonukleinsäure“, wie man sie in der Biologie kennt, sondern in diesem Zusammenhang spricht man beim DNS vom “Domain Name System“.
Das DNS ist quasi wie ein Telefonbuch: Adressen von Rechnern im Netz werden immer als sogenannte "IP-Adresse" der Form 127.0.0.1 oder ähnlich verwaltet. Die kann man natürlich schlecht lesen und deswegen gibt es das DNS, welches jeder IP-Adresse einen oder mehrere Namen der Form "www.t-online.de" (subdomain.domain.topleveldomain) zuordnen kann.
Eine Adresse ist immer vorgegeben: Unter 127.0.0.1 erreicht ein Rechner immer nur sich selbst, der Name zu der Adresse lautet "localhost". Sollte man sich merken, denn das ist wichtig.

Der DNS-Server:

Der ist quasi die Auskunft: Damit dein Rechner weiß, welche IP-Adresse mit "www.t-online.de" gemeint ist, um mit ihm zu kommunizieren, fragt er zunächst einen DNS-Server: "Kollege, welche Adresse hat www.t-online.de?", dieser antwortet: "212.227.109.10" und schon ist klar, bei welcher Adresse man seine Daten abholen kann.

Wie man an die Daten kommt

Proxy Server:

Ein Proxy-Server ist ne Art Zwischenspeicher: damit dein Rechner sich nicht durch das halbe Internet hangeln muss, um an die Informationen zu kommen, gibt es Proxy-Server, die häufig angefragte Daten zwischen speichern und die auch eine großen Ansturm an Anfragen bewältigen können (was der Hinterhof-Server von "www.kleinkarlchen.invalid" möglicherweise nicht schafft).
Ändert sich der Inhalt einer Seite, muss der Proxy die Daten freilich neu holen, bevor er sie dir ausliefert. Das passiert aber in der Regel nicht so oft, wie Leute auf die Seite zugreifen und aus diesem Grund ist es immer unbedingt zu empfehlen, einen Proxy-Server zu benutzen, wenn der eigene Internet-Dienst einen anbietet.

Warum Werbung dem Netz schadet

Das Problem "Adserver:"

"Adserver" steht für "Advertising Server", sprich: ein Server, dessen einziger Job es ist Werbung auszuliefern. Ein Adserver ist eine unsäglich bescheuerte Erfindung, nicht weil er Werbung ausliefert, sondern weil er ein technisches Problem verursacht:

Die Aufgabe eines Adservers ist es, nicht einfach Werbung auszuliefern, sondern Werbung möglichst zielgenau zu platzieren, also für jeden User individuell, passend zu seinen Vorlieben und Surf-Gewohnheiten.
Ohne weiter auf die genaue Arbeitsweise (Cookies, Session-IDs, etc) einzugehen, kann man sagen, dass man, um Werbung für jeden Nutzer individuell zu platzieren, für jeden Zugriff individuelle Daten ausliefern muss, sprich: man verhindert dummerweise, dass ein Proxy ein Werbe-Banner zwischenspeichern kann, denn für jeden User liegen andere Daten an.
Um mit Werbung Geld zu machen, muss ein Adserver nicht nur Werbung möglichst zielgenau platzieren, nein er muss vor allem VIEL Werbung platzieren und weil er ja selbst nicht zulässt, dass er von einem Proxy unterstützt wird, muss der Adserver auch noch die komplette Last an eingehenden Anfragen bewältigen. Weil mit Werbung aber im Netz nicht so viel Geld zu machen ist, wie man sich denkt, sind viele Adserver gnadenlos unter-dimensioniert.
Ein weiteres Problem entsteht, wenn so ein Adserver umzieht und eine neue IP-Adresse bekommt: diese Adresse muss erst mal im DNS bekannt sein, sprich: dein DNS-Server fragt, wenn er sie nicht kennt oder wenn unter der Adresse niemand zu finden ist, einen anderen DNS-Server, und so weiter, bis feststeht, welche Adresse einem Namen aktuell zugeordnet ist.

Das hat zur Folge, dass das Laden einer eigentlich schnellen Seite durch viele Werbe-Banner, die ja von den Adservern kommen, ausgebremst wird:
a) Kann es lange dauern, bis die IP-Adresse des Adservers überhaupt ermittelt ist.
b) Dauert es mitunter ewig, bis einige Adserver Antwort geben und ihre Werbung ausliefern.
Wenn wir jetzt noch einen schlechten Webdesigner haben, der die Größe der Werbung nicht von vorn herein angibt, so muss ein Browser sogar unter Umständen das Layout einer Webseite so lange verzögern, bis das Werbe-Banner ausgeliefert ist.

Wie man also sieht, vergrößern Werbe-Banner nicht gerade den Surf-Spaß, außerdem sehen sie einfach mies aus und stören mit ihrem Geblinke.

Wie man den Schaden in Grenzen hält:

Die Hosts Datei:

Die "HOSTS"-Datei ist eine Datei, die in der Regel in dem folgenden Verzeichnis liegt:

Windows 95/98/Me"c:\windows\hosts"
Windows XP Home"c:\windows\system32\drivers\etc\hosts"
Windows NT/2000/XP Prof."c:\winnt\system32\drivers\etc\hosts"
Linux, Unix, MacOS X"/etc/hosts"

In der Hosts-Datei kann man folgende Einträge (jeweils einen pro Zeile) vornehmen:

212.227.109.10 www.t-online.de

Was bedeutet: "www.t-online.de" hat die IP Adresse "212.227.109.10".

Ohne Proxy-Server schaut der Rechner für jeden Domain-Namen zunächst in seine eigene Hosts-Datei nach der passenden IP-Nummer. Wenn er dort keinen Eintrag findet, so fragt er den nächsten, ihm bekannten, DNS-Server.

Das Proxy-/Hostsdatei-Problem:

Wenn du über einen Proxy ins Netz gehst (siehe oben) so fragst du nie direkt die Adresse "www.t-online.de", sondern du sprichst mit dem Proxy und weist ihn an, dir die Daten von "www.t-online.de" zu besorgen. Das bedeutet, dass der Proxy die DNS-Auflösung macht und dein Hosts-File gar nicht erst ausgewertet wird.
Jeder moderne Browser bietet dir aber an, den Proxy für ausgesuchte Namen zu umgehen. Gibst du im Browser also an, dass er für die Adresse "www.t.online.de" keinen Proxy nehmen soll, so wird erst in der Hosts-Datei geschaut, bei Miserfolg der DNS-Server gefragt und wenn dann schliesslich eine bekannte Adresse raus kommt, so wird direkt mit dieser verbunden, ohne dass eine Pufferung vom Proxy vorgenommen wird. Wird die Adresse nicht gefunden, so gibt es einen Fehler.

Werbung blocken mit der Hosts-Datei

Wenn du jetzt verstanden hast, wie eine Hosts-Datei funktioniert, kannst du fast schon selbst drauf kommen.
Der Trick ist so einfach, dass er wieder genial ist: Du gaukelst deinem Rechner vor, er selbst wäre der Adserver:
Öffne z.B. dein Hosts-File mit einem Texteditor und trage dort z.B. folgende Zeilen ein und speichere sie wieder:

127.0.0.1 localhost
127.0.0.1 adserver.adtech.de
127.0.0.1 googleadservices.com
127.0.0.1 pagead.googlesyndication.com
127.0.0.1 pagead1.googlesyndication.com
127.0.0.1 pagead2.googlesyndication.com
127.0.0.1 as1.falkag.de
127.0.0.1 adserver.mindshare.de
127.0.0.1 adserver2.mindshare.de
127.0.0.1 adserv.quality-channel.de

Die erste Zeile ist die Standard-Vorgabe, dass du unter "localhost" immer deinen eigenen Rechner erreichst. Die folgenden Zeilen ordnen die Namen der Adserver deinem eigenen Rechner zu.

Als nächstes trägst du in den Proxy-Einstellungen deines Browsers ein:

[X] Proxy für die folgenden Adressen nicht verwenden:
localhost
adserver.adtech.de
googleadservices.com
pagead.googlesyndication.com
pagead1.googlesyndication.com
pagead2.googlesyndication.com
as1.falkag.de
adserver.mindshare.de
adserver2.mindshare.de
adserv.quality-channel.de

Damit passiert folgendes:
Der Browser fragt nicht den Proxy, dass er ihm bitte Daten von "googleadservices.com" ausliefere, sondern er fragt den eigenen Rechner. Der wiederum schaut im Hosts-file nach, ob der Name bekannt ist, findet heraus, dass der Name der Adresse 127.0.0.1 zugeordnet ist, und fragt daraufhin 127.0.0.1 (also sich selbst), nach Daten.
Weil du aber auf deinem Rechner in der Regel keinen eigenen Webserver laufen hast, wird diese Anfrage sofort abgewiesen und der Browser weiß direkt, dass da nix zu holen ist und lässt die Fläche folglich leer. Das alles geht natürlich blitzschnell.

Vorteile
Nachteil:

Adserver finden

Es gibt im Netz eine ganze Reihe fertiger Hosts Dateien zum Download, möglicherweise enthalten sie aber nicht die Adserver, der die Werbung liefert, die einem auf seiner Lieblings-Seite gerade richtig auf die Nüsse geht, also was tun?

Nehmen wir an, man hat eine Internetseite aufgerufen und es blinkt einem ein Werbe-Banner entgegen:
Eine Möglichkeit besteht darin, den Mauszeiger über einer Werbeanzeige schweben zu lassen und zu schauen, welche Zieladresse auf dem Bildschirm angezeigt wird. Das führt nicht immer, aber oft zum Erfolg.

Wenn das nicht fruchtet, hilft aber immer noch derBlick in den Quelltext der Webseite:
Wie das mit dem Internet-Explorer geht, werde ich nicht sagen, denn dieses Programm ist ein Sicherheitsrisiko und ich werde seine Verwendung nicht unterstützen. Beim Opera-Browser wähle man im Menu "Ansicht" den Punkt "Quelltext" (auf englisch: "View" -> "Source").
Den Quelltext schaut man sich nun aufmerksam an, oft sind entsprechende Adressen zwischen markigen Werbesprüchen zu sehen und es fällt auf, dass diese Adressen nicht mit der Adresse übereinstimmen, die man angesurft hat.
Wenn beispielsweise eine Adresse, wie "adfarm.mediaplex.com" nahe eines Wortes, wie "Anzeige" oder "Last Minute Auktionen" oder ähnliches vorkommt, sieht das schon schwer nach einem Adserver aus. Zum Test kann man diese Seite einfach mal als Webadresse im Browser angeben. Bei obiger Adresse erscheint kurz der Test "Banner Service, Mediaplex", bevor man auf die Seite der Firma weiter geleitet wird: ganz klar, das ist ein Adserver. Also nimmt man entsprechende Einträge in der Hosts-Datei und in der "Keinen Proxy verwenden für"-Einstellung im Browser vor.

Vorsicht ist dennoch geboten: manchmal liefern die Server von bekannten Seiten ihre Werbung auch selbst aus, statt sich fremder Adserver zu bedienen, dann ist man natürlich machtlos, denn würde man z.B. einen Text wie "http.//www.adresse.invalid/adbanners" im Quelltext der Seite "www.adresse.invalid" finden, und daraufhin den Server "www.adresse.invalid" blocken wollen, könnte man sich die Seite "www.adresse.invalid" natürlich nicht mehr anschauen.

So, das war dann auch schon das wichtigste zu dem Thema. Ich hoffe, ich habe mit diesem Beitrag alle Klarheiten beseitigt und wünsche eine erfolgreiche Jagd auf lästige Werbung.

[Zurück zum Inhalt]
[Hauptseite neu laden]

Valid HTML 4.0!