Wenn bei einem Imbiss auf der Speiseliste “Döner 2,50€; Dönerkebab 2,50€” oder “Döner vegetarisch 2€; Döner ohne Fleisch 2€” steht, darf man zu Recht verwundert sein und denken “das ist Spam!”. Schließlich bezeichnet Döner das gleiche wie Dönerkebab und vegetarisch bedeutet ohne Fleisch.
Wenn ein Suchmaschinenbot Internetseiten durchsucht und feststellt, dass mehrere Seiten genau denselben Inhalt haben bzw. derselbe Inhalt über verschiedene Adressen zu erreichen ist, dann ordnen die Bots diese Seite auch als Spam(versuch) ein. Das Ergebnis ist ein schlechteres Ranking bei Google & Co.
Was viele nicht wissen: http://stevie-o.de und http://www.stevie-o.de sind zwei verschiedene Adressen – schließlich schreibt man die Adressen unterschiedlich! Die Lösung mit einfacher Anleitung gibts hier:
Von zweifelhaften und unseriösen Suchmaschinenoptimierungen (kurz SEO) halte ich überhaupt nichts. Wenn es sich aber um grundlegende Optimierungen handelt, die vor allem den Besuchern auch Vorteile bringen, dann setze ich sie um. Neben der “Spamabstrafung” konkurrieren die eigenen Adressen übrigens um den besseren Rang statt die gemeinsame Kraft für ein besseres Ranking zu nutzen.
So hat eine Untersuchung der bei Technorati 20 besten Blogs gezeigt, dass davon 40% über mehrere Adressen erreichbar sind (also mit und ohne www) sowie 65% keine Blogbeschreibung (description) und 80% keine Suchbegriffe (keywords) in den Metadaten angegeben haben.
Für letztere beiden Punkte verwende ich eines der vielen SEO Wordpress Plugins: All in one SEO Pack. Damit kann ich zu jedem Beitrag (und meinem Blog) Titel, Beschreibung und Suchwörter beliebig festlegen. Mache ich das nicht, werden die Felder vom Plugin automatisch ausgefüllt (das keywords-Feld z.B. mit den Tags und Kategorien).
Dass die Suchbots meine Seite immer nur mit www indizieren, kann man bei den Google Webmaster Tools einstellen (Google Account notwenig):
![]()
Wer sich aus berechtigten Gründen bei Google nicht anmelden will und/oder um zusätzlich neben Google noch andere Suchmaschinen zu bedienen, setzt man am besten einen 301 redirect ein. Dazu muss man lediglich mit dem Editor eine Datei namens .htaccess erstellen (keine weitere Endung und Punkt davor!) mit folgendem Inhalt:
Options +FollowSymlinks
RewriteEngine on
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.stevie-o\.de$ [NC]
RewriteRule ^(.*)$ http://www.stevie-o.de/$1 [L,R=301]
Diese Datei lädt man dann in das Ursprungsverzeichnis, wo sich die index.html bzw. index.php Datei befindet (”stevie-o” natürlich mit der eigenen Domain ersetzen
).
Netter Nebeneffekt: Wenn ein Besucher eine falsche Eingabe mit ww oder wwww macht, erscheint trotzdem die Seite www.stevie-o.de
Meine Seite ist aber weiterhin unter mehreren Adressen erreichbar, nämlich www.stevie-o.de und www.stevie-o.de/index.php. Dafür muss man obigen Code um zwei Zeilen erweitern:
Options +FollowSymlinks
RewriteEngine on
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.stevie-o\.de$ [NC]
RewriteRule ^(.*)$ http://www.stevie-o.de/$1 [L,R=301]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /(([^/]+/)*)index\.php\ HTTP/
RewriteRule index\.php$ http://www.stevie-o.de/%1 [R=301,L]
Bei mir hatte Wordpress bereits eine .htaccess-Datei angelegt. Ist dies bei dir auch der Fall, kannst du die RewriteCond und RewriteRule Zeilen einfach hinzufügen, so dass es letztendlich so aussieht:
# BEGIN WordPress
<IfModule mod_rewrite.c>
Options +FollowSymlinks
RewriteEngine On
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
RewriteCond %{HTTP_HOST} !^www\.stevie-o\.de$ [NC]
RewriteRule ^(.*)$ http://www.stevie-o.de/$1 [L,R=301]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /(([^/]+/)*)index\.php\ HTTP/
RewriteRule index\.php$ http://www.stevie-o.de/%1 [R=301,L]
</IfModule>
# END WordPress
Die Suchmaschinen sehen jetzt also nur noch www.stevie-o.de. Die Adressen http://stevie-o.de und stevie-o.de/index.php gibt es für Suchmaschinen nicht mehr. Gibt ein Besucher einer dieser Adressen in die Adresszeile ein, erscheint immer die von mir gewünschte Darstellung www.stevie-o.de. Und sollte jemand Döner nur mit zwei w oder gar mit vier w bestellt haben, findet er trotzdem zu mir
Achtung, wichtig:![]()
Damit diese Anweisungen hier funktionieren, muss dein Webspace mod_rewrite aktiviert haben. Bei den Freehostern Kilu und bplaced ist mod_rewrite aktiviert.
Erscheint bei dir nach dem Hochladen der .htaccess-Datei beim Aufrufen deiner URL nur noch Internal Server Error (500), so ist auf deinem Webspace vermutlich Options +FollowSymlinks schon aktiv. Lösche diese Zeile dann einfach aus obigen Codes!
Die Codes hier funktionieren außerdem nur für Linux-Server (Apache), die aber fast überall verwendet werden.
Sollten nach dem Hochladen der .htaccess-Datei einige Wordpress-Funktionen (bei mir z.B. der Upload von Bilder über das Formular zum Schreiben von Beiträgen oder das Erstellen eines Backups mit dem Plugin BackUpWordPress), dann muss man in den Wordpress Optionen unter Allgemein bei den zwei URLs die richtige URL mit www angeben, also http://www.stevie-o.de bzw. http://www.stevie-o.de/wordpress.
Noch mehr interessante Möglichkeiten mit htaccess findet man auf AskApache.com (englisch). Zum Beispiel kann man den Zugriff auf eine Datei für bestimmte Tageszeiten sperren, verhindern dass Dateien im Browser angezeigt und stattdessen runtergeladen werden (bei PDF- und Musikdaten nützlich), usw. ![]()
Hier gibt es auch noch den entsprechenden Artikel zu Duplicate Content (doppelter / dupplizierter Inhalt) bei der Google Webmaster Hilfe.
Wie ist es bei mehreren Domains?
Wer mehrere Domains für seine Seite hat, steht vor demselben Problem. Man wird von den Suchmaschinen ziemlich abgestraft. So wurde zum Beispiel die Seite www.BMW.de 2006 komplett aus dem Google Index entfernt! Auch bei meinen Münzseiten www.10-euromuenzen.de und www.10euromuenzen.de habe ich das zu spüren bekommen.
Die Lösung ist ein permanenter 301 redirect: Man muss sich für eine Domain entscheiden, die man “vermarkten” will. Alle anderen Domains verweist man auf einen Unterordner auf dem Webspace, in dem sich dann nur eine .htaccess-Datei mit folgendem Inhalt befindet:
redirectMatch 301 ^(.*)$ http://www.10-euromuenzen.de
Dadurch werden alle Domains auf diese eine Domain direkt vom Server weitergeleitet.
Die Weiterleitung könnte man auch über mod_rewrite lösen und in derselben .htaccess-Datei von oben einbinden. Allerdings sei unklar, wie solche massenhaften mod_rewrite-Umleitungen von Google in Zukunft behandelt werden – sprich ob dies eventuell ebenfalls zu einer Abstrafung führt.
Auch mit dem HTML Meta-Refresh oder Javascript könnte man das Problem lösen. Allerdings ist eine clientseitige Weiterleitung oft langsamer und Suchmaschinen sehen dies ebenfalls nicht gern.
Duplicate Content in Blogs durch das Archiv, die Kategorien und Tags
Fast hätte ich es vergessen: In Blogs entstehen viele ähnliche Seiten, da z.B. www.stevie-o.de/category/bilder und www.stevie-o.de/tag/bilder recht ähnliche oder gleiche Inhalte haben. Eine Suchmaschinenabwertung kann man verhindern, indem man diese Seiten aus dem Google Index nimmt (mit im Header). Bei Wordpress kann man bequem mit einem Klick über das All in One SEO Pack einstellen, ob das Archiv, die Kategorien und/oder die Tags nicht mehr von Suchmaschinen aufgenommen werden sollen (siehe Screenshot).
Auf Eniak.info gibt es stattdessen ein PHP-Code-Schnipsel, das man einfach in die PHP-Datei einfügen muss und das man natürlich auch beliebig anpassen kann.
Da bei mir die meisten Suchmaschinenbesucher über die Tag-Links auf meine Seite gelangen, habe ich lediglich für die Category- und Archive-Links die Indizierung ausgeschalten.
Header nicht einfach kopieren
Was einige Webmaster der Einfachheit auch ab und zu machen: einen Header einfach kopieren und auf (Unter-) Seiten einfügen. Auch das sollte man aus SEO-Sicht vermeiden, schließlich riecht das nach kopiertem Inhalt. Warum sollte eine Unterseite auch nicht einen eigenen Header mit Titel, Beschreibung und Schlüsselwörtern verdient haben?
Seitenindex statt “Vorherige Seite”-Links
Die Suchbots folgen den Links auf einer Seite – jedoch nicht beliebig lange bzw. tief. Deshalb sind die “Nächste Seite”- / “Vorherige Seite”-Links in vielen Blogs keine gute Lösung. Nach ein paar Seiten verfolgt der Suchbot den Link nämlich nicht mehr und nimmt somit nicht die komplette Bloghistorie in den Index auf. Abhilfe kann man dem schaffen, indem jede Seite von der Startseite aus mit einem (oder wenigen) Klicks erreichbar ist:
. Bei Wordpress gibt es dafür das Pagebar-Plugin.

14.08.2008 um 12:35 Uhr