Mit Canonical URLs doppelte Inhalte vermeiden

Datum: 29. September 2009

Die Bedeutung rund um das Problem doppelter Inhalte (Duplicate Content) ist nach wie vor aktuell. Für Webmaster gibt es einige gängige Methoden, um selbstverursachten Duplicate Content auf dem eigenen Webauftritt zu vermeiden; doch immer wieder trifft man auf Websites, auf denen wichtigste Grundeinstellungen diesbezüglich fehlen, wie zum Beispiel die .htaccess, die robots.txt oder auch der seit einigen Monaten verwendete Canonical URL Tag.

Duplicate Content, der durch unerlaubtes Kopieren von urheberrechtlich geschützten Inhalten entsteht, dürfte den meisten ein Begriff sein. Die Konsequenzen sind teilweise drastisch und führen von Nichtindizierung entsprechender Seiten in den Suchmaschinen bis zu Abstrafen, über die jedoch auch in der SEO-Szene kaum Klarheit herrscht. Dass doppelte Inhalte jedoch vermieden werden sollten, darüber sind sich alle einig; und das gilt auch für selbst verschuldeten Duplicate Content, auch wenn dieser unabsichtlich erzeugt wurde.

Einer der ersten Schritte, um doppelte Inhalte zu vermeiden, stellt die Erstellung einer .htaccess Datei dar: hier wird zum Beispiel fest gelegt, ob die Website unter der «www-Variante» firmieren soll oder nicht. Konkret: Bevorzuge ich http://www.meine-website.de oder doch eher nur http:meine-website.de? Erstere Variante ist ratsamer, da tendenziell eher auf diese verlinkt wird. Um für seine Website eine eindeutige URL (man könnte auch sagen: eine normierte URL) zu generieren, bietet sich eine 301-Umleitung in der .htaccess an; 302er sind hier suboptimal und unbedingt zu vermeiden.

Mit einem solchen 301-redirect werden in der Regel auch ganze Domains umgeleitet, um zu verhindern, dass unter zwei oder mehr verschiedenen URLs Webinhalte gleich mehrfach auftreten und indiziert werden. Für einzelne Unterseiten und Unterordner bietet sich entweder der Ausschluss per robots.txt an oder aber die Verwendung des etwas neueren Canonical URL Tags. Dies ist eine elegante Lösung, um für Suchmaschinen klar zu bestimmen, welche URL die «dominante» ist. Das kann zum Beispiel wichtig werden, wenn verschiedene dynamisch erzeugte Adressen auftreten und deshalb nicht ganz klar ist, welche davon nun die ursprüngliche ist.

Dieser Metatag gestaltet sich etwa folgendermaßen: <link rel=»canonical» href=»http://www.meine-website.de/unterseite.htm» />. Damit wird für Google & Co. eindeutig festgelegt, dass Hybride wie http://www.meine-website.de/unterseite.htm?sid=asdf123456789 nicht die Autorität besitzen. Dieser Canonical URL Tag wird einfach im <head> Bereich hinzugefügt; für WordPress Blogs gibt es dafür eigene Plug-Ins wie zum Beispiel dieses hier. Doch auch mit dem All In One Seo Pack lässt sich dieser Meta-Tag erzeugen. Er stellt eine sinnvolle Ergänzung da, um Duplicate Content den Kampf anzusagen und seinen Webauftritt weiter zu optimieren.

Tags dieses Beitrags:


    Schreibe einen Kommentar zu "Mit Canonical URLs doppelte Inhalte vermeiden"

    Etwas HTML ist ok