Inhaltsverzeichnis
Nicht zu verhindern. Oder doch? Duplicate Content in Online-Shops
Jeder Online-Shop kämpft gewöhnlich mit dem Problem des Duplicate Content bzw. sollte eine möglichst elegante Lösung für doppelte Inhalte definieren.
Doppelte Inhalte in Online-Shops entstehen immer durch die riesige Anzahl an angebotenen Produkten.
Häufige Ursachen (neben den gewöhnlichen Duplicate Content Ursachen wie https, www, Parametern etc.) in Online-Shops im Umgang mit Produkten sind folgende:
- Die Mehrfachkategorisierung eines Produkts, z.B. in „Sale“ oder „Zubehör“ zusätzlich zur eigentlichen Kategorie
- Ein Produkt ist über unterschiedliche Varianten verfügbar, z.B. in unterschiedlichen Farben (die Sneakers in weiß und schwarz) oder in unterschiedlicher Ausführung (der USB Stick mit 2 GB oder 8 GB). Und hierbei sind noch viele weitere Varianten möglich.
Die bisher gängigste Lösung war hierbei für jeden SEO zu definieren, welche dieser Seiten in den Index gelangen soll. Bei Kategorisierung eines Produkts in mehrere Kategorien musste entweder definiert werden, über welche der entsprechenden URLs das Produkt aufrufbar sein soll (per 301-Redirect aus der anderen Kategorie) oder es waren alle URLs aufrufbar, jedoch nicht indexierbar (per Canonical Tag).
Dieselbe Entscheidung sollte bei jeder einzelnen Variante eines Produkts getroffen werden. Sollen nun die weißen oder schwarzen Sneakers in den Google Index? Schwierige Frage… denn eigentlich will man aus Marketing-Sicht mit beiden dieser Produkte-Varianten gut ranken! Doch jeder SEO weiß auch, dass er durch diese beiden Varianten ein Duplicate Content Problem und somit einen Rankingnachteil erleiden könnte.
Große Longtail-Potenziale
Dieser Zustand ist nicht optimal, denn hinter all diesen URLs ein und desselben Produkts und deren dessen nahen Varianten kann ein riesiges Longtail-Keyword-Potenzial stecken.
So wäre ein Traum für jeden SEO, eben nicht nur die weißen Sneaker im Google-Index zu haben, sondern auch die schwarzen exakt desselben Modells, und die roten, und die blauen… Und vielleicht sogar bei Suchanfragen nach „günstig“ oder „Angebot“ mit der Sale-Seite gefunden zu werden.
Was ist zum aktuellen Zeitpunkt (Stand Mitte 2016) oder sogar in naher Zukunft (vielleicht ja noch in 2016) möglich, um all dieses Longtail Potenziale voll ausschöpfen zu können? Ohne dass die Gefahr von Duplicate Content besteht.
Ist isSimilarTo / Schema.org die Lösung dieses Problems?
Mit dem Vokabular von Schema.org sind Auszeichnungen für eine Website möglich, um die Inhalt zum Einen strukturierter (z.B. per Breadcrumb) und zum Anderen mit wertvollen Zusatzinfos für Nutzer für Rich Snippets oder anderen Erweiterungen in Google anzureichern (z.B. Telefonnummer in Google-Suche, Bewertungen, Events).
Zu finden bei Schema.org sind viele unterschiedliche Informationen, welche auf Produktebene definiert werden können: Schema.org Product
Spannend im Zusammenhang mit Duplicate Content ist hierbei die Auszeichnung ‚isSimilarTo‚.
Die Definition laut Schema.org für isSimilarTo ist Folgende: A pointer to another, functionally similar product (or multiple products).
Doch was heißt das genau? Kann hierdurch definiert werden, dass z.B. der schwarze Sneaker ähnlich zum weißen Sneaker ist? Und welche Auswirkung hat dies auf die Indexierung?
Schnell feststellen lässt sich sicherlich, dass das isSimilarTo keine Lösung für Mehrfachkategorisierungen ist, da es sich hierbei lediglich um eine andere Einordnung des Produkts und nicht um eine Variante handelt. Somit ist die Frage offen, ob sich isSimilarTo für Produktvarianten eignet.
Diesbezüglich hatte bereits auf der SEOkomm 2014 Simon Pokorny die isSimilarTo Auszeichnung als Möglichkeit für Produktvarianten gesehen. Als Head of SEO bei home24.de, dem größten deutschen Online-Möbelshop, hat Simon Pokorny die isSimilarTo dort über die gesamte Website ausgerollt.
Unsere Beobachtungen
Schauen wir uns beispielhaft zwei Produkte von home24 etwas genauer an:
1.) Garderobenpanell Colorado hochglanz rot
https://www.home24.de/produkt/garderobenpaneel-colorado-hochglanz-rot
2.) Garderobenpanell Colorado hochglanz orange
https://www.home24.de/produkt/garderobenpaneel-colorado-hochglanz-orange
Wir haben die Entwicklung auf home24.de die letzten Monate beobachtet und entdeckt, dass es home24 durch isSimilarTo im April diesen Jahres tatsächlich schaffte, mehrere Varianten desselben Produkts ins Ranking zu bekommen.
Im Quellcode sieht die isSimilarTo folgendermaßen aus (am Beispiel der Variante rot, analog bei den anderen Farben):
Stand April 2016: Die Varianten rot und orange befinden sich beide im Google Index. Damals war das isSimilarTo definiert sowie alle Varianten per robots-meta-tag auf index,follow gestellt.
Wir haben die Seiten nun erneut geprüft (Stand Juli 2016) und festgestellt, dass sich keine dieser Varianten mehr im Google Index befindet. Dies liegt jedoch daran, dass alle Varianten dieses Artikels zwischenzeitlich auf noindex,follow gesetzt wurden. Dies verhindert die Indexierung all dieser URLs.
Was jedoch weiterhin eingebunden ist: Die schema.org Auszeichnung isSimilarTo.
Es bleibt die interessante Frage offen, weshalb home24 nun auf Deindexierung per nofollow gestellt hat. Ob dies bewusst wegen irgenwelcher Ranking-/Sichtbarkeitsentwicklungen, unabsichtlich oder aus anderen Gründen passierte, können wir leider zum aktuellen Zeitpunkt noch nicht sagen.
Was sagt Google dazu?
isSimilarTo bleibt für uns weiterhin eine spannende Option für die Verhinderung von Duplicate Content, wobei zum aktuellen Zeitpunkt noch nicht geklärt ist, welche Auswirkungen dies in diesem Bezug hat. Selbst Anfragen direkt bei John Mueller von Google ergeben keine klaren Erkenntnisse.
Die Frage an John Mueller ob isSimilarTo statt einem Canonical Tag verwendet werden kann antwortete dieser, dass isSimilarTo kein direktes Indexierungssignal sei.
Dies lässt jedoch immernoch die Frage offen, ob isSimilarTo nicht doch Google zeigen könnte, wo bewusst ähnliche oder fast identische Inhalte bestehen. Denn das Ziel der strukturierten Daten ist genau dies: Google Beziehungen zwischen Seiten untereinander viel besser versehen zu lassen. Und dies natürlich auch für die Indexierung zu nutzen.
Die isSimilarTo Auszeichnung wäre aus unserer Sicht somit das ideale Werkzeug um Duplicate Content bei Varianten aus Sicht von Google zu verhindern bzw. Google sollte genau dorthin kommen!
Google hat zu diesem Thema bereits ein Patent: „Using Structured Data For Search Result Deduplication“
Gefunden auf folgender Seite von Searchengineland.
Ein weiterer spannender Beitrag ist auf folgender Seite von SEO by the Sea von Bill Slawski zu lesen.
Laut Slawski können strukturierte Daten gegen Duplizierungen im Index helfen:
Blogbeitrag auf SEO by the Sea:
How Google May Use Schema Vocabulary to Reduce Duplicate Content in Search Results (Updated)
Wer das komplette Google Patent lesen möchte: https://patents.google.com/patent/US20140280084
Eins steht fest: Wir sind neugierig wie sich das Thema weiterentwickelt und behalten dies für euch im Auge. Vielleicht geht dann der Traum eines SEO tatsächlich schon bald in Erfüllung: ganz neue Longtail-Potenziale für Onlineshops zu entdecken.