Duplicate Content. Wszystko, co musisz wiedzieć o duplikacji treści

Andrzej Winnicki
24.10.2019

Temat miesiąca.

Duplikacja treści jest jedną z najczęstszych powodów, dla których właściciele stron internetowych, zwłaszcza e-sklepów, nie mogą się doczekać spektakularnych postępów w pozycjonowaniu. Choć inwestują sporo pieniędzy w optymalizację i zakup linków zewnętrznych, to ich witryny nadal nie są wyświetlane na pierwszej stronie rankingu na te najcenniejsze frazy. W takiej sytuacji zawsze trzeba szczegółowo sprawdzić, czy przypadkiem na stronie nie znajdują się teksty, które Google uznaje za plagiat. Mówimy wówczas o zjawisku Duplicate Content – bardzo niebezpiecznym z punktu widzenia każdego e-biznesu. Sprawdź, czym jest duplikacja treści, skąd się właściwie bierze i co najważniejsze: jak do niej nie dopuścić.

Duplicate Content: co to takiego?

O zjawisku duplikacji treści mówimy mniej więcej od 2011 roku. Wtedy to nastąpiła jedna z największych rewolucji w historii wyszukiwarki Google. Nowy algorytm, o wdzięcznej nazwie Panda, całkowicie zmienił reguły gry. Dawne techniki SEO przestały być skuteczne, a nastała era contentu, czyli treści. Google postawiło bardzo mocny akcent na promowanie stron wypełnionych wysokojakościową treścią, w efekcie czego content stał się najważniejszym czynnikiem rankingowym.

Upraszczając sprawę: nawet jeśli strona internetowa jest doskonale zoptymalizowana pod kątem technicznej strony SEO i prowadzi do niej multum linków z zaufanych witryn, to bez dobrego contentu strona nie osiągnie wysokiej pozycji w rankingu. Google zależy na tym, aby użytkownicy wyszukiwarki mieli łatwy dostęp do merytorycznej treści, stąd witryny niespełniające tego warunku mają automatycznie obniżany ranking.

Algorytm Panda nie tylko ocenia jakość i obszerność tekstów opublikowanych na stronie internetowej, ale także porównuje je z treściami podejmującymi taką samą lub zbliżoną tematykę, które znajdują się na innych witrynach. Dzięki temu mechanizmowi roboty wyszukiwarki są w stanie wychwycić przypadki plagiatu, co Google nazywa właśnie Duplicate Content. Jeśli algorytm uzna, że treść opublikowana na stronie A jest łudząco podobna do tej na stronie B, to ukarze jedną z nich obniżeniem rankingu, a w skrajnym przypadku może nawet nałożyć karę w postaci chociażby czasowego filtra lub wręcz usunięcia z wyników wyszukiwania.

To warto wiedzieć

Google traktuje sprawę bardzo poważnie, ponieważ duplikacja treści w gruncie rzeczy może zostać uznana za złamanie praw autorskich do czyjegoś utworu.

Jak dochodzi do zjawiska duplikacji treści?

Wbrew pozorom nie musi to być wcale efekt perfidnego plagiatu czy kradzieży treści z innych stron, choć oczywiście takie sytuacje się zdarzają. Powodów jest jednak znacznie więcej. Warto je znać, ponieważ z doświadczenia wiemy, że wielu właścicieli stron ukaranych przez Google nie miało zielonego pojęcia, że mogli opublikować treści, które algorytm uzna za zduplikowane.

Zdecydowanie najczęściej z duplikacją treści mamy do czynienia wtedy, gdy:

  • Na stronie znajdują się teksty zbyt mocno inspirowane czyjąś twórczością – napisaliśmy to w sposób eufemistyczny, ale wszyscy wiemy, że chodzi o kradzież. Zwykle jest to skutek zlecenia napisania tekstów na stronę czy np. opisów produktów do e-sklepu najtańszemu copywriterowi lub osobie, która się za takowego podaje. Pamiętaj więc: jeśli trzy agencje copywriterskie wyceniły teksty na np. 1000 złotych, a freelancer chce to zrobić za 200 złotych, to istnieje poważne ryzyko, że dostaniesz treści „pożyczone” z innych stron.
     
  • Publikujemy te same teksty na różnych stronach – zdarza się, że firmy mają kilka witryn internetowych, np. główną (wizerunkową), zapleczową, a do tego jeszcze prowadzą różne serwisy partnerskie, chociażby blogi czy portale tematyczne. Jeśli na każdej z tych stron pojawią się takie same lub bardzo do siebie podobne teksty, Google prędzej czy później wykryje Duplicate Content i ukarze jedną z nich (lub kilka).
     
  • Powielamy ten sam opis produktu w kilku sklepach internetowych – to dość częsta sytuacja w świecie e-commerce. Prosty przykład: firma ma sklep online, ale dodatkowo oferuje swoje produkty na Allegro i OLX. W każdym z tych serwisów zostały opublikowane dokładnie takie same opisy produktów (no bo po co się męczyć, prawda?). Taka sytuacja jest o tyle niebezpieczna, że Google niemal na pewno ukarze główny sklep marki, ponieważ Allegro i OLX mają jednak znacznie lepszą renomę w wyszukiwarce i prawdopodobnie obie te strony zostaną uznane za pierwotne miejsce publikacji opisu.
     
  • Wielokrotne publikowanie tego samego opisu w sklepie internetowym – chodzi tutaj o sytuację, w której np. sklep oferuje ręczniki łazienkowe z dokładnie takim samym motywem, ale występujące w trzech rozmiarach. Choć brzmi to absurdalnie, to z punktu widzenia algorytmu konieczne jest stworzenie dla nich trzech unikalnych opisów. W przeciwnym razie Google może wykryć duplikację treści i obniżyć ranking strony internetowej sklepu.
     
  • Publikowanie tekstów partnerów – bardzo często zdarza się, że właściciel strony internetowej bez zastanowienia publikuje na niej treści, które zostały dostarczone przez partnera handlowego. Zwykle z takimi sytuacjami mamy do czynienia w sklepach internetowych (opisy produktów dostarczane przez producentów), ale też na stronach wizerunkowych – firma publikuje np. opis technologii partnera, w dokładnie takiej samej formie, w jakiej znajduje się on już na stronie owego kontrahenta.
     
  • Wysyłanie treści PR i artykułów sponsorowanych do zewnętrznych mediów, a następnie publikowanie ich w takiej samej formie na własnej stronie www – takie postępowanie jest przejawem lenistwa, a dodatkowo rodzi bardzo duże ryzyko nałożenia kary za Duplicate Content.
     
  • Black Hat SEO – do nieakceptowanych przez Google technik pozycjonowania można zaliczyć chociażby tworzenie i publikowanie tekstów synonimicznych. Nie mają one żadnej wartości poznawczej, są bełkotliwe, ale zawierają mnóstwo słów kluczowych związanych z działalnością firmy. Takie teksty publikuje się na stronach zapleczowych oraz w katalogach. Trzeba z tym bardzo uważać, ponieważ teksty synonimiczne to wręcz książkowy przykład duplikacji treści.
     

Co za to grozi?

Dobra informacja jest taka, że roboty Google nie są super skuteczne w wykrywaniu duplikacji treści. Dlatego jeśli stwierdzisz, że na Twojej witrynie znajdują się teksty, które mogą być powielone, to nie panikuj. Spokojnie rozpocznij proces ich redagowania lub zleć ich napisanie od nowa doświadczonemu copywriterowi (nie najtańszemu).

Jeśli to zbagatelizujesz, to musisz się liczyć z konsekwencjami. Zdecydowanie najczęściej Google karze strony z Duplicate Content „w białych rękawiczkach”, czyli po prostu konsekwentnie obniżając ich ranking. Właściciel witryny może tego nie zauważyć przez wiele miesięcy, aż w końcu zorientuje się, że jego wcześniej świetnie pozycjonowana strona utknęła gdzieś w drugiej setce wyników wyszukiwania.

W skrajnym przypadku Google może zablokować stronę nakładając na nią tzw. filtr, co oznacza czasowe wykreślenie witryny z indeksu i jej niewidoczność w wyszukiwarce. Najczęściej jest to konsekwencja donosu. Czyli: ktoś odkrył, że na Twojej stronie znajdują się jego teksty, zgłasza tę sprawę do Google, przedstawia dowody na to, że jest prawowitym właścicielem/autorem splagiatowanej treści i w ten sposób uruchamia googlową procedurę.

A jeśli to Ty padniesz ofiarą kradzieży tekstów?

Taka sytuacja jest o tyle kłopotliwa, że nikt nie wie, w jaki sposób algorytm ustala, która strona ma pierwszeństwo do publikacji danego tekstu. Może się więc zdarzyć, że kara zostanie nałożona na witrynę A, choć jej właściciel nie dopuścił się plagiatu. Wprost przeciwnie: to on został okradziony. Prawdopodobnie Google bierze tutaj pod uwagę przede wszystkim wiek domeny, reputację strony (jej pozycję w rankingu) i liczbę użytkowników.

Jest to ważny powód, dla którego każda firma inwestująca w unikalne teksty powinna regularnie sprawdzać, czy nie pada ofiarą kradzieży i łamania jej praw autorskich. Można to robić na kilka sposobów – chociażby korzystając ze specjalnych narzędzi do wykrywania duplikacji treści (są dostępne online) lub po prostu wklejając fragmenty tekstów do wyszukiwarki (około 32 słowa) i sprawdzając, czy nie zostały one opublikowane na innych witrynach.

Ważne jest również to, aby regularnie aktualizować treści na stronie internetowej, np. poprzez prowadzenie bloga czy działu aktualności. Minimalizuje to ryzyko padnięcia ofiarą zjawiska Duplicate Content, a „przy okazji” przyciąga uwagę algorytmu, który doceni dbanie o jakość i merytoryczność teksów kierowanych do użytkowników.

 

Zgłoś swój pomysł na artykuł

Więcej w tym dziale Zobacz wszystkie