Temat miesiąca.
Duplikacja treści jest jedną z najczęstszych powodów, dla których właściciele stron internetowych, zwłaszcza e-sklepów, nie mogą się doczekać spektakularnych postępów w pozycjonowaniu. Choć inwestują sporo pieniędzy w optymalizację i zakup linków zewnętrznych, to ich witryny nadal nie są wyświetlane na pierwszej stronie rankingu na te najcenniejsze frazy. W takiej sytuacji zawsze trzeba szczegółowo sprawdzić, czy przypadkiem na stronie nie znajdują się teksty, które Google uznaje za plagiat. Mówimy wówczas o zjawisku Duplicate Content – bardzo niebezpiecznym z punktu widzenia każdego e-biznesu. Sprawdź, czym jest duplikacja treści, skąd się właściwie bierze i co najważniejsze: jak do niej nie dopuścić.
O zjawisku duplikacji treści mówimy mniej więcej od 2011 roku. Wtedy to nastąpiła jedna z największych rewolucji w historii wyszukiwarki Google. Nowy algorytm, o wdzięcznej nazwie Panda, całkowicie zmienił reguły gry. Dawne techniki SEO przestały być skuteczne, a nastała era contentu, czyli treści. Google postawiło bardzo mocny akcent na promowanie stron wypełnionych wysokojakościową treścią, w efekcie czego content stał się najważniejszym czynnikiem rankingowym.
Upraszczając sprawę: nawet jeśli strona internetowa jest doskonale zoptymalizowana pod kątem technicznej strony SEO i prowadzi do niej multum linków z zaufanych witryn, to bez dobrego contentu strona nie osiągnie wysokiej pozycji w rankingu. Google zależy na tym, aby użytkownicy wyszukiwarki mieli łatwy dostęp do merytorycznej treści, stąd witryny niespełniające tego warunku mają automatycznie obniżany ranking.
Algorytm Panda nie tylko ocenia jakość i obszerność tekstów opublikowanych na stronie internetowej, ale także porównuje je z treściami podejmującymi taką samą lub zbliżoną tematykę, które znajdują się na innych witrynach. Dzięki temu mechanizmowi roboty wyszukiwarki są w stanie wychwycić przypadki plagiatu, co Google nazywa właśnie Duplicate Content. Jeśli algorytm uzna, że treść opublikowana na stronie A jest łudząco podobna do tej na stronie B, to ukarze jedną z nich obniżeniem rankingu, a w skrajnym przypadku może nawet nałożyć karę w postaci chociażby czasowego filtra lub wręcz usunięcia z wyników wyszukiwania.
To warto wiedzieć
Google traktuje sprawę bardzo poważnie, ponieważ duplikacja treści w gruncie rzeczy może zostać uznana za złamanie praw autorskich do czyjegoś utworu.
Wbrew pozorom nie musi to być wcale efekt perfidnego plagiatu czy kradzieży treści z innych stron, choć oczywiście takie sytuacje się zdarzają. Powodów jest jednak znacznie więcej. Warto je znać, ponieważ z doświadczenia wiemy, że wielu właścicieli stron ukaranych przez Google nie miało zielonego pojęcia, że mogli opublikować treści, które algorytm uzna za zduplikowane.
Zdecydowanie najczęściej z duplikacją treści mamy do czynienia wtedy, gdy:
Dobra informacja jest taka, że roboty Google nie są super skuteczne w wykrywaniu duplikacji treści. Dlatego jeśli stwierdzisz, że na Twojej witrynie znajdują się teksty, które mogą być powielone, to nie panikuj. Spokojnie rozpocznij proces ich redagowania lub zleć ich napisanie od nowa doświadczonemu copywriterowi (nie najtańszemu).
Jeśli to zbagatelizujesz, to musisz się liczyć z konsekwencjami. Zdecydowanie najczęściej Google karze strony z Duplicate Content „w białych rękawiczkach”, czyli po prostu konsekwentnie obniżając ich ranking. Właściciel witryny może tego nie zauważyć przez wiele miesięcy, aż w końcu zorientuje się, że jego wcześniej świetnie pozycjonowana strona utknęła gdzieś w drugiej setce wyników wyszukiwania.
W skrajnym przypadku Google może zablokować stronę nakładając na nią tzw. filtr, co oznacza czasowe wykreślenie witryny z indeksu i jej niewidoczność w wyszukiwarce. Najczęściej jest to konsekwencja donosu. Czyli: ktoś odkrył, że na Twojej stronie znajdują się jego teksty, zgłasza tę sprawę do Google, przedstawia dowody na to, że jest prawowitym właścicielem/autorem splagiatowanej treści i w ten sposób uruchamia googlową procedurę.
Taka sytuacja jest o tyle kłopotliwa, że nikt nie wie, w jaki sposób algorytm ustala, która strona ma pierwszeństwo do publikacji danego tekstu. Może się więc zdarzyć, że kara zostanie nałożona na witrynę A, choć jej właściciel nie dopuścił się plagiatu. Wprost przeciwnie: to on został okradziony. Prawdopodobnie Google bierze tutaj pod uwagę przede wszystkim wiek domeny, reputację strony (jej pozycję w rankingu) i liczbę użytkowników.
Jest to ważny powód, dla którego każda firma inwestująca w unikalne teksty powinna regularnie sprawdzać, czy nie pada ofiarą kradzieży i łamania jej praw autorskich. Można to robić na kilka sposobów – chociażby korzystając ze specjalnych narzędzi do wykrywania duplikacji treści (są dostępne online) lub po prostu wklejając fragmenty tekstów do wyszukiwarki (około 32 słowa) i sprawdzając, czy nie zostały one opublikowane na innych witrynach.
Ważne jest również to, aby regularnie aktualizować treści na stronie internetowej, np. poprzez prowadzenie bloga czy działu aktualności. Minimalizuje to ryzyko padnięcia ofiarą zjawiska Duplicate Content, a „przy okazji” przyciąga uwagę algorytmu, który doceni dbanie o jakość i merytoryczność teksów kierowanych do użytkowników.