Duplikált tartalom: minden, amit tudni kell a duplikációról

Miről fogsz olvasni?

Ma már nagyon nehéz a weben olyan tartalmat előállítani, amiről még soha senki nem írt, és nem dolgozta fel egy blog sem poszt formájában. Épp ezért az interneten található szöveges tartalmak 20-25%-a már valamilyen formában másolatnak és duplikációnak számít.

Ezek az egyezések SEO szempontból nem okoznak különösebb problémát, sokkal nagyobb hiba az, ha egy adott oldalon belül merülnek fel egy az egyben megegyező tartalmú aloldalak.

Ahhoz, hogy megelőzd ezeket a technikai hibákat, és eleget tegyél a Google algoritmusának, fontos tisztázni, hogy mi számít duplikált tartalomnak és mi nem.

MI AZ A DUPLIKÁCIÓ?

A Google meghatározása szerint, minden olyan oldalon belüli szöveg duplikációnak számít, ami közel azonos, vagy egy az egyben megegyezik egy másik hasonló szöveggel, de a két tartalom más és más URL címen érhető el. Vagyis ugyanaz a tartalom kétszer nem szerepelhet egy weboldalon belül, mert az duplikált tartalomnak és másolatnak számít, ami a weboldal keresőoptimalizálása szempontjából kifejezetten káros is lehet.

John Mueller, a Google egyik vezető szakembere úgy fogalmazott, hogy Egy weboldalon található duplikált tartalomért nem jár külön büntetés és hátrébb sorolás sem.”

Ugyanakkor fontos kiemelni, hogy a sok hasonló felépítésű tartalom összezavarhatja a keresőrobotokat. Hiszen a nekik kell megállapítaniuk, hogy a sok azonos változatból, melyik az eredeti verzió és melyik csak egy másolat.

Ilyen esetekben gyakran előfordulhat az a jelenség, hogy az adott kulcsszóra vagy rossz oldal kerül rangsorolásra, vagy egyszerűen egyik oldal sem jelenik meg a keresőben.

A DUPLUKÁCIÓ FAJTÁI

Duplikált tartalmak számtalan helyen, formában és variációban megjelenhetnek, ugyanakkor előfordulnak olyan esetek is, amikor nagyságrendileg megegyezik két tartalom, de mégsem okoznak problémát.

Ilyen például egy többnyelvű honlap is, ahol hreflang attribútummal lehet jelezni a keresőnek, hogy melyik az eredeti nyelv és melyik annak másolata. Ebben az esetben az algoritmus pontosan tudni fogja, hogy mikor, melyik nyelvű találatot kell rangsorolni a keresett kifejezésre, de a helyzet nem mindig ennyire egyszerű.

Egyedi termékleírások

A leggyakrabban előforduló duplikációs hiba elsősorban webáruházakhoz és az ott található termékek leírásához köthető. Ugyanis sok webshopnál okoz problémát az egyedi termék leírások elkészítése, ezért a gyártó által megadott sablonos leírást használják.

Ezek a szöveg részek egyrészt sokszor nem tartalmaznak lényegi információt a vásárlók számára, másrészt nagy rá az esély, hogy a többi forgalmazó is ugyanazt a leírást használja, harmadrészt pedig, gyakran nincs megfelelően kezelve az adott termék paramétereinek megváltozása után keletkező egyedi URL.

SEO szempontból tehát az utolsó elem szokott komoly problémákat okozni, ugyanis a termék paramétereinek megváltoztatása nem befolyásolhatja az URL-eket, vagy ha mégis változnak az URL paraméterek, akkor azt jelezni kell a robotoknak.

Alapértelmezett URL:
https://weboldal.hu/termek/kemping-bicikli

Kék színű bicikli URL:
https://weboldal.hu/termek/kemping-bicikli-blue#23-577

Piros színű bicikli URL:
https://weboldal.hu/termek/kemping-bicikli-red#23-423

Ez azért hatalmas gond, mert ha például egy bicikli több színben is elérhető a webáruházban, de minden színhez külön URL van rendelve, és a termékleírás csak annyiban változik, hogy fekete helyett kék vagy piros szerepel a szövegben, az duplikált tartalomnak minősül. Hiszen maga a termékleírás 99%-ban megegyezik, minden URL változatnál.

Kategória oldalak

A kategória oldalak beállítása sok webáruháznál szokott problémát okozni, ez pedig abból adódik, hogy a termékek sorba rendezése után keletkező dinamikus URL-ek nincsenek megfelelő attribútumokkal kezelve.

Tehát, ha például egy kategórián belül népszerűség / ár / név /vagy valamilyen egyéb szűrő alapján rendezzük a termékeket, az oldal tartalma valójában nem fog megváltozni, csak a termékek sorrendje, és ezzel együtt a kategória URL szerkezete is.

Alapértelmezett kategória URL:
https://weboldal.hu/noi-bicikli

Ár szerint csökkenő szűrő URL:
https://weboldal.hu/noi-bicikli#sort=price-desc

Ár szerint növekvő szűrő URL:
https://weboldal.hu/noi-bicikli#sort=price-asc

A nem megfelelő beállításnak köszönhetően ezek a duplikált, dinamikus URL-ek, és ezek kombinációi előbb-utóbb bekerülnek a Google indexbe, és egymás ellen versenyeznek a keresőben ugyanazért a helyezésért.

Az automatikusan generált URL-eket célszerű megjelölni rel=canonical attribútummal, hogy a Google csak az általunk kiválasztott URL-t jelenítse meg a keresőben.

HTTP / HTTPS és WWW / WWW nélküli verzió

Sok weboldalnál előfordul, hogy mindkét verzióban elérhető az oldal tartalma, legyen az akár egy HTTP verzió vagy WWW-s előtaggal rendelkező domain név.

http://www.weboldal.hu
https://weboldal.hu
http://www.weboldal.hu
https://www.weboldal.hu

Ilyenkor minden olyan oldal és bejegyzés duplikálódik, ami nincs tovább irányítva egy 301-es átirányítással a megfelelő céloldalra. Például ugyanúgy elérhető a főoldal és az egyes blogbejegyzések HTTP és HTTPS protokoll alatt is, ami SEO szempontból kifejezetten káros, és hosszú távon nagymértékben befolyásolhatja a weboldal organikus helyezéseit is.

Ugyanakkor az is előfordulhat, hogy az oldalra mutató külső linkek nem egy pontban összpontosulnak, ezért szétoszlik és felhígul a weboldal linkereje. Vannak olyan backlinkek, amik a WWW-s verzióra mutatnak, és vannak olyanok is, amik a WWW nélkülire, vagyis a két oldal nem egymást erősíti.

A 301-es redirect mellett célszerű a Search Console felületén is jelezni a Google számára, hogy melyik domain változat az elsődleges, hogy ezután már a keresőrobotok is ennek megfelelően kezeljék az adott oldalt.

Emellett érdemes figyelembe venni a weboldal nyomtatóbarát verzióját is, hiszen itt is felmerülhetnek duplikációk. Ha a két változat külön URL alatt található, (Például: weboldal.hu/oldal és weboldal.hu/print/oldal) akkor mindenképp noindex vagy canonical tag-et kell elhelyezni a nyomtatóbarát oldalakon is, hogy SEO szempontból megfeleljen.

DUPLIKÁLT TARTALMAK KEZELÉSE

Egyedi tartalom

A duplikációk megelőzéséhez a legjobb megoldás, ha mindig törekszünk az egyedi tartalmak előállítására. Érdemes tehát a termék oldalakat úgy optimalizálni, hogy minden aloldalhoz egyedi leírás tartozzon. Emellett célszerű a vásárlóktól visszajelzéseket és véleményeket kérni, hogy ezzel is bővüljön az oldal tartalma és kiemelkedjen a többi hasonló termék közül.

Kanonikus címke

Canonical taget vagy magyarul kanonikus címkét tipikusan a duplikált tartalmak kezelésére találták ki. Ezzel az attribútummal lehet megadni, hogy a sok azonos változatból melyik az eredeti verzió. Ekkor a robotok csak azt az egy oldalt fogják indexelni, amelyiket megjelöltük preferált változnak, a többit pedig ez alá rendeli, és kiveszi a találatok közül.

Fontos, hogy a kanonizált URL-nek minden olyan oldalon meg kell jelennie a forráskódban, ami az eredeti másolata, hiszen csak így lehet elkerülni az oldalon belüli duplikált tartalmakat.

Kanonikus URL-nek mindig azt az oldalt érdemes választani, ami legerősebb az összes közül, vagyis amire a legtöbb külső link mutat. Ha egyik oldalra sem mutat backlink, akkor a legjobban konvertálót vagy legnépszerűbb változatot célszerű választani.

Noindex attribútum

Azokat a duplikált oldalakat, amik valamilyen véletlen folytán, automatikusan generálódtak le és nem tartalmaznak lényegi információt az oldalra érkező látogatók számára, érdemes noindex attribútummal jelölni, hogy a Google ne vegye figyelembe a rangsorolás kialakításánál.

ÖSSZEGZÉS

A Google-nek tehát nem célja, hogy hátrébb sorolja azokat az oldalakat, ahol duplikált tartalmakat talál, ugyanakkor ha nincs meghatározva, hogy melyik a preferált változat, akkor az algoritmus fogja kiválasztani. Épp ezért a kanonikus címkék elhelyezés minden olyan oldal esetében javasolt, ahol a tartalmi elemek több változatban is előfordulhatnak.

Emellett érdemes figyelni az online marketingben előforduló URL követő paraméterek szerkezetére is, hogy ‘?’ helyett ‘#’-et használjunk. Ugyanis a ‘#’ megakadályozza a robotok további URL feltérképezését és indexelését.

A Google Analyticsben pedig pontos adatokat kapunk arról, hogy a vásárlók milyen csatornákról érkeztek az oldalra, így duplikált tartalmak sem keletkeznek, és a szükséges információkat is megkapjuk.

Több organikus forgalmat és jobb helyezéseket szeretnél?

Lépj velünk kapcsolatba!
Ujhelyi Georgina
Ujhelyi Georgina

account director

A kitöltés kötelezettségmentes.