Nedubliuok turinio

Nedubliuok turinio

Sužinosite: kaip išvengti turinio dubliavimo

1. Kaip ir kur panaudoti rel= "canonical"

2. Puslapių numeracijos SEO problematika ir sprendimo būdai

3. Sudėtingesni puslapių numeracijos sprendimo būdai


1. Kaip ir kur panaudoti rel= "canonical"

Viena iš dažnai pastebimų interneto puslapių problemų yra dubliuotas turinys, kurį sunku pastebėti nežinant google paieškų robotų specifikos. Šiuo atveju neturiu omenyje, kai pats svetainės administratorius kopijuoja turinį ir deda į kitus puslapius (tai irgi blogai dėl turinio dubliavimo). O tai atvejis, kai dėl svetainės ar elektroninės parduotuvės turinio valdymo sistemos automatiškai sugeneruojami to paties puslapio keletą (ar keliolika) URL adresų. Turiu omenyje, kai vienas ir tas pats interneto puslapis yra atidaromas su skirtingais URL adresais. Pavyzdžiui:

  • http://www.seopaslaptys.lt
  • http://seopaslaptys.lt
  • http://seopaslaptys.lt/
  • http://www.seopaslaptys.lt/index.php
  • http://seopaslaptys.lt/index.php

O tai reiškia, kad ir nenoromis (dėl specifinių elektroninių parduotuvių kūrimo turinio valdymo sistemų) galite sukurti dubliuoto turinio. O kai nėra galimybės susitvarkyti su tokiu dubliuotu turiniu tuomet pridedamas specialus meta tagas rel="canonical". Šis tagas pridedamas prie pagrindinio turinio ir tokiu atveju googe robotams pasakome, kad pagrindinis puslapis yra būtent šis, o kiti yra tik dublis. Štai tokiu būdu mes pasakome robotams ir puslapis nebus "baudžiamas" (t.y. nežeminamos pozicijos google paieškoje).

Veikimo principas

Minėta speciali žyma (ang. Tag) yra pridedama HTML puslapio header skiltyje. Ši skiltis nematoma paprastiems puslapio lankytojams. Jeigu pasižiūrėsite puslapio koduote (CTR+U) tuomet šią žymą turėtumėte rasti head skyriuje. Ši žyma turėtų atrodyti taip:

<link rel="canonical" href="http://www.seopaslaptys.lt" />

Jeigu savo internetiniam puslapyje turėsite panašiai, kaip pavyzdyje parodyta tuomet reiškia, kad jeigu sistema (svetainės turinio valdymo sistema) sukurs tam pačiam puslapiui papilomą url adresą tuomet turėtų būti viskas gerai.

PAVYZDYS:

dubliuoto turinio sprendimo budas

SEO požiūriu Canonical URL žymos atributas yra panašus į 301 nukeipimą. Taigi panaudodamas canonical url žymą Jūs pasakote paieškų sistemų robotams tai, kad keliolika vienodų puslapių bus traktuojami kaip vienas ir be realaus nukreipimo į kitą URL (kaip tai padaro 301 nukreipimas). Tačiau pabrėšime keletą esminių skirtumų:

  • Panaudojus 301 nukreipimą visi svetainės lankytojai bus priverstinai nukreipiami į naująjį URL, o canonical URL žyma yra skirta tik paieškų sistemų robotams ir svetainės lankytojai nebus nukreipti į naują URL.
  • 301 nukreipimas yra daug stipresnis signalas, kuris nusako reikiamą URL, tačiau nevisada pavyks panaudoti tokio tipo nukreipimo ir todėl panaudojami canonical URL. Pavyzdžiui, kai prekių kategorija gali būti filtruojama pagal kainą tuomet pastebėsite, kad URL galūnė pasikeičia ir šiuo atveju negalėsite daryti nukreipimo, nes kitaip lankytojai negalės filtruoti prekių. Taigi šiuo ir panašiais kitais atvejais (kad nepasidarytų dubliuotas turinys) naudosime canonical url žymą.
  • Su 301 nukreipimu Jūs galite nukreipti puslapį iš vieno domeno į kitą (pvz.: domenas1.lt į domenas2.lt) ir tokiu būdu nukreipiamas srautas ir SEO metrika. TAČIAU su canonical URL veikia tik viename tame pačiame serverio domene (taip pat canoncal galioja ir to paties domeno subdirektorijose ir subdomenuose
  • Panaudojus netinkamai canonical žymas google (atsižvelgiant į Matt Cutts komentarus) dar turi ir tam tikrą papildomą vertinimą ir nustatymą ar tikrai canonical yra tinkamai panaudotas ir galiausiai vis tiek google nuspręs kuris puslapis (pagal paieškų sistemų sistemą) bus pagrindinis. Tačiau visada rekomenduotina patiems sužymėti ir taip padėti paieškų robotas lengviau atrinkti pagrindinį puslapį.

VIDEO medžiaga apie canonical ir 301 redirect (Matt Cutts)

Kaip, kada ir kur turėtumėme panaudoti šią canonical žymą?

Susiduriant su tokia problema, kai turime keliolika versijų to pates puslapio su skirtingais URL iškyla sekančios problemos:

  1. Paieškos sistemos nežino kurias puslapio versijas įtraukti/neįtraukti į SEO vertinimo indikacijas.
  2. aieškų sistemos nežino ar nukreipti visus nuorodos SEO metrikos duomenis (pasitikėjimą, autoritetą, nuorodos raktažodį, nuorodų kiekį ir t.t.) į konkretų vieną puslapį ar išdalinti visiems atitinkamai.
  3. Paieškų sistemos nežino kurį puslapį sureitinguoti aukščiau, o kurį žemiau paieškų sistemų rezultatuose.

Kai nutinka šie dalykai internetinių puslapių savininkai susiduria su tokiomis problemomis, kaip reitingavimo ir lankytojų srauto mažėjimas. Taigi, kad visa to išvengti Webmasteriai naudoja canonical žymas.

PAVYZDINES SCHEMOS:

dubliuoto turinio sprendimo budas

dubliuoto turinio sprendimo budas

dubliuoto turinio sprendimo budas

Čia tik keletą pavyzdžių, tačiau atkreipkite dėmesį, kad gali būti ir kitokių variantų ir spendimo būdų.

Ką sako google apie Canonical URL Žymą?

Ar rel="canonical" yra užuomina ar tai nurodymas?

Tai yra užuomina, kuria vadovaujamasi pakankamai griežtai. Šia užuominą mes atkreipiame dėmesį ir vertiname kartu su kitais vertinimo signalais tam, kad pateikti paieškų sistemų rezultatuose labiausiai atitinkančius puslapius pagal užklausą.

Ar galiu naudoti reliatyvias nuorodas, tam kad nurodyti canonical žymą pvz: <link rel="canonical" href="product.php?item=swedish-fish" />?

Taip galima.

Ar nebus problemų jeigu pažymėsime canonical, bet tai nebus identiška puslapio kopija?

Yra leistini nedideli puslapių skirtumai ir dėl to neturėtų kilti problemų.

Kas bus jeigu rel="canonical" puslapis pateiktas bus į 404 puslapį (puslapis kurio ieškote nėra)?

Vistiek google paieškos sistemų robotai tęs Jūsų svetainės indeksaciją ir pagal kitus signalus įvertins kuris puslapis yra svarbesnis. Bet tai gali turėti tam tikros neigiamos įtakos SEO pozicijomis paieškų sistemų rezultatuose.

Kas jeigu rel="canonical" puslapiai dar nebuvo suindeksuoti?

Kai ir visą kitą turinį internete toliau indeksuosime ir aptikus canonical puslapius į tai bus atsižvelgta ir greitai suindeksuoti nurodyti canonical url.

Ar rel="canonical" gali būti nukreiptas?

Taip galima ir tuomet google šį nukreipimą vertins taip kaip paprastai vertina nukreipimą.

VIDEO medžiaga apie canonical (Matt Cutts)


2. Puslapių numeracijos SEO problematika ir sprendimo būdai

Dar viena dažnai iškylanti SEO problema yra elektroninių parduotuvių puslapių-prekių kategorijų numeracija. Pavyzdžiui puslapių numeracija atsiranda tuomet, kai elektroninės parduotuvės kategorijoje turime šimtus ar tūkstančius prekių. O tiek prekių atidaryti viename puslapyje ne tik kad sudėtinga (ilgas puslapio užsikrovimas) bet ir nepatogu, todėl ir daroma numeracija. Lygiai ta pati situacija gali nutikti ir su betkokio turinio internetine sveaine.

puslapiu_numeracija

Iš pirmo žvilgsnio tai atrodytų smulkmena, tačiau reiktų atkreipti dėmesį, kad ki paspaudžiate sekantį puslapį tuomet pasikeičia ir URL. Iš SEO pusės – puslapių numeracijos problematika sukelia sunkumų atlikti tinkamą Google indeksaciją. Problematika:

  • Paieškų sistemų robotų indeksavimo apribojimai Kai paieškų sistemų robotai indeksuoja Jūsų puslapį tai nereiškia, kad indeksuos visiškai visus puslapius. Kiek daug indeksuoja priklauso nuo Jūsų domeno reitingo. Taigi jeigu turėsite labai daug sunumeruotų puslapių yra didelė tikimybė, kad ne visi puslapiai bus suindeksuoti.
  • Dubliuoto turinio problematika Priklausomai nuo to koks bus turinys numeruojamose puslapiuose, tačiau labai tikėtina, kad bus pasikartojančių ar identiškų (kopijos) elementų. Ypač tokių kaip „Puslapio antraštė“, „META žymos“ ir META aprašymas“. Ir vis to visuma google paieškų robotas sukelia visišką painiavą kas kur yra ir kuris iš šių sunumeruotų puslapių pateikti per paieškų sistemų rezultatus.
  • Trumpo turinio problematika Esant situacijai, kai numeruojamuose puslapiuose pateikiama labai mažai turinio. Pateikiam tik pavadinimas ir nuotrauka ir tokiu būdu iškyla unikalaus turinio trūkumas dėl kurio galte būti nubausti įvairiais google atnaujinimo algoritmais.

TAIG KAIP SPRĘSTI PUSLAPIŲ NUMERACIJOS PROBLEMATIKĄ?

Geriausias sprendimo būdas – parengti tinkamą dizainą, bet yra ir kitų sprendimo būdų. Tačiau planuojant puslapio dizainą reikėtų atkreipti dėmesį į šiuos dalykus, kurie mažina puslapių numeracijos problematiką:

  • Sukurdami didesnį kiekį kategorijų sumažinsite puslapių kiekį (tokiu būdu turėsite mažesnį numeruotų puslapių kiekį).
  • \Padidindami produktų kiekį rodomų puslapyje taip pat sumažinsite puslapių kiekį.
  • Sujungdami specialiai sužymėtomis nuorodomis numeruotus puslapius išspręsite puslapių numeracijos problematiką.

TAČIAU esamose svetainėse ar elektroninėse parduotuvėse padaryta žala dėl SEO išliks ir struktūros pakeitimas nevisada išspręs padarytas problemas. Bet yra ir kiti sprendimo variantai padėsiantys spręsti puslapi numeracijos problematiką:

I VARIANTAS: Pašalinkite numeruotus puslapius iš indeksacijos.

Lengviausias sprendimo būdas – nereikalingus numeruotus puslapius pašalinti iš indeksacijos. Tačiau įvertinkite ar tikrai tie puslapiai jums nebūtini, kad indeksuotų.

O, kad pašalinti iš indeksacijos tereikia į <head> skiltį pridėti <META NAME="ROBOTS" CONTENT="NOINDEX, FOLLOW"> į sunumeruotus puslapius išskyrus pirmąjį. TAČIAU įsitikinkite, kad pridėjote žymę “FOLLOW”, kuri užtikrins puslapio autoriteto perdavimą tarp sunumeruotų puslapių nors ir pašalinime iš google indekso.

dubliuoto turinio sprendimo budas

P r i v a l u m a i :

  • Vienas iš paprasčiausių sprendimo būdų.
  • Geras sprendimas tokiomis situacijoms kai nėra poreikio indeksuoti sunumeruotus puslapius

T r ū k u m a i : Nors tai ir išspręs galimas puslapių numeracijos SEO problemas, bet sunumeruoti puslapiai bus pašalinti iš google indekso

II VARIANTAS: Atskiras puslapis su visom prekėm, kuris pažymėtas žyma rel=“canonical”

Yra tikėtina, kad google sistemai būtų geriausias variantas jeigu sukursite atskirą puslapį, kuriame bus visa informacija viename puslapyje „Visos-Prekės“. Šį puslapį pažymime žyma rel=“canonical“ ir visuose šio puslapio sunumeruotuose puslapiuose įterpiame minėtą žymą rel=“canonical“ (pavyzdžiui <link rel="canonical" href="http://www.domenas.lt/visos-prekes"/>. Tokiu būdu google sistemai pasakysime, kad pagrindinis puslapis bus šis http://www.domenas.lt/visos-prekes.php, o visi šio puslapio sunumeruoti puslapiai pvz.: http://www.domenas.lt/visos-prekes.php?page=2 t.y. šio puslapio (http://www.domenas.lt/visos-prekes.php) kopijos.

dpuslapiu_numeracija

Atsižvelgiant į google rekomendacijas toks būdas yra vienas iš geresnių puslapių numeracijos problemos sprendimo būdų. Taip pat ir lankytojams yra patogiau kai visos prekės atverčiamos viename puslapyje. TAČIAU būtina atkeipti dėmesį į puslapio pasikrovimo laiką. Jeigu toks puslapis su visomis prekėmis kraunasi daugiau nei 4-5 sekundes tuomet irgi nėra gerai. Jeigu kraunasi ilgai tuomet reiktų bandyti optimizuoti puslapį (/visos-prekes.php) mažinant nebūtinų užklausų skaičių į duomenų bazę, optimizuojant php, html,css ir script kodus, taip pat žiūrėti galimybę dėl paveikslėlių dydžio keitimo (nes aukštos kokybė paveiksliukai užima daug vietos ir apkrauna puslapio pasikrovimo greitį).

P r i v a l u m a i :

  • Pakankamai nesudėtingas sprendimo būdas.
  • Google paieškos sistema lengvai ir greitai nustatys pagrindinį puslapį ir jo kopijas.
  • Visas turinys bus pateiktas viename konkrečiame puslapyje, bet vartotojai ir toliau galės naudotis sunumeruotais puslapiais ir tai nekels SEO problemų dėl numeruotų puslapių.

T r ū k u m a i : Netinkamas sprendimas, kai turime pateikti visą turinį su didelės raiškos nuotraukomis arba kai viename puslapyje bus tūkstančiai prekių. Nes puslapis kraunamas bus per ilgai ir vartotojui bus nepatogu ir nepriimtina kai tūkstančiai prekių viename puslapyje. Tokiu atveju geriau kurti daugiau kategorijų arba rinktis kitą sprendimo būdą.

III VARIANTAS: Panaudokite žymas Rel=“prev”/“next”

Šis puslapių numeracijos sprendimo būdas gali būti techniškai sudėtingesnis, tačiau vertas dėmesio ir išsprendžiantis bet kokio tipo svetainių puslapių numeracijos problematiką. Google sistema identifikuoja ir atpažįstą tokius HTML atributus (rel=“prev” and “next”) , kurie identifikuoja sunumeruotus puslapius. Šių atributų integravimas į Jūsų svetainę gali būti komplikuotas ir todėl būtina atidžiai ir teisingai juos įterpti.

Pavyzdys, kai turite keturis sunumeruotus puslapius:

puslapiu_numeracija

Panaudoję žymas rel="prev"/"next Jūs sukuriate tinkamą nuorodų grandinę tarp sunumeruotų puslapių. Nuorodų grandinė pradedama pirmame puslapyje /puslapis1.php, kurio į <head> skyriuje įterpiamas atitinkamas kodas:

(PUSLAPIS 1):

<link rel="next" href="http://www.domenas.lt/puslapis2.html">

Atkreipiame dėmesį, kad būtent toks kodas įterpiamas į pirmąjį sunumeruotą puslapį.
Eikime į antrąjį puslapį. Tačiau atkreipiame dėmesį, kad antrasis puslapis yra ne paskutinis, o yra ir sekančių puslapių. TODĖL į antrojo puslapio <head> skiltį reikia įterpti papildomą kodo eilutę. Turime įtraukti pirmojo puslapio nuorodos kodą, su žymą rel=“prev“ ir trečiojo puslapio nuorodos kodą su žymą rel=”next“ tokiu būdu užtikrinsime nuorodų grandinę:

(PUSLAPIS 2):

<link rel="prev" href="http://www.domenas.lt/puslapis1.html">

<link rel="next" href="http://www.domenas.lt/puslapis3.html">

Atsižvelgiant į pateiktą 4 sunumeruotų puslapių pavyzdį matome, kad trečias puslapis yra irgi nepaskutinis, TODĖL vadovaujamės tokiu pat principu kaip ir ankstesniame pavyzdyje:

(PUSLAPIS 3):

<link rel="prev" href="http://www.domenas.lt/puslapis2.html">

<link rel="next" href="http://www.domenas.lt/puslapis4.html">

Ketvirtas puslapis yra paskutinis numeruotų puslapių grandinėje, TODĖL paskutinis puslapis nuorodų grandinėje yra žymimas kitaip. Šiame puslapyje pridedame tik vieną žymą rel="prev" <head> skiltyje:

(PUSLAPIS 4):

<link rel="prev" href="http://www.domenas.lt/puslapis3.html">

Naudodami šią nuorodų sistemą rel="prev"/"next" sunumeruotiems puslapiams Google paieška įvertina visus tokio tipo puslapius (sunumeruotus), kaip vientisą vieno puslapio turinį. Tai reiškia, kad google sistema klientams pateiks pirmąjį puslapį kaip labiausiai atitinkančią paieškos užklausą. TAČIAU google turi ir kitų (atsarginių ir papildomų) vertinimo priemonių (nes būna, kad programuotojas gali ir suklysti sudedant kitas žymes ar kita situacija) todėl google jeigu aptiks išskirtines sąlygas, kodėl turi būti pateiktas sunumeruotas puslapis nr2, o ne pirmas, tuomet ir pateiks pirmesnėje vietoje puslapį antra. Tokią google sąlygą galime traktuoti kaip saugikliu nenumatytiems atvejams.

P r i v a l u m a i :

  • Išsprendžia puslapių numeracijos problematiką nekuriant atskiro puslapio, kuriame turėtų būti visas turinys, be numeravimo.
  • Šis problema sprendžiama padarius nedidelius HTML kodo pakeitimus.

T r ū k u m a i :

  • Priklausomai nuo svetainės turinio sistemos, bet tikėtina, kad šis būdas bus pakankamai sudėtingai įgyvendintas.
  • Būtina sąlyga – teisingai ir be klaidų suprogramuoti, kad pasiekti norimo rezultato.

Svarbu pažymėti ir tai, kad žymų rel=”prev”/”next” panaudojimas gali būti žymimas kartu su žyma rel=”canonical”

3. Sudėtingesni puslapių numeracijos sprendimo būdai

I. Papildomi URL parametrai ir žymos rel=“prev”/“next”

Kai kuriais atvejais su žymomis rel="prev"/"next" numeruotų puslapių URL gali būti ir su papildomais parametrais, kaip sesijos ID ir kurie visai nepakeičia turinio. Ir tokiu atveju Jūs galite vėl susidurti su dubliuoto turinio problema.

Yra paprastas sprendimas per Google Webmaster įrankį nurodyti kokių puslapių su konkrečiu parametru neindeksuoti. TAČIAU būna kai tas pats turinys su skirtingu URL (tik dėl tam tikro parametro) teikia ir tam tikrą SEO vertę. Uždraudę indeksuoti mes prarastume šią vertę. TODĖL visuomet patartina kartu su žymomis rel="prev"/"next" naudoti ir žymą rel=“canonical“ ir taip pasakysime kuris puslapis yra svarbiausias.

Kaip pavyzdį pateikiame 4 puslapius su puslapių numeracija, bet šiuo atveju puslapio lankytojai sekami su papildomu parametru per sesijos ID 55:

puslapiu_numeracija

II. Filtruotas turinys ir rel=“prev”/“next” žymų panaudojimas

SEO problemų sprendimas panaudojus filtrą sunumeruotuose puslapiuose. Pavyzdžiui jeigu sunumeruotame puslapyje Jūs galite papildomai filtruoti prekes pagal gamintoją, pavyzdžiui:

Puslapis 1:http://www.domenas.lt/puslapis1.html?gamintojas=nike

Atsižvelgiant į šią situaciją puslapio turinys priklausys nuo pasirinkto kintamojo. Pavyzdžiui:

Puslapis 1:http://www.domenas.lt/puslapis1.html?gamintojas=adidas

Puslapis 2:http://www.domenas.lt/puslapis2.html?gamintojas=adidas

Pateiks visiškai skirtingą prekių sąrašą nei:

Puslapis 1:http://www.domenas.lt/puslapis1.html?gamintojas=reebok

Puslapis 2:http://www.site.com/page2.html?gamintojas=reebok

Jeigu manote, kad yra tam tikra SEO vertė su sufiltruotais parametrais Google indeksui, tuomet geriausias planas būtų toks: sukurti atskirą puslapių numeracijos grandinę kiekvienam gamitojui atskirai. Tačiau šiems puslapiams (su filtru) nenurodome papildomos rel=“canonical“ žymos. rel=“canonical“ žyma išliks tik vienam puslapiui be jokių parametrų.

Atskiram gamintojui galima sukurti ir atskirą numeracijos grandinę:

puslapiu_numeracija

III. Turinio rūšiavimas (angl. sort order) ir žymų rel=“prev”/“next” naudojimas

Kai apsilankote puslapyje jis iškart gali būti surūšiuotas pavyzdžiui taip:

Puslapis 1:http://www.domenas.lt/puslapis1.html?order=oldest

TAČIAU gali būti galimybė ir surūšiuoti kita tvarka, pirma naujausios prekės ir atitinkamai pasikeičia URL:

Puslapis 1:http://www.domenas.lt/puslapis1.html?order=newest

Tarp SEO specialistai kartais išsiskiria nuomonės ir teigiama, kad tiek naujausios tiek seniausio prekės turėtų būti sunumeruotos su atskira numeracijos grandine su žymomis rel=”prev”/”next”. Tačiau šis parametras tik skirtingai išdėsto puslapio turinį, o turinys lieka tas pats, todėl vėl išlieka dubliuoto turinio problema.

TODĖL tokiu atveju, kai tik pasikeičia turinio išdėstymas, rekomenduočiau panaudoti žymą rel="prev"/"next" tik numatytajam parametrui numeruotame puslapyje:

puslapiu_numeracija

TAIGI alternatyvus rūšiavimo parametras, kuris šiame pavyzdyje yra naujausios prekės (newest) turėtų būti uždraustos indeksavimui. Tai lengvai galime padaryti su Google Webmasteer įrankiu su kuriuo galime nurodyti tik konkretų vieną parametrą, kuris bus indeksuojamas:

puslapiu_numeracija

Iš pirmo žvilgsnio šie pateikti sprendimai gali atrodyti gan sudėtingi. Tačiau labiau įsigilinę suprasite, kad tai nėra itin sudėtinga. Papildomai pateiksiu sprendimo matricą, kuri padės lengviau apsispręsti kokiu atveju kokį sprendimo būdą panaudoti.

puslapiu numeracijos sprendimo matrica

Jeigu nuspręsite panaudoti vieną iš šių SEO problemų būdų būtinai du kart patikrinkite ar teisingai panaudojote reikiamas žymas, nes tenka pastebėti nemažai klaidų naudojant žymą rel="prev"/"next”.

Pasidalinkite

Komentarai (-ų) (1)

  • Jonas
    4.505

    Net nežinojau... detalus, vaizdus aiškus straipsnis.

    2017-09-10

Parašykite komentarą

Susisiekite dabar:


Skambinkite: +370 633 09000
Rašykite: EnterNet@EnterNet.lt