Čo sú duplicitné stránky? Duplicitné stránky

a ak je tam dvojitý obsah, ale adresa URL je iná, je kanonická a je uzavretá v robts, ale stránka je v indexe, ako to vyhodnotiť?

Canonical rieši problém duplikácie.
Ak je však stránka zahrnutá do indexu a potom je uzavretá v súbore robots.txt, robot ju nemôže znova naskenovať a prepočítať parametre.

Súhlasím s predchádzajúcou odpoveďou. Problém môžete vyriešiť odoslaním žiadosti o vymazanie vo vyhľadávacej konzole.

Maxim Gordienko

Prečo sa odporúča používať kanonické pre stránkovacie stránky, namiesto odstránenia textu + noindex, nasledovať + pridanie konštrukcie „Strana N“ na začiatok Nadpisu na druhej a ďalších stránkovacích stranách (alebo môžete pridať aj prev / next )? Narazil som na to, že pri umiestňovaní kanonických produktov z druhej a ďalších stránok sa mi zle indexovali.

Existovala prax používania hlavičky HTTP X-Robots-Tag na zabránenie indexovaniu stránok, pretože pri používaní robotov sa často objavujú nasledujúce stránky: http://my.jetscreenshot.com... ?

Canonical je len odporúčanie. Pre relevantné stránky môžete použiť aj presmerovanie 301. Pre programy na vyhľadávanie duplikátov odporúčam Comparser + zobrazuje štruktúru stránky a je tu niekoľko ďalších užitočných funkcií. Serpstat je drahý.

Lepšie použite canonical a prevnexts a bude to skvelé.

Maxim Gordienko

Profesionál v oblasti SEO napríklad píše, že má zmysel zadávať kanonické stránkovanie iba vtedy, ak existuje stránka „zobraziť všetky produkty“ (a odporúčania spoločnosti Google neposkytujú príklad stránkovania v klasickej forme). Produkty (obsah) na druhej strane sa teda líšia od prvej, takže je nelogické uvádzať to ako kanonické.

Ak potrebujete skontrolovať iba duplikáty, potom je lepšie použiť špecifický softvér. Odporúčam Netpeak Spider. Teraz sa aktívne vyvíja a kontroluje množstvo parametrov na stránke https://netpeaksoftware.com... . V práci ho používame neustále.
Serpstat je dobrý, pretože je to platforma s mnohými nástrojmi: analytika dopytov, odkazov, audit, kontrola pozícií.

Povedzte nám, že sme do internetového obchodu pridali nové kategórie, vytvorili nové a do ostatných kategórií produktov boli pridané nové kategórie - potom sme vytvorili nové produktové stránky, kde sú nové kategórie v URL a duplikáty bola vytvorená. Aký je najlepší spôsob, ako zarobiť peniaze? Nastaviť adresu URL produktu ako statickú (nie dynamickú) a na staré stránky umiestniť presmerovania 301 z nových stránok? (e-shop je otvorený 6 mesiacov) ako sa dá zmeniť URL produktu? (v štruktúre URL produktu je názov kategórie).

1. Aby ste sa vyhli duplicite URL produktov, umiestnite ich do jedného priečinka /produkt/, pričom kategórie sa nastavia v menu a strúhanke.
2. Ak to nie je možné, vyberte jednu z možností.
2.1. Vikorist rel kanonický na hlavnú stránku produktu. S najväčšou pravdepodobnosťou je vo vašom prípade cena novej stránky spôsobená tým, že nová kategória je zahrnutá v URL. Hlavnú stránku si môžete vybrať sami.
2.2. Vikorist 301 presmerovanie na hlavnú URL. Ak ste na stránke, nemusíte uverejňovať príspevky na starej adrese URL, aby ste mohli odoslať presmerovanie 301.
3. Adresy URL produktov sú lepšie ako statické alebo používateľsky prívetivé.
4. "Ako sa dá zmeniť URL produktu? Zmenili ste kategóriu? (v štruktúre URL produktu je názov kategórie)."
Keďže v URL nie je možné neuviesť kategóriu (ako v bode 1.), tak ak zmeníte kategóriu v URL, treba ešte zmeniť a nastaviť 301 presmerovania na novú adresu.

Pre také široké vysvetlenie)

Povedzte mi, ako sa vyhnúť duplicitnému obsahu. Existuje 33 pozícií rovnakého typu produktu https://delivax.com.ua/pack...
Napísať jedinečný popis pre každého je ťažké a zdá sa zbytočné. Ale vzhľadom na to, že popis je duplicitný, z 33 pozícií je v indexe iba 5. Mám sa toho obávať a čo s tým mám robiť?

- ktorý pracuje na propagácii webových stránok. Dokáže vytvoriť dve rovnaké domovské stránky, ktoré sa líšia adresou.

Algoritmy vyhľadávačov fungujú automaticky a často sa stáva, že duplikát je systémom vnímaný ako relevantnejší ako pôvodná stránka. Výsledkom je, že výstup nebude zobrazovať originál, ale jeho duplikát. Dvojka má zasa iné parametre, ktoré neskôr ovplyvnia pesimizáciu stránky.

Existujú rôzne spôsoby, ako nájsť a skontrolovať duplicitné stránky. Od dodávateľa vyžadujú rôzne stupne znalostí CMS, ako aj pochopenie fungovania indexu vyhľadávania. Pokúsme sa vám ukázať najjednoduchší spôsob, ako skontrolovať, či stránka neobsahuje duplicitné stránky. Hneď si všimnime, že táto metóda nie je veľmi presná. Zároveň vám však táto metóda umožňuje vyhľadávať duplicitné stránky webu a nezaberie vám to veľa času.

Teraz sa pozrime, ako to isté urobiť iba v systéme Google. V zásade sa postup nelíši, budete musieť vykonať rovnaké akcie ako v Yandex.

Vyhľadávací nástroj Yandex okamžite poskytuje zoznam duplikátov, ale v službe Google, ak chcete zobraziť duplikáty, budete musieť dodatočne kliknúť na „Zobraziť skryté výsledky“, pretože pôvodná stránka sa často zobrazuje na obrazovke.

Z obrázku môžete vidieť, že v hlavných výsledkoch vyhľadávania je 1 stránka webu a je to tiež originál. V indexe sú však aj ďalšie stránky, ktoré sú duplicitné. Ak ich chcete zobraziť, musíte kliknúť na odkaz „Zobraziť skryté výsledky“. V dôsledku toho dostaneme zoznam, kde je originál na čísle 1, a potom sú už umiestnené duplikáty. Duplikáty sa často budú musieť vyčistiť ručne.

Ako skontrolovať, či stránka neobsahuje duplicitné stránky

V nižšie uvedenom článku sa dnes pokúsime zvážiť mnohé problémy súvisiace s problémom duplikovania stránok, čo spôsobuje duplikáty, ako sa ich zbaviť a vo všeobecnosti, prečo sa musíte zbaviť duplikátov.

Po prvé, poďme pochopiť, čo sa skrýva pod pojmom „duplicitný obsah“. Často sa stáva, že niektoré stránky môžu obsahovať čiastočne alebo úplne rovnaký obsah. Je jasné, že každá jednotlivá stránka má svoju vlastnú adresu.

Dôvody duplikátov:

— vlastníci stránok sami vytvárajú duplikáty na špecifické účely. Povedzme, že by to mohla byť stránka určená na tlač, ktorá umožní návštevníkovi komerčnej stránky skopírovať potrebné informácie o určitom produkte alebo službe.

- sú generované motorom internetového zdroja, pretože je zabudovaný v ich tele. Určitý počet moderných CMS dokáže zobraziť podobné stránky s rôznymi adresami URL, ktoré sa nachádzajú v rôznych adresároch.

— chyby, ktorých sa dopustil správca webu, ktorý pracuje na propagácii webovej stránky. Dokáže vytvoriť dve rovnaké domovské stránky, ktoré sa líšia adresou.

— zmena štruktúry stránky. Keď vytvoríte novú šablónu s iným systémom URL, nové stránky so starým obsahom dostanú iné adresy.

Uviedli sme možné dôvody výskytu jasných duplikátov, ale existujú aj neostré, teda čiastočné. Podobné stránky majú často podobnú časť šablóny zdroja, ale ich obsah je mierne odlišný. Takýmito duplikátmi môžu byť stránky lokality, ktoré majú rovnaký výsledok vyhľadávania alebo samostatný prvok článku. Najčastejšie sú takýmito prvkami obrázky.

Musíte sa zbaviť duplicitných stránok. Nie, toto nie je vírus, ale časom narastá, hoci to nezávisí od samotného zdroja. Duplikáty sú často výsledkom neprofesionálneho správcu webu alebo výsledkom nesprávneho kódu stránky.

Je dôležité vedieť, že duplikáty môžu spôsobiť značné poškodenie zdroja. Aké dôsledky môže mať prítomnosť duplikátov na stránke? Po prvé, ide o zhoršenie indexovania zdrojov. Súhlaste s tým, že takáto situácia majiteľa stránky veľmi nepoteší. Zatiaľ čo peniaze a čas sa neustále vynakladajú na propagáciu zdroja, zdroj začne strácať svoju popularitu v priebehu niekoľkých dní. Hĺbka problému bude závisieť od počtu odberov.

Stáva sa, že hlavná stránka môže mať niekoľko duplikátov. S blogmi je to trochu inak. Vďaka replytocom môže dôjsť k obrovskému množstvu duplikátov kvôli kopírovaniu komentárov. Ukazuje sa, že čím je blog populárnejší, tým viac duplikátov bude obsahovať. Vyhľadávače, najmä Google, zase znižujú pozíciu zdroja kvôli prítomnosti takýchto duplikátov.

Algoritmy vyhľadávačov fungujú automaticky a často sa stáva, že duplikát je systémom vnímaný ako relevantnejší ako pôvodná stránka. Výsledkom je, že výstup nebude zobrazovať originál, ale jeho duplikát. Dvojka má zasa iné parametre, ktoré neskôr ovplyvnia pesimizáciu stránky.

Čo môžeme urobiť? Duplicitné stránky sa stávajú skutočnou prekážkou indexovania stránok, ako aj dôvodom, prečo vyhľadávač nesprávne vyberie relevantnú stránku a zníži vplyv prirodzených odkazov. Okrem toho duplikáty nesprávne rozdeľujú vnútornú váhu, čím znižujú silu propagovaných stránok, ako aj meniace sa ukazovatele správania.

Ako skontrolovať, či stránka neobsahuje duplicitné stránky?

Existujú rôzne spôsoby, ako nájsť a skontrolovať duplicitné stránky. Od dodávateľa vyžadujú rôzne stupne znalostí CMS, ako aj pochopenie fungovania indexu vyhľadávania. Pokúsme sa vám ukázať najjednoduchší spôsob, ako skontrolovať, či stránka neobsahuje duplicitné stránky. Hneď si všimnime, že táto metóda nie je veľmi presná. Zároveň vám však táto metóda umožňuje vyhľadávať duplicitné stránky webu a nezaberie vám to veľa času.

Ak chcete vyhľadať a skontrolovať duplikáty vo svojom vlastnom zdroji, jednoducho zadáte špeciálny dotaz do rozšíreného vyhľadávania vyhľadávacieho nástroja. Ak používate rozšírenú verziu vyhľadávania v Yandex, môžete získať pomerne podrobné výsledky, pretože je možné zadať objasňujúce parametre žiadosti.

Budeme potrebovať adresu zdroja a tú časť textu, ktorej duplikát chceme nájsť. Aby sme to dosiahli, budeme musieť vybrať fragment textu na našej stránke a potom zadať skopírovaný text a adresu lokality do rozšíreného vyhľadávania systému Yandex. Teraz musíte kliknúť na tlačidlo „Nájsť“, po ktorom systém spustí vyhľadávanie.

Výsledky sa nezobrazia ako zvyčajne. Zoznam stránok bude obsahovať iba názvy a úryvky nášho zdroja. V prípade, že systém vygeneruje jeden výsledok, znamená to, že neexistujú žiadne duplikáty tejto stránky. Ale keď dosiahnete niekoľko výsledkov, budete musieť pracovať.

Teraz sa pozrime, ako to isté urobiť iba v systéme Google. V zásade sa postup nelíši, budete musieť vykonať rovnaké akcie ako v Yandex.

Rozšírené vyhľadávanie uľahčuje nájdenie všetkých duplikátov konkrétneho textu. Samozrejme, týmto spôsobom nezískame duplicitné stránky, ktoré neobsahujú zadaný text. Treba povedať, že ak bola dvojka vytvorená zakrivenou šablónou, tak na inej stránke zobrazuje napríklad len obrázok z originálu. Samozrejme, ak duplikát neobsahuje text, potom ho nebude možné určiť pomocou vyššie opísanej metódy. To si vyžaduje inú metódu.

Druhá metóda sa tiež vyznačuje jednoduchosťou. Musíte použiť špeciálny operátor a požiadať o indexovanie vašej stránky, prípadne jej jednotlivých stránok. Potom sa budete musieť manuálne pozrieť na výsledky, aby ste našli duplikáty.

Pravidlá syntaxe pre požadovanú požiadavku:

V situácii, keď sa do vyhľadávania jednoducho zadá adresa hlavnej stránky, sa nám pomocou vyhľadávacieho robota zobrazí zoznam indexovaných stránok. Ale ak zadáme adresu konkrétnej stránky, systém zobrazí už indexované duplikáty tejto stránky.

Vyhľadávací nástroj Yandex okamžite poskytuje zoznam duplikátov, ale v službe Google, ak chcete zobraziť duplikáty, budete musieť dodatočne kliknúť na „Zobraziť skryté výsledky“, pretože pôvodná stránka sa často zobrazuje na obrazovke.

Ako môžete vidieť na obrázku, v hlavných výsledkoch vyhľadávania máme jednu stránku webu a je to tiež originál. V indexe sú však aj ďalšie stránky, ktoré sú duplicitné. Ak ich chcete zobraziť, musíte kliknúť na odkaz „Zobraziť skryté výsledky“. V dôsledku toho dostaneme zoznam, kde je originál na čísle 1, a potom sú už umiestnené duplikáty. Duplikáty sa často budú musieť vyčistiť ručne.

Vydali sme novú knihu Marketing obsahu sociálnych médií: Ako sa dostať do hláv svojich nasledovníkov a prinútiť ich, aby sa zamilovali do vašej značky.

Duplicitné stránky sú stránky, ktoré sú navzájom identické a nachádzajú sa na rôznych adresách URL. Kópie stránok sťažujú indexovanie stránok vo vyhľadávačoch.

Čo sú duplicitné stránky na webe?

Pri použití rôznych systémov obsahu sa môžu vyskytnúť duplikáty. Pre používateľa je v poriadku, ak sú duplikáty na tej istej stránke. Vyhľadávače však môžu po zistení duplicitných stránok použiť filter/nižšie pozície atď. Preto by sa duplikáty mali rýchlo vymazať a pokúsiť sa zabrániť ich výskytu.

Aké typy záberov existujú?

Duplikáty stránok na lokalite môžu byť úplné alebo neúplné.

  • Neúplné zábery– keď sú fragmenty obsahu duplikované v zdroji. Takže napríklad umiestnením častí textu do jedného článku z druhého dostaneme čiastočnú duplicitu. Niekedy sa takéto zábery nazývajú neúplné.
  • Kompletné zábery- Toto sú stránky, ktoré majú úplné kópie. Zhoršujú hodnotenie stránky.

Napríklad veľa blogov obsahuje duplicitné stránky. Duplikáty ovplyvňujú hodnotenie a znižujú hodnotu obsahu. Preto sa musíte zbaviť duplicitných stránok.

Dôvody duplicitných stránok

  1. Používanie systému na správu obsahu(CMS) je najčastejšou príčinou duplikácie stránok. Napríklad, keď jeden záznam v zdroji patrí do niekoľkých kategórií naraz, ktorých domény sú zahrnuté v adrese webovej stránky samotného záznamu. Výsledkom sú duplicitné stránky: napríklad:
    wiki.site.ru/blog1/info/
    wiki.site.ru/blog2/info/
  2. Technická sekcia s. Bitrix a Joomla sú tu najhoršími páchateľmi. Napríklad jedna z funkcií stránky (vyhľadávanie, filtrovanie, registrácia atď.) generuje parametrické adresy s rovnakými informáciami vo vzťahu k zdroju bez parametrov v URL. Napríklad:
    site.ru/rarticles.php
    site.ru/rarticles.php?ajax=Y
  3. Ľudský faktor. Tu to v prvom rade znamená, že človek môže svojou neopatrnosťou duplikovať ten istý článok vo viacerých častiach stránky.
  4. Technické chyby. Ak sú odkazy generované a nakonfigurované nesprávne v rôznych informačných systémoch, dochádza k chybám, ktoré vedú k duplicitným stránkam. Ak napríklad nesprávne nastavíte odkaz v systéme Opencart, môže dôjsť k slučke:
    site.ru/tools/tools/tools/…/…/…

Prečo sú duplicitné stránky nebezpečné?

  1. Optimalizácia webových stránok vo vyhľadávačoch sa výrazne skomplikuje. V indexe vyhľadávacieho nástroja môže byť veľa duplikátov jednej stránky. Zabraňujú indexovaniu iných stránok.
  2. Externé odkazy na stránku sa stratia. Kopírovanie sťažuje identifikáciu relevantných stránok.
  3. Vo výsledkoch vyhľadávania sa zobrazia duplikáty. Ak je duplicitný zdroj dodávaný s behaviorálnymi metrikami a dobrou návštevnosťou, po aktualizácii údajov môže vo výsledkoch vyhľadávača nahradiť hlavný zdroj.
  4. Pozície sa strácajú vo výsledkoch vyhľadávačov. Ak sú v hlavnom texte nejasné duplikáty, potom z dôvodu nízkej jedinečnosti článok nemusí byť zahrnutý do SERP. Napríklad časť správ, blogu, príspevku atď. si jednoducho nemusí všimnúť, pretože vyhľadávací algoritmus ich považuje za duplikáty.
  5. Pravdepodobnosť, že hlavná stránka spadne pod filter vyhľadávacieho nástroja, sa zvyšuje. Vyhľadávače Google a Yandex bojujú proti nejedinečným informáciám, ktoré môžu byť uvalené na stránku.

Ako nájsť duplicitné stránky

Ak chcete odstrániť duplicitné stránky, musíte ich najskôr nájsť. Existujú tri spôsoby, ako nájsť kópie na stránke.


Ako odstrániť duplicitné stránky

Musíte sa zbaviť duplikátov. Je potrebné pochopiť dôvody výskytu a zabrániť šíreniu kópií stránok.

  • Môžete použiť vstavané funkcie vyhľadávača. V Google použite atribút v tvare rel="canonical". Značka vo formulári je vložená do kódu každého odberu: , ktorý ukazuje na hlavnú stránku, ktorá sa má indexovať.
  • V súbore robots.txt môžete zabrániť indexovaniu stránok. Týmto spôsobom však duplicity vo vyhľadávači úplne neodstránite. Koniec koncov, nemôžete písať pravidlá indexovania pre každú jednotlivú stránku, bude to fungovať iba pre skupiny stránok.
  • Môžete použiť presmerovanie 301. Roboty tak budú presmerované z duplikátu na pôvodný zdroj. V tomto prípade im serverová odpoveď 301 oznámi, že takáto stránka už neexistuje.

Duplikáty ovplyvňujú hodnotenie. Ak sa neodstránia včas, potom je vysoká pravdepodobnosť, že stránka spadne pod filtre Panda a AGS.

Dnes si povieme niečo o záberoch. Konkrétne, čo sú duplicitné stránky na webe, ako ohrozujú propagáciu, ako ich nájsť a odstrániť.

Čo sú duplicitné stránky na webe?

Duplikáty sú stránky s čiastočne alebo úplne identickým obsahom, ale prístupné z rôznych adries URL. Zvyčajne sú klasifikované ako jasné a nejasné. Jasným príkladom môžu byť zrkadlá hlavnej stránky webu:

site.ru
www.site.ru
site.ru/index.php

A fuzzy sú veľké časti textu, ktoré prechádzajú celým zdrojom:

Aké sú nebezpečenstvá duplicitných stránok?

1. Skoky relevantných stránok vo výsledkoch vyhľadávania. Najčastejším problémom je, že vyhľadávač nedokáže jednoznačne určiť, ktorý dokument by sa mal zobraziť vo výsledkoch vyhľadávania na dopyt, ktorý zodpovedá téme. Výsledkom je, že poradie makléra a informácie o správaní sú rozložené v duplikátoch, pozície neustále naskakujú a nie pozitívnym smerom.

2. Zníženie jedinečnosti obsahu stránky. Tu je všetko zrejmé - percento stránok s jedinečným obsahom klesá, čo môže mať negatívny vplyv na jeho hodnotenie.

Odkiaľ pochádzajú duplicitné stránky?

1. CMS. Veľmi obľúbený dôvod, pochádzajúci z nedokonalosti použitého riadiaceho systému. Triviálnou situáciou je napríklad situácia, keď jeden príspevok na stránke patrí do niekoľkých kategórií, ktorých aliasy sú zahrnuté v adrese URL samotného príspevku. V dôsledku toho dostaneme do očí bijúce duplikáty, napríklad:

site.ru/category1/post/
site.ru/category2/post/

2. Servisné úseky. Dá sa to pripísať aj nedokonalému fungovaniu CMS, ale kvôli rozšírenosti problému to dávam do samostatného odseku. Tu sú obzvlášť vinní Joomla a Birix. Napríklad akákoľvek funkcia na stránke (autorizácia, filtrovanie, vyhľadávanie atď.) vytvára parametrické adresy, ktoré majú rovnaký obsah ako stránka bez parametrov v URL. Napríklad:

site.ru/page.php
site.ru/page.php?ajax=Y

3. Ľudský faktor. To zahŕňa všetko, čo je produktom ľudských rúk:

  • Spomínané veľké časti textu.
  • End-to-end statické bloky.
  • Banálne duplikovanie článkov.

Pokiaľ ide o druhý bod, rád by som objasnil, že tu hovoríme predovšetkým o kódexe. O tejto téme sa veľa diskutuje, ale ja mám absolútne jasno – veľké časti komplexného kódu sú veľmi zlé. Mal som v praxi minimálne 3 prípady, keď skrytie konceptov pred robotmi zvýšilo indexovanie webu z 20 na 60 tisíc stránok v priebehu jedného alebo dvoch mesiacov. Ale tu je to banálne v kóde nebude stačiť, a preto o tom budem hovoriť v samostatnom materiáli.

4. Technické chyby. Niečo medzi nedokonalosťou CMS a ľudským faktorom. Prvý príklad, ktorý ma napadá, sa odohral na systéme Opencart, keď krivý odkaz viedol do slučky:

site.ru/page/page/page/page/../..

Ako nájsť duplicitné stránky na webe?

Najjednoduchší a najspoľahlivejší spôsob, ako to urobiť, je prejsť nasledujúcimi 3 krokmi.

1. Softvérová kontrola stránky na prítomnosť duplicitných stránok. Berieme NetPeak Spider, Screaming Frog SEO Spider alebo akýkoľvek iný podobný softvér na internú analýzu a skenujeme stránku. Potom triedime napríklad podľa metanadpisov a dávame pozor na ich zhodu alebo úplnú absenciu. Náhoda je dôvodom na manuálnu kontrolu týchto stránok a nedostatok metainformácií je jedným z pravdepodobných znakov technickej sekcie, ktorú je najlepšie uzavrieť pred indexovaním.

2. 301 presmerovanie. Táto možnosť je pre vás vhodná, ak sú kópie fľakaté a nechcete ich z nejakého dôvodu zablokovať v indexovaní (napríklad na ne už niekto umiestnil externý odkaz). V tomto prípade jednoducho nastavíme presmerovanie 301 z duplikátu na hlavnú stránku a problém je vyriešený.

3. Odkaz rel="canonical". Toto je dobré riešenie pre situáciu opísanú vyššie, keď je rovnaký príspevok dostupný na rôznych URL. Pre každý takýto príspevok je do kódu implementovaná takáto značka: , kde http://site.ru/cat1/page.php je možnosť adresy URL príspevku, ktorú chcete indexovať.

Táto značka je programovo implementovaná pre každý príspevok a potom nech má aspoň 100 URL - na všetkých bude kód obsahovať odporúčanie pre vyhľadávač, ktorú URL odporúčate indexovať a ktoré ignorovať (stránky, ktorých vlastná URL a URL v odkaz rel="canonical" sa nezhodujú).

4. Google Search Console. Menej populárna, no napriek tomu fungujúca technika, ku ktorej máme prístup v sekcii „Prehľadávanie“ – „Parametre URL“ v Google Search Console.

Pridaním parametrov do tejto tabuľky vieme vyhľadávaciemu robotovi povedať, že stránky nijako nemenia obsah, a preto ich netreba indexovať. Samozrejme sú však možné aj iné možnosti, v ktorých sa obsah sekcie „premieša“, keď je parameter zahrnutý v adrese, pričom však zostane nezmenený v jeho zložení (napríklad zoradenie podľa obľúbenosti záznamov v kategória).

Uvedením tejto skutočnosti v tejto časti pomôžeme spoločnosti Google lepšie interpretovať stránku pri jej indexovom prehľadávaní. Po informovaní o účele parametra v adrese URL je lepšie ponechať otázku indexovania takýchto stránok „na uvážení Googlebota.

Často kladené otázky

Viacstranové sekcie (stránkovanie) - duplikáty alebo nie? Mám ho zatvoriť z indexovania?

Nie, nemusíte im blokovať indexovanie ani uvádzať rel="canonical" na prvú stránku sekcie, pretože majú obsah, ktorý je vo vzťahu k sebe jedinečný, a teda nejde o duplikáty. Vyhľadávače sú vynikajúce v rozpoznávaní stránkovania, no pre väčšiu spoľahlivosť im bude stačiť poskytnúť mikro značkovacie prvky rel="next" a rel="prev". Napríklad:


Adresy URL s hashtagmi (#) - duplikáty alebo nie? Mám ich vymazať?

Nie Vyhľadávač štandardne neindexuje stránky s # v adrese, takže sa toho netreba obávať.

To je asi všetko. otázky?

Hovorili sme o duplicitných stránkach na webe replytocom. Pripomeniem podstatu predchádzajúceho článku. Ide o to, že by ste nemali robiť cestu k ničomu na svojom blogu uzavretú v Robotoch. Naopak je vhodné, aby sa roboty otvorili, aby robot prišiel, pozrel sa, videl tag a neindexoval duplicitné stránky.

Ak sú tieto kópie stránok zatvorené, tento robot s najväčšou pravdepodobnosťou indexuje podobné duplikáty. Je vhodné si to zapamätať! Ďalej si pripomeňme, ako sme hľadali kópie pomocou Replitok vo vyhľadávači Google. Dovoľte mi pripomenúť:

site:vaša stránka replytocom, t.j. v mojom príklade to bude vyzerať lokalita: lokalita replytocom

Ako nájsť duplicitné stránky na svojom blogu

Skvelé. Teraz budeme hľadať ďalšie kópie stránok a podrobnejšie kópie: feed, category, tag, comment-page, page, trackback, attachment_id, attachment

Hľadáme ich podobným spôsobom, ako sme hľadali duplicitné stránky pomocou replík. Všetko robíme podobným spôsobom, konkrétne prejdite na ľubovoľný blog a zadajte ho do vyhľadávača, napríklad site:realnodengi.ru feed

Kliknutím na „Zobraziť skryté výsledky“ sa zobrazí:


22-stranové duplikáty. Čo znamená krmivo? Toto je nezrozumiteľná príloha na konci adresy článku. Pre ktorýkoľvek z vašich príspevkov stlačte ctr + u a na konci s najväčšou pravdepodobnosťou uvidíte odkaz na informačný kanál. Inými slovami, takéto odkazy musia byť odstránené. Vstúpme do robotov tejto stránky, uvidíme:

Teda to, čo my netreba. Čo by sme mali robiť, je vhodné takéto zákazy v robotoch odstrániť? Aby k nim robot nešiel a neindexoval ich „pre každý prípad“.

Skvelé! Skontrolovali sme stránky informačných kanálov.

Zoberme si inú stránku, napríklad reall-rabota.ru, a vložte stránku. Získame stránku site:reall-rabota.ru:

Vidíme, že na tejto lokalite je 61 duplicitných stránok. Treba sa ich zbaviť. Dúfam, že autorov týchto blogov moja analýza neurazí?

Vykonajte podobnú analýzu pre svoje blogy, a to nielen pre tieto kópie, ale aj pre ďalšie, ktoré som citoval vyššie, napríklad kategóriu, značku atď.

Tak ako? Ste spokojný so svojím výsledkom?

S najväčšou pravdepodobnosťou nenájdete kópie všetkých týchto slov. To je samozrejme skvelé! Ale tých, ktoré máte, sa budete musieť zbaviť! Zamyslime sa ako?

Ako odstrániť problém duplicitných webových stránok

Po prvé, choďte do mojej roboty a skopírujte si ho pre seba a podľa toho ho nahraďte webovej stránky na názov vašej stránky. Nahradený? Skvelé! Myslím, že veľa blogov malo zákazy, ako je vyššie uvedená stránka.

Po druhé, prepíšte do súboru .htaccess nasledujúce riadky:


Tento súbor sa nachádza vo vašom koreňovom priečinku, ktorý sa najčastejšie nazýva public_html. Aby som to urobil, zvyčajne otvorím program, prenesiem požadovaný súbor na plochu, otvorím tento súbor pomocou softvéru Notepad + +, vykonám potrebné zmeny a nahradím starý súbor novým.

Po nahraní nového súboru by mal váš .htaccess vyzerať takto:

Po tretie, vložte ho do function.php za /*** PRIDAŤ meta robots noindex,nofollow PRE STRÁNKY ***/ funkcia my_meta_noindex () ( if (is_paged() // Všetky a všetky stránky stránkovania) (echo "".""."\n";) ) add_action ("wp_head", "my_meta_noindex", 3); // pridajte svoj noindex, nofollow do hlavy

Po štvrté, prejdite na rozšírenie Všetko v jednom seo balení a urob toto:

Ak máte iný plugin, napríklad SEO, vložte noindex do sekcií, ktoré majú podobný význam.

Po piate, v časti „Možnosti“ prejdite do časti „Nastavenia-Diskusie“ a zrušte začiarknutie políčka Rozdelenie komentárov:


Na záver ponúkam podrobné video o záberoch.

To nie je všetko, je tu ešte veľa duplicitných stránok a iných odpadkov. Je potrebné ho odstrániť. Nie je vždy ľahké to urobiť sami, takže niekedy sa musíte obrátiť na profesionála. Ale nie vždy ho nájdete a nie vždy sa k nemu obrátite.

Odtiaľto je vhodné zistiť všetky podrobnosti sami. Dá sa to dosiahnuť osobnou komunikáciou aj štúdiom materiálu. Myslím ten video kurz. Podľa mňa je vhodnejší video kurz, pretože... zaškolí ťa pani pred tvojím monitorom!



Tento kurz som priniesol z nejakého dôvodu, študoval som ho. Mne osobne sa to páčilo. Predtým mi Yandex ukázal 1220 indexovaných stránok, hoci v skutočnosti ich je 250. Teraz, po vyčistení, Yandex ukazuje 490, Google 530. Súhlasím, tieto čísla sú bližšie k skutočným!

Ale, akokoľvek sa to môže zdať zvláštne, na veľkom počte stránok sa tieto čísla vymykajú z rozsahu pre 200 000 záberov alebo viac. Žiadne vtipy! Stránky s podobnými ukazovateľmi môže vyhľadávač čoskoro zakázať. Ale vráťme sa k kurzu. Budem citovať Alexandrove slová:

Viac podrobností o tom všetkom na Borisovovej stránke, stačí kliknúť na obrázok s kurzom.

V podstate je práca hotová, duplicitné stránky budú vymazané po indexovaní, ale nie okamžite, budete musieť počkať niekoľko mesiacov! Veľa šťastia pri propagácii vášho zdroja! Ak poznáte iné spôsoby, ako odstrániť duplicitné webové stránky, napíšte do komentárov, poďme to spoločne preskúmať!

Anekdota v každom článku.