Toata lumea stie ca un site popular in Google e un site cu multe pagini indexate, pagini care au pozitii cat de cat ok la cautari. Pe principiul asta foarte multi indexeaza pagini in motoarele de cautare, sperand la volume de trafic considerabile. Daca le spui sa nu indexeze tag-uri, iti vor spune ca e o practica frecvent folosita de A-listii din blogosfera. Daca le spui sa nu indexeze cautarile din magazinele online, cineva o sa iti spuna ca e ok sa fie indexabile ptr ca nu se stie niciodata. La fel si filtarea produselor sau paginatiile de categorii.
Google a incercat prin diferiti algoritmi sa contracareze indexarea de continut inutil prin supplimental results, duplicate content, rel canonical, rel next prev astfel incat doar paginile importante sa fie indexate in Google.
Cum de la teorie pana la practica nu e foarte mult (ptr mine), am zis sa fac niste analize pe cateva site-uri. Incep cu datele din Webmaster Tool, Index Status e sectiune unde puteti vedea ce pagini sint indexabile si care e istoricul lor.
Optiunea avansata structureaza paginile indexate dupa starea lor. Cu verde e Not selected pe care Google o explica in felul urmator:
Not selected: Pages that are not indexed because they are substantially similar to other pages, or that have been redirected to another URL.
In detalierea optiunii se explica ce pagini se incadreaza si cum pot fi rezolvate problemele pe care le genereaza. Cred ca imaginea de mai sus e clara, in cazul acestui site un volum mare de pagini nu au fost selectate ptr indexare sau sint considerate ca fiind junk.
In teorie ele nu ar trebui indexate, dar ele sint. Urmatorul pas e sa verifici totalul de pagini indexate in Google folosind site: domeniu.ro ptr a avea un total estimativ de pagini indexate. Apoi scoti din index-ul lui Google, folosind acelasi operator de cautare, paginile pe care tu le consideri junk. Cautarea finala ar trebui sa arate cam asa:
site: domeniu.ro -filtre -cautari indexabile -pagina junk -pagina-junk.php – etc junk
In principiu, daca identificati bine paginile inutile veti reusi sa triati intr-un final paginile de calitate. Rezultatul ar trebuie sa se evidentieze cam asa:
M-am jucat cu niste magazine online romanesti, facand o triere folosind cautarea de mai sus. Majoritatea magazinelor online au cam aceleasi procente majoritare de continut inutil indexat in Google. Bun, multi vor spune „pai daca genereaza trafic, e ok!”.
Problema e ca aceste pagini nu genereaza trafic asa cum se spera, in plus au bounce rate destul de mare dar si conversie mica. Numarul mare de pagini indexate in Google nu mai e de mult o forma potrivita de a face SEO, tot ce reusesti sa faci sa te autointoxici cu continut inutil.
Prima imagine reflecta traficul organic venit de pe pagini junk si non junk. A doua sint conversiile generate de aceste pagini. E doar o mostra facuta special ptr a vedea efectul acestor pagini. In Analytics puteti crea segmente prin care sa impartiti continutul in Junk si Not Junk, urmand ca apoi sa verificati traficul organic pe care il genereaza dar si conversiile.
Concluzie
Nu indexati pagini inutile doar de dragul indexarilor, in speranta ce veti genera mai mult trafic. Google va poate penaliza ptr asa ceva, daca nu o face atunci sigur vizitatorii o vor face ptr ca paginile care ies la cautari nu sint relevante si deci satisfactia e mica. De Google mai puteti scapa, dar de clientii suparati mai greu.
Restrictionarea accesului la aceste pagini, prin robots.txt, meta-uri etc, puteti scoate in evidenta paginile care trebuie astfel incat relevanta sa fie cat mai mare ptr cautatori. Prioritizarea indexarii prin nofollow pe link-uri sau pe pagini (prin meta nofollow) va scapa de pagini vizualizate inutil, un crawling structurat corespunzator dar si o pozitionare mai puna la cautari.
E doar un aspect din ceea ce se numeste optimizare onpage. Voi dezbate si altele in viitor. Gary Illyes considera lucrurile de mai sus ca fiind mituri SEO intr-o prezentare la Superweek Sinaia 2012.
Interesanta analiza Krumel. Problema a ca nu intotdeauna paginile not selected sunt identificabile. De exemplu, in cazul unui blog de care ma ocup am foarte multe „not selected” aparute relativ brusc.
Site-ul nu are taguri (indexabile sau nu) iar paginatia e pusa cu noindex. Ar mai fi paginile de authors (noindex) insa numarul „not selected” este disproportionat fata de numarul paginilor legitime.
Nichita, pai in sine Not Selected nu tine doar de filtre, paginatie ca structura de site, ci tine si de continut. Paginile care dubleaza continutul pot fi destul de usor de identificat. Apoi, tot aici intra si eventuale redirecturi facute.
Nu poti identifica tot, dar in mare parte se poate face curatenie. :)
Intre timp mi-am dat seama ca si paginile 404 indexate cu continut ar fi trebuit adaugate in analiza. Sau pagini cu produse inexistente, in cazul magazinelor online.
Oricum e mai bine decat sa indexezi pagini care te pot trage in jos.
Inca mai functioneaza tactica asta. Am vazut in ro la cateva site-uri de stiri.
La ce te referi cand spui „pagini cu produse inexistente” ?
Daca produsul nu mai este disponibil nu este mai ok sa ii sugerezi produse similare odata ajuns pe site-ul tau?
Sunt de acord cu neindexarea paginilor nerelevante, dar totusi daca se indexeaza pagina produsului poti transforma un vizitator intr-un client care e dispus sa cumpere un produs foarte asemanator.
Astept o parere.
Mersi !
Daniela, produsele au o perioada de revenire in functie de stoc sau producatorul care inca mai produce acel produs sau nu. Sau chiar comerciantul care mai doreste sa comercializeze un produs sau nu.
Restul paginilor care nu corespund tipologiilor mai sus mentionate pot fi excluse de la cautari.
Daca produsul nu mai e vandut pe site, pe perioade mari de timp sau nelimitat, atunci paginile ar trebui scoase din index. Desi alternativa produselor asemanatoare e ok, multi vizitatori nu tind sa adere la site, mesajul e clar: produsul nu exista.
Eliminand paginile astea din index ai grija ca vizitatorii sa gaseasca doar produsele de pe stoc dar si sa generezi o imagine buna prin eliminarea frustrarii.
Nu esti frustrata cand alegi un rezultat la o cautare si acea pagina nu returneaza ceea ce ai cautat? :)
Salut, personal stiu pe cineva care isi intretine site-ul doar cu un program, practic face spam dar este pe prima pagina pe cuvintele cheie pe care le doreste.
Am ramas mirat ca asa ceva mai merge, este pe prima pagina in google de ceva timp, de seo m-am ocupat eu dar de luni de zile nu i-am mai facut nimic si este inca acolo, first page nr.2
Salut krumel,
Cum pot scoate din index anumite pagini? google le-a indexat la inceput cand site-ul nu era lansat si acum le afiseaza in cautari ca fiind 404. pot face altceva inafara de redirect?
Ai mai avea optiunea din Webmaster tools de a scoate anumite pagini din index, dar e destul de greoaie, dureaza pana le scoate.
Mai nou, orice pagina indexata de ei le cam apartine ptr o perioada de timp…
Dar ce te faci daca paginile de tag-uri/cautari dintr-un magazin iti aduc 10-15% din comenzile din magazin ? (conform analytics)
Daca le scoti din index, cum ii explici clientului ce s-a intamplat.
Pai te uiti la bounce rate si o sa vezi ca desi paginile aduc trafic nu sint utile. Stiu faza asta cu orice procent de trafic are importanta lui si nu conteaza cum e adus.
Dar e mai important sa aduci vizitatorii cu paginile corecte in loc sa spamezi indexul cu taguri, arhive, calendare, cautari indexate sau filtre inutile.
Efectul imediat ar fi scaderea traficului, dar si cresterea numarului de pagini vizualizate, a timpului pe site, o scadere de bounce si chiar vanzari mai bune.
Magazinul nu sta in 10-15% din traficul venit pe pagini inutile…
Online-ul nu face decat sa repete la o alta scara, ceea ce se petrecea in piata lumii tangibile, acum 200-300 de ani, cand capitalismul era la inceput de drum si existau putine reguli, norme de conduita si percepte morale si cine era suficient de viclean si de lipsit de scrupule incat sa imbine inteligenta cu violenta sau cu minciuna, reusa sa ajunga in varful piramidei.
Suntem intr-un fel de capitalism salbatic al internetului in care e permis aproape orice. Dar asa cum s-a intamplat in lumea reala, la fel se va intampla si in online, vor aparea treptat noi si noi norme, pe masura ce utilizatorii internetului isi vor cizela conduita online si se vor educa din mers. Nu cred ca normele impuse de vreo autoritate vor conta atat de mult pe cat va conta comporamentul individual al utilizatorilor, din ce in ce mai exigenti.
Rabdare si tutun, vorba aia….
Comentariile sunt închise.