1
OTT
Scritto da Fortunecat in SEO
Oggi parliamo del fenomeno della deindicizzazione nei blog. Molti bloggers notano che i loro vecchi post spariscono dall’indice rimpiazzati dai nuovi articoli. Come risolvere questo problema?
Ecco la mia teoria (basata anche su quanto detto da Matt Cutts): la profondità e la frequenza del crawl sono collegate al pagerank mediante una relazione di questo tipo:

Maggiore è il pagerank, con più frequenza e con maggiore profondità le nostre pagine verranno scansionate.
La profondità del crawling nella deindicizzazione gioca un ruolo fondamentale, perchè come notato da alcuni esperti (tra cui Giorgio Taverniti) spesso i post vengono rimossi dall’indice proprio nel momento in cui smettono di comparire nella homepage del blog, rimpiazzati da nuovi articoli.
Un crawling più profondo ci dà la certezza che anche le pagine successive del blog vengano esplorate e conseguentemente indicizzate dal Googlebot.
Ma in alcuni casi analizzati sul Forum GT ho notato un aspetto interessante. Sembra che i blog ad un certo punto raggiungano un “punto di saturazione”. Le pagine indicizzate continuano ad aumentare fino ad un limite massimo, e da un dato momento in poi inizia a verificarsi proprio la cosiddetta deindicizzazione.
E’ come se – di fatto – ci fosse una quota massima di pagine indicizzabili. Ma questo non ci deve sorprendere: è una diretta conseguenza della profondità del crawling. Se il crawler non riesce a raggiungere più alcune pagine, cioè se non vengono immediatamente individuati dei link ai post più vecchi, i suddetti post semplicemente spariscono dall’indice.
Un’ottima soluzione può ovviamente essere quella di inviare una sitemap, ma a volte può non bastare. In questi casi suggerisco:
Sarei curioso di sapere la vostra opinione, lasciatemi un commento…
Alla prossima. ![]()
Se l'articolo ti sembra interessante puoi ritwittarlo o condividerlo su Facebook...
Ti potrebbe interessare anche:
Ti trovi in:
Puoi tenere traccia dei commenti successivi abbonandoti al feed dei commenti.
SEO
3 Commenti
Feed dei commenti
© Tutti i diritti riservati
Ciao Michele,
la cosa è veramente interessante, per fortuna non ho problemi di questo tipo però è importante sapere che il Page Rank di per se giochi ancora un ruolo abbastanza “di rilievo” nel posizionamento…
Magari nell’acquisto dei links non conta più tanto ma se conta fino a questo punto per Profondità di Crawling e Frequenza di Scansioni allora non è una cosa da sottovalutare… molto interessante
si, la cosa strana del pagerank è che proprio quando sembra dato per “spacciato”, gli ingegneri di google tornano a ribadirne l’importanza.
non ce ne libereremo così facilmente…
La struttura ipertestuale tipica dei blog, la cui home page elenca gli ultimi X post in ordine cronologico inverso, produce come effetto collaterale un calo progressivo di visibilità dei singoli post, direttamente proporzionale all’anzianità dei post stessi; la velocità di questo calo è proporzionale alla frequenza di posting (numero di post/mese). Il fenomeno è principalmente dovuto al fatto che, non ricevendo più link diretti dalla home page (che tipicamente è la pagina a più alto PageRank di un sito), i post più vecchi ricevono col tempo una quantità decrescente di PageRank (naturalmente assumendo che nel frattempo i back link esterni non aumentino).
Le pagine archivio (archivi mensili, categorie, tag), che sono generalmente accessibili da ogni pagina del blog, e che pertanto accumulano un’alta quantità di PageRank, attenuano il fenomeno ma non lo eliminano, poiché su un blog con un alto numero di post per categoria/mese/tag, anche i link ai post presenti sulle pagine archivio verranno suddivisi su più pagine, e pertanto solo una minoranza di post rimarranno a uno o due click (link) di distanza dalla home page. Si tratta, come detto, di un fenomeno fisiologico dei blog, riconducibile alla loro struttura e configurazione tipica. Inviare una sitemap XML può aiutare i crawler a trovare tutte le pagine di un blog e indicizzarle efficientemente, ma non risolve il problema della distribuzione di PageRank: una pagina indicizzata, ma che presenti un PageRank troppo basso, non apparirà nelle SERP normali (ossia quelle senza il comando “site:”).
Una soluzione semplice e generalmente efficace è quella di creare una mappa HTML del sito (a questo scopo esiste anche un ottimo plugin per WordPress) che includa link a tutti i post su un’unica pagina, e inserire un link verso questa sitemap HTML su ogni pagina del blog: in questo modo si riequilibrerà la distribuzione interna del PageRank in favore dei post più vecchi; fungendo da sommario, la mappa renderà inoltre più agevole agli utenti l’accesso ai contenuti del blog.