26
SET

2° Lezione sui contenuti duplicati: come difendersi dal furto di contenuti

Scritto da Fortunecat in SEO

Nella lezione precedente abbiamo parlato di come sono considerati i duplicati da Google. I contenuti duplicati non sono fonte di penalizzazione perchè fra le tante versioni dello stesso contenuto Google sceglie di mostrarne una sola, quella che ritiene più rilevante per l’utente.

D’accordo. Ma cosa accade quando i nostri testi vengono copiati da terzi? C’è il rischio che nella SERP i nostri siti non appaiano affatto, rimpiazzati dalle pagine di qualche webmaster poco onesto.

Questo post si articolerà quindi in tre punti:

  1. Tecniche per individuare i contenuti duplicati;
  2. Difendersi dal furto di contenuti;
  3. Far valere i nostri diritti d’autore.

Come individuare i duplicati

I servizi che possiamo utilizzare sono sostanzialmente due:

  • Copyscape: a partire dall’url di una pagina web è in grado di individuare tutte le pagine che presentano i medesimi contenuti. Il difetto di Copyscape è che la ricerca va effettuata a mano periodicamente (a meno di utilizzare ovviamente i loro servizi a pagamento).
  • FairShare: inserendo l’url del feed del nostro blog, ricerca automaticamente i duplicati. Genera come risposta un feed contenente notifiche di eventuali furti.

Come difendersi dai furti

Una volta individuati “i colpevoli” abbiamo di fronte a noi più alternative:

RSS Footer

Mediante il plugin di WordPress RSS Footer possiamo inserire nei post del feed un link di ritorno al post originale. Questo plugin trasforma quindi lo scraping in un ottimo modo per guadagnare backlink.

Come confermato da Matt Cutts questa strategia è molto efficace poichè quando Google si trova a dover scegliere quale contenuto mostrare nella SERP anche il pagerank gioca un ruolo importante.

Un consiglio personale: RSS Footer inserisce di default un link di ritorno alla fine del post, ma è possibile posizionarlo anche all’inizio. Meglio quest’ultima opzione perché il link in cima al testo è più visibile.

Con RSS Footer inoltre è possibile inserire nel feed anche del testo personalizzato: date un’occhiata al mio. Oltre al link di ritorno ho inserito anche la frase “Fortunecat.it SEO blog” dove la parola SEO è linkata alla home del mio sito. Questo mi aiuta a posizionarmi per la parola chiave SEO.

Inoltre modificando periodicamente i link inseriti nel feed è possibile acquisire backlink con anchor text diversi (e quindi più naturali agli occhi dei motori di ricerca).

Bloccare l’IP dello Scraper

Ultimamente i badbot più evoluti sono divenuti in grado di copiare contenuti eliminando i link di ritorno presenti. In questi casi anche la protezione di RSS Footer risulta vana. A mali estremi estremi rimedi quindi.

  • Innanzitutto individuiamo lo scraper con Copyscape o Fairshare.
  • Con un qualunque servizio di risoluzione DNS individuiamo il suo indirizzo IP (es.: Visual Route).
  • Con .htaccess reindirizziamo l’IP incriminato verso il suo stesso feed.

RewriteEngine On
RewriteCond %{REMOTE_ADDR} ^xxx\.xxx\.xxx\.xxx$ [OR]
RewriteRule ^(.*)$ http://dominioscraper.tld/feed

Dove ovviamente le parti in rosso corrispondono all’indirizzo IP da bloccare e in blu riportiamo l’indirizzo del feed del sito scraper. Così facendo lo scraper finirà per ripubblicare automaticamente copie dei propri contenuti.

Oppure nel caso di più indirizzi IP da bloccare:

RewriteEngine On
RewriteCond %{REMOTE_ADDR} ^xxx\.xxx\.xxx\.xxx$ [OR]
RewriteCond %{REMOTE_ADDR} ^yyy\.yyy\.yyy\.yyy$ [OR]
RewriteCond %{REMOTE_ADDR} ^zzz\.zzz\.zzz\.zzz$ [OR]
RewriteRule ^(.*)$ http://dominioscraper.tld/feed

Nota: non conviene mai utilizzare questo reindirizzamento se l’IP corrisponde a quello di un hosting gratuito (es.: altervista, blogspot, ecc.) nè in caso di IP appartenente ad un proxy. Così facendo infatti potremmo bloccare anche utenti “innocenti”.

Far valere i diritti d’autore

E se tutto ciò non dovesse bastare? In questi casi è opportuno procedere per vie “legali” facendo valere i nostri diritti d’autore. Ma occorre prima di tutto fare una premessa:

  1. Scegliete attentamente la licenza con cui rilasciate le vostre creazioni e inseritela nella homepage bene in vista. Anche se scegliete una licenza CC come ho fatto io non dimenticatevi di specificare le modalità di attribuzione della paternità dell’opera. Potete ad esempio leggere che per citare articoli del mio blog occorre indicare l’autore e inserire un link follow di ritorno.
  2. La semplice licenza può non bastare, spesso dobbiamo provare la paternità dell’opera. Per questo è bene usare servizi di marca temporale, eccone due gratuiti:
  • MyFreeCopyright: dato un feed rss applica una marca temporale ad ogni nuovo post in modo automatico, è ottimo per chi possiede un blog.
  • RegisteredCommons: ottimo per apporre una marca a singoli documenti.

Se qualcuno dovesse copiare i nostri testi ecco quindi il modo di procedere:

  1. Inviate una mail al webmaster chiedendogli cortesemente di rimuovere i contenuti copiati.
  2. Se il webmaster non vi risponde non perdete tempo cercando di contattarlo di nuovo, rivolgetevi direttamente al suo provider. Tutti i provider impongono nei propri termini di servizio il rispetto delle norme sul diritto d’autore. La pena per eventuali violazioni è solitamente l’oscuramento del sito. Effettuando un semplice whois individuate il provider e inviate una mail al servizio abuse (l’indirizzo è del tipo: abuse@provider.tld, ad esempio per aruba è abuse@aruba.it).
  3. Se il provider vi ignora (cosa molto difficile a dire il vero) è possibile anche fare una segnalazione di violazione del copyright a Google, seguendo le procedure indicate qui. Google provvederà a rimuovere dai risultati di ricerca le pagine che violano le norme. (Quando si fa una segnalazione di questo tipo il richiedente deve poter provare di essere l’autore, da qui la necessità dei servizi MyFreeCopyright e RegisteredCommons descritti in precedenza).

Spero che questo post vi faccia dormire sonni tranquilli. Alla prossima. :)

Se l'articolo ti sembra interessante puoi ritwittarlo o condividerlo su Facebook...

Ti potrebbe interessare anche:

  1. 1° Lezione sui contenuti duplicati: come sono considerati da Google
  2. Google e l’individuazione dei duplicati
  3. Bloccare i duplicati con robots.txt?
  4. La dimensione di un sito ne influenza l’autorità?
  5. Il fenomeno della deindicizzazione nei blog

Ti trovi in:

Blog » SEO » 2° Lezione sui contenuti duplicati: come difendersi dal furto di contenuti

Lascia un commento

Puoi tenere traccia dei commenti successivi abbonandoti al feed dei commenti.