IM Evolution Blog

Il nostro Blog


Chiarimenti di Google sul contenuto duplicato.

Contenuto duplicato. Questa definizione racchiude solamente una piccola parte della questione in oggetto. Si comincia a scrivere di questo argomento, e le persone cominciano a chiedere chiarimenti in proposito. In particolare, capita ancora di ascoltare molti webmaster che si domandano come possano incappare in questa “penalizzazione del contenuto duplicato“.

Cerchiamo di chiarire questo concetto una volta per tutte: non esiste qualcosa che sia identificabile come una “penalità del contenuto duplicato”. Quantomeno, non esiste con il significato che molte persone le danno quando ne parlano.

Continua a leggere »


Cosa sono i Risultati Supplementari di Google

Google si sà, è una delle fonti più importanti per ottenere visitatori e per portare traffico al proprio sito. Chiunque abbia un sito internet o un e-commerce, controllando le pagine indicizzate su Google tramite il comando site:www.nomedelsito.it si sarà accorto che alcune di esse, vengono inserite nelle ricerce supplementari di Google.

In base a cosa Google inserisce le pagine nei Risultati Supplementari?

Innanzitutto bisogna dire che le pagine inserite nelle ricerche supplementari, non hanno subìto alcuna sorta di penalizzazione, sono state semplicemente escluse dall’ indice primario, anche se, in alcuni casi, si è potuto stabilire che utilizzando query poco competitive, vengono incluse nei risultati di ricerca.

Le pagine, vengono inserite nei risultati supplementari per svariati motivi, possono essere viste come raccoglitore di contenuti duplicati, ritenute meno importanti, con un basso PageRank o magari non sono raggiungibili perchè escluse tramite “nofollow” dal file robots.txt.
Nonostante non si tratti quindi di penalizzazione, bisogna dire che le pagine inserite nei risultati supplementari servono a poco, in quanto non verranno inserite nell’indice principale.
Per scoprire le pagine di un sito inserite da Google nei Risultati Supplementari, basta utilizzare questa query:

site:www.yoursite.com *** -sjpked

Per capire invece quale è la percentuale di pagine del sito che Google inserisce nei risultati supplementari, esiste una semplice formula:

site:www.yoursite.com *** -sjpked / site:www.yoursite.com

E’ importante monitorare queste pagine, per capire lo “stato di salute” del nostro sito, in questo modo riusciremmo a capire se una delle pagine che noi consideriamo importanti è finita nei risultati supplementari ed agire di conseguenza, ad esempio linkandola da più pagine o magari arricchendone i contenuti.

Matt Cutts per ovviare al problema, suggerisce di “aumentare la popolarità del sito con link di buona qualità”, in altre parole ci suggerisce di aumentare il Page Rank del sito per ovviare al problema, ed inoltre questa affermazione ci fà capire che migliorare la Link Popularity del sito è una delle tecniche più efficaci per ottenere traffico dai motori di ricerca, ma soprattutto da Google.


Google e il contenuto duplicato

Pubblico di seguito, i punti salienti di un importante documento apparso recentemente sul blog ufficiale di Google, e ripreso e tradotto da Marco Ziero, riguardo ai contenuti duplicati e ai feed rss.

  • Prima di tutto, la Definizione di Contenuto Duplicato.

“Il contenuto duplicato si riferisce generalmente a blocchi sostanziali di contenuto all’interno dello stesso dominio o tra diversi domini che combaciano esattamente con altri contenuti o sono molto simili tra loro.
La maggior parte delle volte è del tutto non intenzionale o per lo meno non fatto con malizia: forum che generano pagine normali o pagine dinamiche prese da altri siti, negozi che mostrano (e, peggio ancora, linkano) diversi URL, e così via.
In qualche caso i contenuti duplicati sono creati nell’intento di manipolare il posizionamento sui motori di ricerca o guadagnare più traffico per chiavi più o meno popolari”.

  • Passiamo ora alla Definizione di Cosa non è, un contenuto duplicato.

Gli algoritmi di Google “non vedono come contenuto duplicato lo stesso articolo scritto in Inglese e Spagnolo. Similarmente, non dovreste preoccuparvi che snippets occasionali (virgolette e altro) vengano evidenziati come contenuto duplicato”.

Allora, perché è importante la questione dei contenuti duplicati?
Perché ogni volta che un utente esegue una ricerca vuole vedere e trovare diverse sezioni e diverse informazioni su uno stesso contenuto, e non, al contrario, trovare le stesse informazioni per lo stesso contenuto.

Per questo motivo Google, tende a indicizzare e mostrare sempre pagine con diversi contenuti.
Quindi, se un sito contiene un articolo “regolare” e lo stesso nella versione “da stampare”, e non c’è nessun limite nel robots.txt o attraverso il meta tag noindex, Google sceglierà di mostrare solo una delle due versioni.

E se si dovesse percepire che il contenuto duplicato, vuol essere mostrato per manipolare il ranking e di conseguenza, deviare i navigatori, verranno presi i relativi accorgimenti per quanto riguarda l’indicizzazione e il posizionamento dell’intero sito in questione.
Inoltre, potrà spesso accadere, che nei risultati delle ricerche, sia visualizzata la versione dell’articolo (tra le due) “meno desiderata” dai webmaster.

  • Ecco allora 10 buone regole da seguire per i contenuti duplicati:
  1. Aiutare gli algoritmi a determinare quale sia la versione del documento che si vuole far indicizzare, per esempio, disabilitando le versioni stampabili o usando espressioni regolari nel file robots.txt.
  2. Usare intelligentemente il redirect 301 (redirect permanente).
  3. Essere consistenti nel linking interno del sito. Non linkando per esempio, una volta a /pagina/, poi a /pagina e poi a /pagina/index.htm.
  4. Usare possibilmente domini geografici, directory appropriate o sottodomini per indicare la versione più appropriata di un documento.
  5. Condividere con attenzione i contenuti di un sito con altri siti, assicurandosi che gli altri contengano un link verso il contenuto originale.
  6. Usare l’opzione “dominio preferito” nel pannello per i webmaster: scegliendo di far indicizzare la versione con www o senza, quando altri siti linkano il vostro sito.
  7. Minimizzare le ripetizioni anche parziali nel sito.
  8. Evitare la pubblicazione di bozze e pagine vuote.
  9. Conoscere bene le debolezze del vostro CMS.
  10. Non preoccuparsi troppo dei siti che prendono i contenuti dal vostro sito, è molto improbabile che possano influenzare negativamente la sua presenza su Google.

Per il documento originale, potete leggere il post sul blog ufficiale di Google.