Canonical URL per i motori di ricerca

Google, Yahoo! e MSN si mettono d’accordo sulle URL Canoniche e stabiliscono un protocollo sugli URL canonici**.

Cosa è un URL Canonico?

Cerco di spiegarlo in modo che anche un profano possa seguirmi. Con questo protocollo il proprietario di un sito, o al suo webmaster, pootrà suggerire la url con le quali una o più pagine (magari duplicate) devono comparire all’interno dei risultati di una SERP.

Facciamo un esempio, un sito piuttosto grande con negozio on-line.

Guardate la pagina dei prodotti, che è solitamente quella più interessante sotto questo punto di vista, provate a fare delle navigazioni all’interno di quel sito e vi ritroverete ben presto una cronologia con degli url insensati che tappezzano la vostra finestra. Indirizzi insensati, a cui ben presto, si è pensato di porre rimedio tirando in ballo i cosidetti SEO Friendly url, cioè nomi pagina che avessero un senso logico per il visitatore e per il motore di ricerca. Questi url però sono per l’appunto “finti”, perchè ogni CMS avrà bisogno di parametri che - dietro le scene - nel momento della richiesta permetteranno di recuperare i risultati richiesti.

Cosa significa questo? Che se io accedo con la friendly URL, piuttosto che con quello astruso ma vero, in entrambe i casi, il sito web mi restituirà una pagina potenzialmente indicizzabile dal motore di ricerca. Succede lo stesso con gli ID di sessione, con i cookies e con qualsiasi altra cosa espressamente riportata nel querystring e utilizzata almeno una volta in un qualsiasi link sparso per la rete.

Ecco allora delinearsi il problema a tutti noto come contenuto duplicato, che alla lunga, può generare problemi di indicizzazione e ottimizzazione. E’ vero che i sempre più sofisticati algoritmi dei motori cercano di sopperire a questo genere di problemi in maniera empirica, tuttavia resta sempre il fatto: molteplici URL che puntano allo stesso risultato.

Cosa fare? Canonicalizzare gli URL.

La canonicalizzazione altro non è che una semplice indicazione - in questo caso nei confronti del motore - che l’aiuta a scegliere l’indirizzo di accesso ad una pagina (in questo caso si presuppone quello più logico e sensato). Ma chi è che opera questa scelta? Fino ad oggi era l’algoritmo del motore che si preoccupava di farlo. Da oggi, grazie a quanto anticipato sopra, saremo noi autori a poter suggerire quale è l’URL che noi riteniamo più interessante o quello che vogliamo utilizzare.

Il motore di ricerca, in presenza dell’attributo “rel” con valore “canonical” all’interno di un link, farà tutto il resto, compreso anche il trasferimento di PR, di link e chi più ne ha più ne metta.

Un interessante passo avanti quindi verso una migliore gestione del web. Per coloro i quali sono interessati ad approfondire, vi lascio i link dei rispettivi motori(Google, Yahoo! e MSN/Bing) dove spiegano il loro singolo approccio. Inoltre, ecco un altro interessante post di Rand.

Update del 13/03/2009: navigando per la rete ho trovato queste slides molto ben fatte, in inglese, e mi permetto di suggerirlo come approfondimento.

Update del 03/08/2009: questo me l’ero perso per strada. Anche Ask ha aderito alla canonicalization.