Wat is een Canonical URL?
Een veel voorkomend probleem voor zowel webmasters als zoekmachines is dat de pagina's op een website vaak via meerdere URL's bereikt kunnen worden. Het gevolg is dat een zoekmachine de pagina meerdere keren indexeert en dat de webpagina onder verschillende webadressen in de zoekmachine te vinden is.
Een voorbeeld: een webwinkel verkoopt computergames. Een productpagina voor een bepaalde game heeft het volgende webadres: http://www.voorbeeld.nl/game-naam/. Als een bezoeker de games in een bepaalde rubriek bekijkt dan kan hij de productpagina ook bereiken. De URL is dan echter iets anders: http://www.voorbeeld.nl/game-naam?categorie=adventure.
Het gevolg is dat er twee URL's zijn die dezelfde content bevatten. Een zoekmachine kan echter moeilijk bepalen welke versie geïndexeerd dient te worden. Hierdoor kan dezelfde content meerdere keren geïndexeerd worden. Dit wordt duplicate content genoemd. Duplicate content kan onder meer ontstaan bij printversies van een pagina, het gebruik van sessions en wanneer de pagina zowel met als zonder www bereikbaar is.
Duplicate content is ongewenst. Er ontstaat onduidelijkheid over het officiële webadres van een pagina en zoekmachines kunnen niet bepalen welke URL weergegeven moet worden in de resultaten voor een zoekterm.
Een ander nadeel is dat andere webmasters wellicht naar de ongewenste URL gaan linken op hun websites waardoor de pagina met het juiste webadres minder goed scoort in de zoekresultaten dan eigenlijk mogelijk is.
De Canonical URL link tag
Om het probleem van duplicate content aan te pakken hebben Google, Microsoft en Yahoo een speciale tag geïmplenteerd waarmee webmasters het officiële webadres van een pagina kunnen aangeven: een link tag voor de canonical URL. Deze tag kun je opnemen in het <head>-gedeelte van de pagina. De tag ziet er zo uit:
<link rel="canonical" href="http://www.voorbeeld.nl/game-naam/" />
Als je deze tag opneemt tussen de <head> en </head> tags dan zal alleen de canonical URL opgenomen worden in de zoekresultaten. Andere URL's die dezelfde content tonen, worden niet meer geïndexeerd. Ook links die wijzen naar de pagina met een ander adres (zoals in ons voorbeeld: http://www.voorbeeld.nl/game-naam?categorie=adventure) zullen door de zoekmachine beschouwd worden als een link naar de canonical URL. Dit betekent dat de pagerank die deze links doorgeven ook naar de canonical URL zal gaan. Dat kan een gunstige invloed hebben op de ranking van de pagina in de zoekresultaten.
Wanneer gebruik maken van een Canonical URL?
Duplicate content is met name een probleem voor websites die gebruik maken van een Content Management System (CMS), weblog of een e-commerce script. Voor deze sites kan het nuttig zijn om de canonical URL link tag op te nemen in de pagina's. Voor diverse CMS en weblog software zijn hier al plugins en extensies voor verschenen. Zie bijvoorbeeld Yoast.com voor Wordpress, Magento en Drupal plugins.
Voor meer info en enkele vaak gestelde vragen over canonical URL's kun je terecht op de Google Webmaster Central blog.
MijnHomepage Tip
Heb je genoeg van je hostingprovider?
Neem dan een host die wel de kwaliteit kan bieden die je zoekt. Breng je site bijvoorbeeld onder bij Alphamega Hosting. Hun klanten zijn over het algemeen erg tevreden waardoor er maar weinig mensen overstappen naar een andere webhost. En dat is altijd een goede graadmeter voor de kwaliteit van een host. Alphamega biedt zelfs een niet-tevreden-geld-terug-garantie van 100 dagen.
Het First-class hostingpakket is voor veel mensen het meest geschikte pakket. Je krijgt het volgende:
100 MB» nu 512 MB schijfruimte2 GB» nu 10 GB dataverkeer- een eigen domeinnaam
- 1000 (pop)mailboxen
- 100 MySQL databases
- hoge kwaliteit techniek en prima support (helpdesk ook telefonisch bereikbaar)
Al met al is dit een prima pakket voor nog geen tientje per maand. Bekijk de site van Alphamega Hosting voor meer informatie!

