Het belang van de trailing slash/
Iedereen die graag zoekmachinevriendelijke URLs maakt met behulp van mod_rewrite (zoals gedaan in diverse content management systems), doet er goed aan een eenduidig beleid te formuleren met betrekking tot de zogenaamde ‘trailings slash’.
Dit kleine karakter heeft wat betreft de zoekmachine-vriendelijkheid van een website namelijk grote implicaties. Een URL die eindigt op een slash (/) wordt namelijk – zoals het hoort – door de zoekmachines als een directory gezien. Een URL die eindigt op een ander karakter wordt gezien als een downloadbaar (en vervolgens al dan niet interpretabel) bestand. Dit onderscheid is niet meer dan logisch, omdat het heel goed mogelijk is om op een server zowel het bestand /test als de directory /test/ te hebben staan.
Duplicate content en PR-splitsing
Een zoekmachine wordt dus eigenlijk min of meer gedwongen de links http://www.uwdomein.n/artikel en http://www.uwdomein.n/artikel/ als twee aparte pagina’s te interpreteren. De grote problemen die hierbij ontstaan, zijn duplicate content en PR-splitsing.
Omdat links naar http://www.uwdomein.nl/artikel en http://www.uwdomein.nl/artikel/ als links naar aparte pagina’s worden beschouwd, vergaren beide pagina’s slechts een deel van de totaal aan de inhoud toegekende “linkjuice”. Ofterwijl; in plaats van één pagina http://www.uwdomein.nl/artikel/ met een PR-waarde van 4, eindigen we ongevraagd met de twee identieke pagina’s http://www.uwdomein.nl/artikel/ en http://www.uwdomein.nl/artikel met respectievelijk een PR van 3 en 1. PR is niet alles, maar de door de links onbedoeld uitgesmeerde keyword-kracht is dit wel!
Het wordt echter nog erger. Omdat de pagina’s http://www.uwdomein.n/artikel en http://www.uwdomein.n/artikel/ qua inhoud exact identiek aan elkaar zijn, wordt één van de pagina’s door de zoekmachines aangemerkt als ‘duplicate’, ofwel kopie. In de praktijk wordt de URL die als laatste ontdekt wordt meestal als kopie aangemerkt. Omdat een exacte kopie niets toevoegt aan de zoekmachine, wordt deze URL uit de hoofdindex verwijderd (de PR wordt 0) en nooit meer terug gezien in de SERPS. Alle inkomende links naar deze pagina zijn hiermee op slag waardeloos geworden. We zijn dus een deel van de inkomende linkkracht kwijt!
Een voorbeeld
Als concreet voorbeeld van een pagina waar het mis gaat, nemen we de sectie opleidingen van netters.nl, één van Nederland’s meest gerespecteerde blogs voor internet professionals.
Kijken we op de pagina http://netters.nl/opleidingen, dan zien we op onze google toolbar keurig een nette pagerank van 4. Gaan we echter naar http://netters.nl/opleidingen/, dan zien we dat deze pagina, omdat hij exact identiek is en misschien (nog) niet door google gevonden is, geen PR heeft. Het is echter wél een aparte pagina! Eventuele links die zijn aangelegd naar de pagina mét trailing slash dragen dus helemaal niets bij aan de linkpopulariteit van de opleidingen-pagina van netters.nl! Hetzelfde zien we terug op allerhande andere pagina’s van netters.nl, waaronder de pagina ter promotie van Erik-Jan’s handboek SEO (hier de versie zónder PR).

PR splitting in actie; een link naar de pagina ‘/opleidingen/’ levert niets op.
De oplossing
De oplossing is in concept heel simpel: maak een 301 redirect van de ongewenste ‘kopie’ naar het origineel. Belangrijk is wel om vroeg in het bestaan van de website te definiëren wat de kopie is en wat het origineel. Over het algemeen verdient het aanbeveling achter iedere URL die niet op een bestandsextensie of een slash eindigt een slash te plaatsen. In andere woorden: maak van de URL die eindigt met de slash (http://www.voorbeeld.nl/artikel/) het origineel en behandel de versie zonder slash (http://www.voorbeeld.nl/artikel) als ongewenste kopie. Indien uw apache-webserver mod_rewrite ondersteunt, kunt u met de volgende simpele .htaccess-regels ervoor zorgen dat de versie zonder slash automatisch via een 301 doorgestuurd wordt naar de versie mét slash:
RewriteCond %{REQUEST_URI} !(/$|\.)
RewriteRule (.+) http://www.uwdomein.nl/$1/ [R=301,L]
Dankzij bovenstaande regels worden browsers – en daarmee ook zoekmachines – die naar http://www.uwdomein.nl/artikel browsen automatisch naar http://www.uwdomein.nl/artikel/ doorgestuurd. Omdat de statuscode 301 wordt gebruikt, zal de zoekmachine de pagina http://www.uwdomein.nl/artikel niet indexeren en alle linkkracht van de pagina http://www.uwdomein.nl/artikel zoals het hoort doorsturen naar http://www.uwdomein.nl/artikel/. De reden waarom we kiezen voor het toevoegen van de slash in plaats van het afstrippen van ongewenste slashes, is dat dit laatste problemen geeft bij het volgen van een URL naar een directory (http://www.mijndomein.nl/directory/ wordt dan doorgestuurd naar de niet-bestaande pagina http://www.mijndomein.nl/directory).
Heb jij nog tips of goede voorbeelden van sites waar het mis gaat?



