WordPressin URL-kanonisointi ja sen SEO-tekninen vaikutus
URL-kanonisointi on yksi niistä WordPressin ominaisuuksista, jotka toimivat yleensä “ihan hyvin” – kunnes ne eivät toimi lainkaan. Useimmat sivustot kärsivät jonkinasteisesta URL-duplikaatiosta, ja usein syy löytyy juuri kanonisoinnin puutteellisesta ymmärtämisestä tai väärästä konfiguraatiosta.
Hakukoneelle jokainen eri URL on eri resurssi. WordPressille ne ovat usein sama sisältö. Tämä ristiriita on kanonisoinnin ydinongelma.
Mitä URL-kanonisointi tarkoittaa käytännössä
URL-kanonisointi tarkoittaa:
-
yhden ensisijaisen URL-version määrittelyä
-
muiden versioiden ohjaamista tai merkitsemistä ei-ensisijaisiksi
-
hakukoneiden ohjaamista oikeaan indeksointivalintaan
Ilman kanonisointia sama sisältö voi löytyä useista osoitteista:
-
http ja https
-
www ja ilman www:tä
-
pääteviiva ja ilman
-
parametreilla ja ilman
-
arkistot, tagit ja yksittäiset sivut
Hakukone ei tiedä, mikä näistä on “oikea”, ellei sitä kerrota.
WordPressin sisäänrakennettu kanonisointi
redirect_canonical ja sen rooli
WordPress sisältää mekanismin, joka:
-
tunnistaa epätyypilliset URLit
-
ohjaa ne oletettuun muotoon
-
pyrkii vähentämään duplikaatteja
Tämä toimii hyvin perusympäristössä, mutta ei ymmärrä:
-
reverse proxy -ratkaisuja
-
headless-arkkitehtuuria
-
monimutkaisia rewrite-sääntöjä
-
custom query -parametreja
Siksi se ei ole “aseta ja unohda” -ratkaisu.
Canonical-linkki ja sen merkitys
HTML-tason kanonisointi
rel="canonical" -linkki kertoo hakukoneelle:
-
mikä URL on ensisijainen
-
mihin indeksointi kohdistuu
-
mihin linkkivoima tulisi keskittää
WordPress generoi canonical-linkin automaattisesti, mutta:
-
lisäosat voivat muokata sitä
-
custom queryt voivat rikkoa sen
-
väärä konteksti tuottaa vääriä arvoja
Canonical-linkki ei ole ohjaus. Se on vihje. Hakukone voi myös sivuuttaa sen.
Parametrit ja URL-räjähdys
Yleinen mutta aliarvioitu ongelma
WordPress-sivustoilla syntyy helposti URLeja kuten:
-
?utm_source
-
?orderby
-
?filter
-
?replytocom
Jos näitä:
-
ei ohjata
-
ei kanonisoida
-
ei rajata indeksoinnista
hakukone voi indeksoida tuhansia URLeja, joilla on sama sisältö. Tämä syö crawl budgetia ja hajottaa näkyvyyttä.
Arkistot, tagit ja kategoriat
Hyödyllisiä vai duplikaattitehtaita
Kategoriat ja tagit:
-
luovat automaattisesti uusia URLeja
-
usein sisältävät samaa sisältöä eri järjestyksessä
Ilman selkeää strategiaa:
-
yksittäinen artikkeli kilpailee itseään vastaan
-
arkistot nousevat sivujen edelle
-
hakukone hämmentyy sivuston rakenteesta
Tässä kanonisointi ja noindex-strategia kulkevat käsi kädessä.
Pääteviiva ja URL-rakenne
Pieni yksityiskohta, iso vaikutus
Esimerkiksi:
-
/artikkeli
-
/artikkeli/
Hakukoneelle nämä ovat eri URLit. WordPress yleensä valitsee toisen, mutta:
-
väärät uudelleenohjaukset
-
lisäosat
-
teemat
voivat rikkoa tämän oletuksen. Epäjohdonmukaisuus näkyy suoraan indeksoinnissa.
Multisite ja kanonisointi
Yksi verkko, monta totuutta
Multisite-ympäristössä:
-
domain mapping
-
ali-hakemistot
-
ali-domainit
lisäävät kanonisoinnin monimutkaisuutta merkittävästi. Yksi väärä canonical:
-
ohjaa linkkivoiman väärälle sivustolle
-
sekoittaa hakukoneen käsityksen verkon rakenteesta
Multisitessä kanonisointi on aina tarkistettava sivustokohtaisesti.
HTTPS ja luottamus
Kanonisoinnin perusta
Jos sivusto:
-
vastaa sekä http- että https-osoitteisiin
-
ilman selkeää ohjausta
hakukone näkee kaksi eri versiota. HTTPS-kanonisointi on:
-
tekninen perusvaatimus
-
SEO-luottamussignaali
-
edellytys modernille indeksoinnille
Tämä ei ole enää valinnainen optimointi.
Canonical vs. 301-uudelleenohjaus
Ne eivät ole sama asia
301-uudelleenohjaus:
-
pakottaa selaimen ja hakukoneen
-
siirtää linkkivoiman vahvemmin
Canonical:
-
on vihje
-
ei estä indeksointia yksinään
WordPressissä:
-
rakenteelliset virheet korjataan ohjauksilla
-
sisällölliset duplikaatit kanonisoinnilla
Näiden sekoittaminen johtaa epäjohdonmukaiseen signaaliin.
Yleisimmät kanonisointivirheet WordPressissä
Tyypillisiä ongelmia ovat:
-
väärä canonical paginoiduilla sivuilla
-
canonical etusivulle kaikilla sivuilla
-
puuttuva canonical custom post typeissä
-
canonical, joka osoittaa 404-sivuun
-
lisäosien keskinäiset ristiriidat
Nämä eivät ole kosmeettisia virheitä. Ne vaikuttavat suoraan näkyvyyteen.
Milloin URL-kanonisointi on kunnossa
Hyvin kanonisoidussa WordPressissä:
-
jokaisella sisällöllä on yksi selkeä URL
-
muut versiot ohjautuvat tai kanonisoidaan
-
hakukone indeksoi vain halutut sivut
-
crawl budget käytetään tehokkaasti
Usein paras testi on yksinkertainen: montako eri URLia palauttaa saman sisällön ilman ohjausta.
Lopuksi: Kanonisointi on hakukoneelle annettu kartta
Hakukone ei ymmärrä sivuston logiikkaa, ellei sitä kerrota. WordPress yrittää auttaa, mutta ei tunne projektisi sääntöjä.
URL-kanonisointi on:
-
tekninen SEO-perusta
-
sivuston rakenteen selkeyttäjä
-
pitkäaikainen sijoitus näkyvyyteen
Kun se tehdään oikein, siitä ei puhuta. Kun se tehdään väärin, koko SEO-strategia horjuu.
