Artikel

Duplicate content — Årsager, konsekvenser og løsninger

Duplicate content er indhold der forekommer på to eller flere URLs — internt eller eksternt. Det skaber indekseringsforvirring, fortynder link equity og kan føre til at Google vælger den forkerte URL som kanonisk.

Duplicate content er indhold der forekommer på to eller flere URLs — identisk eller i meget lig form. Det opstår sjældent bevidst: URL-parametre fra filtreringsfunktioner, CMS-genererede alternativer og protokolvarianter skaber automatisk duplicate content på de fleste websites. Konsekvensen er indekseringsforvirring hos Google, fortyndet link equity fordelt på multiple URLs og risikoen for at den forkerte URL rangerer. Duplicate content er et af de hyppigste tekniske SEO-problemer og løses primært med canonical tags og redirects.

Hvad er duplicate content?

Duplicate content inddeles i to kategorier:

Internt duplicate content — Samme eller næsten samme indhold tilgængeligt på multiple URLs inden for dit eget domæne. Det er langt det hyppigste og oftest ubevidst problem.

Eksternt duplicate content — Dit indhold kopieret og publiceret på andre domæner, eller du publicerer indhold fra andre kilder. Syndikering af artikler er et klassisk eksempel.

Google håndterer internt duplicate content ved at vælge én URL som “kanonisk” — den version Google indekserer og ranker. Problemet opstår, når Google vælger en anden URL end den du foretrækker, eller når link equity spredes tyndt ud over mange URL-varianter.


Hyppige årsager til duplicate content

URL-parametre

Webshops og CMS-løsninger er primærkilden til internt duplicate content. Filtreringsfunktioner genererer parametriserede URLs:

eksempel.dk/jakker/
eksempel.dk/jakker/?farve=sort
eksempel.dk/jakker/?farve=sort&sort=pris-lav
eksempel.dk/jakker/?sort=pris-lav&farve=sort

Alle disse er teknisk set separate URLs med (næsten) identisk indhold.

www og non-www / HTTP og HTTPS

Hvis www.eksempel.dk og eksempel.dk begge er tilgængelige, har du duplicate content på hele sitet. Samme gælder http:// og https://-varianter. Løsningen er 301 redirect og canonical tags.

Faceted navigation

Kategorisider med mange filtreringsmuligheder er den klassiske duplicate content-kilde i e-commerce. En kategori med 10 farver × 5 størrelser kan generere 50+ parametriserede URL-varianter.

Pagineringssider og session-IDs

Paginerede sider og session-ID-parametre i URLs skaber yderligere duplicate-varianter.


Konsekvenser for SEO

Duplicate content straffer ikke direkte — men skader indirekte:

Link equity fortyndes — Backlinks fordeles mellem multiple URL-versioner. Tre separate URL-varianter med 10 backlinks hver er svagere end én URL med 30 backlinks.

Crawl budget spildes — Googlebot bruger crawlressourcer på at indeksere duplicate-URLs frem for nyt og vigtigt indhold.

Indeksering af forkert URL — Google vælger muligvis en parametriseret URL som kanonisk, og det er den der vises i søgeresultater.


Løsning med canonical tags og redirects

For URL-parametre og filtrering — Sæt canonical tag på alle parametriserede URLs der peger på den primære kategoriside:

<!-- På: eksempel.dk/jakker/?farve=sort -->
<link rel="canonical" href="https://eksempel.dk/jakker/">

For HTTP/HTTPS og www/non-www — Brug 301 redirect fra den ikke-foretrukne variant til den foretrukne. Canonical tag alene er ikke tilstrækkeligt her.

For near-duplicate content (produktvarianter, lokale sider) — Vurder om siderne kan differentiere sig substantielt nok til at fortjene selvstændig indeksering, eller om canonical tag til en primær side er den rigtige løsning.

→ Denne artikel er en del af On-page SEO — Optimering af sidens egne elementer.

Andre artikler i samme emne

Ofte stillede spørgsmål

Hvad er duplicate content?
Duplicate content er tekst- eller sideindhold der er identisk eller meget lignende på to eller flere URLs. Det kan forekomme internt (inden for samme domæne) eller eksternt (på tværs af domæner). Internt duplicate content opstår oftest automatisk via CMS-funktioner, URL-parametre og protokolvarianter — ikke bevidst kopiering. Eksternt duplicate content opstår typisk ved syndikering eller indholdstyveri.
Hvilke årsager er de hyppigste til internt duplicate content?
De hyppigste årsager er: URL-parametre fra filtrering og sortering i webshops (eksempel.dk/sko?farve=sort&str=42), www og non-www varianter tilgængelige på samme site (www.eksempel.dk og eksempel.dk), HTTP og HTTPS begge tilgængelige, trailing slash og non-trailing slash URLs (/side/ og /side), printversioner af sider (/print/artikel/), og pagineringssider der indeholder meget af det samme indhold som foregående sider.
Er duplicate content en straf fra Google?
Nej — Google straffer ikke sites for internt duplicate content i de fleste tilfælde. Problemet er ikke straf men forvirring: når det samme indhold er tilgængeligt på multiple URLs, er Google usikker på hvilken URL der skal indekseres og rankes. Det fører typisk til at Google vælger én URL som kanonisk — men ikke nødvendigvis den URL du ønsker. Eksternt duplicate content der er skabt bevidst til manipulation (doorway pages, scraped content) kan dog udløse manuelle handlinger.
Hvad er konsekvenserne af duplicate content for SEO?
Konsekvenserne er primært: 1) Fortyndet link equity — backlinks fordeles mellem multiple versioner af det samme indhold frem for at samles på én URL. 2) Indekseringsforvirring — Google bruger crawl budget på multiple versioner af den samme side. 3) Forkert URL kan ranke — Google vælger muligvis en parametriseret eller forældet URL frem for din foretrukne version. 4) Svækket topical authority — tynd, duplikeret indholdsstruktur signalerer lavere indholdskvalitet.
Hvordan løser man duplicate content med canonical tags?
Canonical tags implementeres med <link rel='canonical' href='URL-du-vil-ranke'> i sidens <head>. På alle duplikatsider (URL-parametre, print-versioner etc.) sættes en canonical der peger på den foretrukne, kanoniske URL. Det fortæller Google: 'Denne side er en variant — indeksér og rank den kanoniske URL i stedet.' Self-referencing canonical (canonical der peger på sin egen URL) implementeres på den kanoniske side som bekræftelse.
Hvad er near-duplicate content og er det et problem?
Near-duplicate content er sider der er meget lignende men ikke identiske — f.eks. produktsider der kun adskiller sig på størrelse eller farve, eller lokale landingpages til forskellige byer med minimal tekstuel forskel. Google håndterer near-duplicates ligesom duplicates — det vælger en foretrukken version. Near-duplicates løses enten med canonical tags, ved at differentiere indholdet substantielt eller ved at konsolidere sider der ikke har selvstændigt SEO-potentiale.
Hvornår er 301 redirect bedre end canonical tag til duplicate content?
Brug 301 redirect når den duplikerede URL ikke behøver at forblive tilgængelig for brugere — f.eks. den HTTP-version af sitet nu sitet er 100% HTTPS, eller non-www versionen. 301 redirect overfører link equity mere effektivt end canonical tag og er klarere for Google. Brug canonical tag når URL'en skal forblive tilgængelig — f.eks. filtrerings-URLs i en webshop som brugere bogmærker og deler.

Placering i ordbogen