DUPLICATE CONTENT

Duplicate content är precis vad det låter, innehåll på din webbplats som är duplicerat så att det existerar flera versioner av samma innehåll på flera URL:er. Det är troligtvis inget någon webbredaktör som lägger upp duplicerat innehåll medveten men beroende på vad du använder för CMS (Content Management System) så kan du ha massor med duplicerat innehåll utan att veta om det.

Varför är duplicerat innehåll ett problem?

Det finns tre huvudsakliga problem med duplicerat innehåll för en sökmotor:

  1. De vet inte vilken version de ska inkludera i sitt index och vilka de ska excludera.
  2. De vet inte hur de ska dirigera länkkraften: behålla allt på en sida eller separera den över flera versioner.
  3. De vet inte vilken/vilka versioner de ska visa på sökresultatsidan.

“I de sällsynta fall som Google hittar duplicerat innehåll som eventuellt visas med avsikt att manipulera rankningarna och lura våra användare, utför vi även lämpliga justeringar i indexeringen och rankningen av berörda webbplatser. Detta kan leda till att webbplatsens rankning påverkas negativt, eller att webbplatsen helt och hållet tas bort från Google-indexet så att den inte längre visas i sökresultaten.”
Google Search Console

Vad betyder det här för dig?

Sökmotorer ser på webben lite annorlunda än en människa. Vi ser varje sida som ett koncept men sökmotorerna ser varje unik URL som en helt egen sida. För att hålla uppe kvalitén på sökresultaten kommer sökmotorn sällan visa flera versioner av samma innehåll, istället kommer den välja en version de tror är det bästa resultatet. Det här försvagar synligheten på alla dubbletter och kan även påverka din ranking negativt.

Problemet blir ännu större när besökare börjar länka till de olika versionerna och länkkraften splittras upp. Istället för att alla inkommande länkar går till en artikel kommer länkarna gå till flera versioner och du kommer inte gynnas lika mycket utav länkkraften eftersom enbart en av versionerna troligtvis är indexerad. Då länkar är en viktig rankingfaktor kan detta påverka din ranking negativt.

Hur blir innehållet duplicerat?

Det finns många olika orsaker till duplicerat innehåll och de allra flesta är tekniska. Man kan dela in det i tre olika kategorier:

URL-variationer

Eftersom sökmotorer ser varje URL som en unik sida så kan olika typer av URL-parametrar ställa till med duplicerat innehåll. Det kan vara allt från att lägga till filtreringar med query strings till session ID:s för att tagga upp ett besök.

Om du har utskriftsvänliga versioner av dina sidor så kan även dessa ibland skapa en duplicerad URL. Det är också vanligt att olika CMS skapar duplicerat innehåll automatiskt: https://www.yourdomain.com/article-a finns även under https://www.yourdomain.com/category/article-a. Om du har lagt artikeln under flera kategorier kan problemet bli ännu större. Det är också väldigt vanligt i webbutiker där en produkt ingår i flera olika artikelgrupper och kan hittas på flera olika sätt.

Felaktig domänhantering: www vs. utan-www och http vs. https

En av de vanligaste orsakerna till duplicerat innehåll är att du missat att omdirigera www och utan www. Tekniskt sett är www en subdomän och sökmotorerna kommer därför behandla dem som en unik URL. Utan att tänka på det har du skapat en hel duplicerad sida. Samma sak gäller om du har SSL-certifikat på webbplatsen. Då kan du ha två versioner även där.

Webbskrapning och kopierat innehåll

Duplicerat innehåll gäller såklart inte bara artiklar och blogginlägg, det gäller ju all typ av text på din webbplats. Många webbutiker har stora problem med produktinformation då de använder produktinformationen från leverantören. Om många sedan säljer samma produkt och använder leverantörens produktinformation så blir det duplicerat innehåll.

Webbskrapning (web scraping) kan också vara ett problem. Det är program som skrapar innehåll från olika webbplatser och sedan publicerar det på sin egen webbplats. Man brukar kalla det för skrapning eftersom innehållet hämtas från webbplatsen, inte från databasen. Oftast skrapar dessa program inte all text på din webbplats utan de letar efter specifik information som de sedan kopierar och lägger upp på den egna sajten. Ett exempel på sådana här program är prisjämförelsesajter.

Hur fixar du duplicerat innehåll?

För att lösa problemet med duplicerat innehåll så behöver du specificera vilket innehåll som är det primära. Det kan du göra på några olika sätt och vilket som lämpar sig bäst beror på hur innehållet duplicerats.

301 redirect

En av de vanligaste och bästa lösningarna för duplicerat innehåll är att permanent omdirigera de duplicerade sidorna till den sida du valt ut som den primära. Det här är den bästa lösningen för felaktig domänhantering, alltså om du har duplicerade versioner på grund av www och utan-www eller http och https.

De duplicerade versionerna tävlar ofta mot varandra både i sökresultatet och för länkar. Genom att omdirigera dubbletterna till den primära sidan slutar de olika versionerna tävla mot varandra i sökresultatet. Men inte nog med det, den primära sidans relevans och popularitet ökar eftersom den även får ta del av de andra versionernas länkkraft. Detta gör att den har betydligt större chans att ranka på på viktiga sökord. Läs mer om redirects.

Canonical URL

Ett annat vanligt sätt att hantera duplicerat innehåll är genom att lägga till en canonical URL (kanonisk adress). Den kanoniska adressen talar om för sökmotorerna vilken webbsida som är primär och att andra versioner ska behandlas som kopior. Länkkraft som går till dubbletterna förs med hjälp av canonicals vidare till den primära sidan.

Canonical URL är bra att sätta när ditt CMS automatiskt skapar flera URL:er. Då slipper du omdirigera alla allt eftersom att du bygger nytt innehåll. Många CMS gör en del av det här automatiskt idag men det kan ändå vara bra att kontrollera. Canonical URl kan också användas när du publicerar samma innehåll över flera domäner, t.ex. ett gästinlägg. Läs mer om canonical URL.

Meta robots noindex

Vissa sidor skapar ofta duplicerade URL, t.ex varukorgen i en webbutik. Eftersom det inte är relevant att indexera varukorgen på sökmotorerna så kan man sätta en meta-tagg som förklarar att den här sidan inte ska indexeras.

Meta robots-taggen noindex,follow talar om för sökmotorn att de inte ska indexera sidan men de kan fortfarande crawla den.

Ytterligare tips för att hantera duplicerat innehåll

  • Var alltid konsekvent när du själv länkar till sidor – länka alltid till samma version.
  • Specificera i Google Search Console hur du vill att din domän ska indexeras, t.ex. https://www.yourdomain.com framför https://yourdomain.com.
  • Undvik att upprepa standardtexter som t.ex. köpvillkor och copyright. Skriv istället en kortare text och länka till den fullständiga texten som ligger på en egen unik sida.
  • Publicera inte sidor utan innehåll. Det händer ibland när man skapar kategorier eller liknande som bara är platshållare för sidor lägre ner i strukturen. Om du har sådana sidor, sätt noindex på dem.
  • Lär känna ditt CMS. I vissa fall visas ett blogginlägg i sin helhet både på kategori-sidor, tagg-sidor och i arkivet.
  • Skydda ditt innehåll mot webbskrapning genom att lägga en självrefererande canonical på dina sidor. Det hjälper inte mot all skrapning men en del skrapat innehåll kommer då ha en canonical URL som pekar tillbaka till ditt innehåll.
Kontakta oss - begär offert

Kontakta oss - begär offert

Vi tar gärna kontakt med dig för att lämna offert på våra tjänster: Hemsidor, E-handel, SEO, Google Ads.

Vi kontaktar dig inom kort!

Jag accepterar att denna webbplats använder sig av cookies enligt vår integritetpoilicy för att förbättra min användarupplevelse. mer information

Dina cookie-inställningar för denna webbplats är satt till ”tillåt cookies” för att ge dig den bästa upplevelsen. Om du fortsätter använda webbplatsen utan att ändra dina inställningar för cookies eller om du klickar ”Godkänn” nedan så samtycker du till detta.

Stäng