Question 1

Hvad er embeddings i AI-sammenhæng?

Accepted Answer

Embeddings er tekst konverteret til matematiske vektorer — lister af tal med typisk 768 til 3.072 dimensioner — der repræsenterer den semantiske mening af teksten. Tekster med lignende betydning får vektorer der ligger tæt på hinanden i det matematiske rum. Det muliggør beregning af semantisk lighed via cosine similarity og er fundamentet under semantisk søgning, RAG-systemer og content clustering.

Question 2

Hvad bruges embeddings til i SEO-arbejde?

Accepted Answer

Embeddings bruges til flere konkrete SEO-opgaver: semantisk content clustering der grupperer sider med lignende indhold, duplicate og near-duplicate detection via cosine similarity-beregninger, søgeintentions-matching der finder semantisk relevante sider uanset eksakt keyword-match, internal link recommendation baseret på semantisk lighed, og RAG-retrieval der finder relevante dokumenter til LLM-kontekst.

Question 3

Hvad er forskellen på embeddings og generative LLM'er?

Accepted Answer

Embeddings genereres af dedikerede embedding-modeller (f.eks. OpenAIs text-embedding-3-large) og konverterer tekst til numeriske vektorer. Generative LLM'er (GPT-4o, Claude, Gemini) genererer ny tekst. De to typer modeller tjener fundamentalt forskellige formål: embedding-modeller til semantisk søgning og lighed-beregning, generative modeller til tekstproduktion og analyse. I RAG-systemer bruges begge: embedding-modellen finder relevante dokumenter, den generative model producerer svaret.

Question 4

Hvad er cosine similarity og hvornår bruges det i SEO?

Accepted Answer

Cosine similarity er en matematisk beregning der måler vinklen mellem to embeddings-vektorer og returnerer en score fra -1 til 1 — jo tættere på 1, desto mere semantisk ens er de to tekster. I SEO bruges det til duplicate og near-duplicate detection (sider med cosine similarity over 0,92-0,95 er kandidater til kannibalisering eller konsolidering), internal link recommendation (find sider der er semantisk nære og kan linke til hinanden), og content gap-analyse (embed konkurrenters indhold og mål afstanden til dit eget).

Question 5

Hvilken embedding-model bør man vælge til SEO-opgaver på dansk indhold?

Accepted Answer

Til SEO-opgaver på dansk indhold er OpenAIs text-embedding-3-large det stærkeste valg — multilingval træning giver god dansk dækning, 3.072 dimensioner giver høj præcision, og prisen er ca. $0,13 per million tokens. text-embedding-3-small er 5x billigere med lidt lavere kvalitet og er tilstrækkeligt til de fleste clustering-opgaver. Open source-alternativet sentence-transformers/paraphrase-multilingual-mpnet-base-v2 kører lokalt uden API-omkostning og er effektivt til store volumenopgaver med krav om datafortrolighed.

Embeddings — Semantisk mening som matematiske vektorer

Embeddings i praksis

SEO-relevante use cases

Vektordatabaser

Hvad embeddings ikke kan

Andre artikler i samme emne

Ofte stillede spørgsmål

Placering i ordbogen