Question 1

Hvad er en token i AI-sammenhæng?

Accepted Answer

En token er den grundenhed som AI-modeller processerer — ikke et ord, ikke et tegn, men et stykke tekst der typisk svarer til 3-4 tegn eller ¾ ord på engelsk. Korte hyppige ord som 'og' og 'er' er typisk 1 token, mellemlange ord 2-3 tokens og lange sammensatte ord 4-6 tokens. Tokens er vigtige fordi de direkte påvirker to ting: hvad du betaler (API-priser er token-baserede) og hvad modellen kan huske (context window måles i tokens).

Question 2

Hvad koster tokens og hvornår bør man tænke over det?

Accepted Answer

API-kald prissættes per 1.000 tokens — typisk med output tokens 3-5x dyrere end input tokens. En prompt og svar på 2.000 ord koster ca. 2.500-3.500 tokens. Token-bevidsthed er irrelevant ved ad hoc-brug men bliver vigtig ved: høj-volumen batch-processing workflows, opgaver der nærmer sig context window-grænsen, og produktionsworkflows hvor du vil estimere monthly API-udgift. Effektiv prompt-design handler om præcis kommunikation — ikke om at spare tokens til et punkt det skader output.

Question 3

Bruger dansk tekst flere tokens end engelsk?

Accepted Answer

Ja — tokenisering er primært optimeret til engelsk tekst. Dansk morfologi med hyppige sammensætninger tokeniseres mindre effektivt: den samme information kræver typisk 10-15% flere tokens på dansk end på engelsk. Det er et konkret argument for at skrive prompts på engelsk i højvolumen-workflows, men i praksis er forskellen lille nok at det sjældent er værd at kompromittere prompt-klarhed for token-besparelser.

Question 4

Hvad er caching af tokens og hvornår sparer det penge?

Accepted Answer

Prompt caching er en API-feature (tilgængelig hos Anthropic og OpenAI) der genbruger beregninger for identiske dele af en prompt på tværs af API-kald. Hvis din system prompt er 2.000 tokens og er identisk i alle kald i en batch-opgave, betales den kun fuldt ud ved første kald — efterfølgende kald genbruger den cachede beregning til ca. 10-20% af normal inputpris. For SEO-batch-workflows med stor statisk system prompt (brand voice, format-regler, eksempler) kan caching reducere omkostningerne markant. Implementeres ved at markere den statiske del af prompten med cache_control-headeren.

Question 5

Hvad er extended thinking og koster det ekstra tokens?

Accepted Answer

Extended thinking (Anthropics term for Chain-of-Thought reasoning i Claudes API) aktiverer en intern ræsonneringsproces hvor modellen genererer skjulte tænketokens inden det endelige svar. Disse 'thinking tokens' er i Claude's API billigere end standard output tokens, men du betaler stadig for dem. For komplekse SEO-analyser der kræver multi-step ræsonnering (content gap-analyse, teknisk audit-prioritering) kan extended thinking forbedre outputkvaliteten markant. For enkle, formaterede opgaver som meta-tag-generering er det unødvendigt og øger blot latency og cost.

Tokens og tokenisering — Hvad det er og hvorfor det betyder noget

Hvad er en token

Praktiske konsekvenser

Input vs. output tokens

Tokenisering og sprog

Hvornår du aktivt tæller tokens

Andre artikler i samme emne

Ofte stillede spørgsmål

Placering i ordbogen