Question 1

Hvad er fine-tuning af en LLM?

Accepted Answer

Fine-tuning er processen hvor du træner en eksisterende AI-model videre på dine egne data. Du giver modellen par af input/output-eksempler, og modellen opdaterer sine vægte til at producere output der ligner dine eksempler. Det adskiller sig fra prompt engineering (du ændrer input) og RAG (du giver kontekst-dokumenter) — fine-tuning ændrer selve modellen permanent.

Question 2

Hvornår giver fine-tuning mening frem for prompt engineering?

Accepted Answer

Fine-tuning giver mening i fire situationer: dit ønskede outputformat er så specifikt at det er svært at kommunikere via prompts, dit domæne bruger jargon der er sjælden i standardtræningsdata, du kører hundredtusindvis af requests om måneden og vil reducere omkostninger ved kortere prompts, eller du har en meget specifik brand voice der konsekvent afviger fra modellens default. Vigtigst: test altid om god prompt engineering med few-shot eksempler er tilstrækkelig — det er det hyppigere end man tror.

Question 3

Hvad er forskellen på fine-tuning og RAG?

Accepted Answer

Fine-tuning ændrer modellens vægte og er en statisk løsning — modellen kender ikke til data fra efter træningen. RAG (Retrieval-Augmented Generation) henter relevante dokumenter dynamisk og injicerer dem som kontekst i prompten. RAG opdateres øjeblikkeligt når du tilføjer nyt indhold til vidensbasen, mens fine-tuning kræver gentrænning. Til faktabaserede use cases og løbende opdateret information er RAG den rigtige løsning; fine-tuning er bedre til at indlære stil, format og domænespecifik terminologi.

Question 4

Hvad koster fine-tuning i praksis og hvornår er det rentabelt?

Accepted Answer

OpenAI fine-tuning af GPT-4o mini koster ca. $0,003 per 1.000 training tokens — et datasæt med 500 eksempler á 500 tokens koster under $1 at fine-tune. Driftsomkostningerne er vigtigere: en fine-tuned model med en kortere system prompt kan reducere de løbende token-omkostninger med 30-60% ved høj volumen. Fine-tuning er rentabelt når du kører 100.000+ requests per måned, og din standard system prompt er 1.000+ tokens. Under det niveau er besparelsen for lille til at opveje den initiale investering i at bygge og vedligeholde et kvalitetsdatasæt.

Question 5

Hvad er LoRA og hvornår er det relevant for SEO-teams?

Accepted Answer

LoRA (Low-Rank Adaptation) er en teknik til at fine-tune store open source-modeller effektivt ved kun at træne et lille sæt ekstra parametre frem for hele modellen. Det gør det muligt at fine-tune Llama 3, Mistral og lignende modeller på en enkelt GPU. For SEO-bureauer er LoRA relevant i ét specifikt scenarie: behandling af klient-data der ikke må forlade dit eget miljø. En LoRA-fine-tunet Llama-model kørt lokalt giver GDPR-compliance uden cloud-afhængighed. For alle andre use cases er OpenAI eller Anthropics hosted fine-tuning enklere og hurtigere.

Fine-tuning — Hvornår du bør specialisere en AI-model

Hvad fine-tuning faktisk gør

Hvornår fine-tuning giver mening

Hvornår fine-tuning ikke giver mening

Processen i praksis

Open source og fine-tuning

Den pragmatiske beslutning

Andre artikler i samme emne

Ofte stillede spørgsmål

Placering i ordbogen