Artikel

Structured output — Få LLM'er til at returnere JSON og andre formater

Structured output-mode tvinger modellen til at returnere validt JSON der matcher et schema. Fundamentet for pålideligt AI-workflow-integration og tool use.

Structured output er en funktion i moderne LLM-API’er der garanterer at modellen returnerer output i et specificeret format — typisk JSON der matcher et givet schema. I stedet for fritekst der skal parses med regex, returnerer modellen maskinlæsbare data der kan injiceres direkte i downstream-systemer.

Behovet opstår i ethvert workflow hvor LLM-output skal behandles programmatisk. En content-analyse der skal skrives til en database, en meta-tag-generering der skal hentes af et CMS, en konkurrentanalyse der skal populere et dashboard — alle kræver konsistent, validt output. Fritekst-parsing er skrøbelig; structured output er deterministisk.

JSON-mode og schema-mode

JSON-mode: Modellen returnerer validt JSON — men ingen garanti for at strukturen matcher det du forventer. En nøgle kan hedde title eller Title eller page_title afhængigt af prompt og context. Bedre end fritekst, men kræver stadig parsing-logik.

Schema-mode (structured outputs): Du definerer et eksplicit JSON Schema eller Pydantic-model, og modellen garanterer at output matcher dette schema. Felter er de rigtige, typer er korrekte, obligatoriske felter er til stede. OpenAI lancerede dette med GPT-4o-mini i 2024; Anthropic understøtter det via tool use.

Function calling / Tool use: Modellen returnerer et kald til en specificeret “funktion” med typede parametre. Teknisk ekvivalent til schema-mode men konceptuelt rammet som at modellen “kalder en funktion” frem for at “returnere data”.

Praktisk eksempel: SEO-content-brief

{
  "title": "Crawl budget — Hvordan Google prioriterer din crawling",
  "meta_description": "Forstå crawl budget...",
  "target_keyword": "crawl budget",
  "secondary_keywords": ["crawling", "googlebot", "crawl rate"],
  "word_count_target": 1200,
  "internal_links": ["indeksering", "robots-txt"],
  "content_gaps": ["...", "..."]
}

Med schema-mode returneres dette konsistent for hundredvis af sider uden manuel parsing.

Begrænsninger

Structured output øger latency marginalt og kan reducere kreativiteten i output — modellen er mere fokuseret på at matche strukturen end på at optimere svarets indhold. For kreative opgaver er fritekst bedre; for pipeline-integrerede, maskinlæsbare outputs er structured output standard.

Andre artikler i samme emne

Placering i ordbogen