Question 1

Hvad var GPT-2 og hvorfor var det bemærkelsesværdigt?

Accepted Answer

GPT-2 var et transformer-baseret sprogmodel fra OpenAI (2019) med 1,5 milliarder parametre. Det var bemærkelsesværdigt fordi det producerede output der var kvalitativt anderledes end alle tidligere systemer: givet en tekst-prompt genererede det grammatisk, sammenhængende og faktisk læsbar tekst over hele passager — ikke bare statistisk plausible ordsekvenser som Markov-kæder. OpenAI udgav ikke modellen fuldt ud ved launch af frygt for misbrug — første gang en AI-virksomhed eksplicit tilbageholdt et system af frygt for skadevirkninger.

Question 2

Hvad skete der mellem GPT-2 (2019) og ChatGPT (2022)?

Accepted Answer

Tre milepæle markerede perioden: GPT-3 (2020) med 175 milliarder parametre demonstrerede few-shot learning — modellen kunne løse opgaver den aldrig var specifikt trænet på, blot ved at se eksempler i prompten. GitHub Copilot (2021) baseret på Codex (GPT-3 fine-tunet på kode) var det første masseadopterede AI-kodegenererings-produkt for millioner af udviklere. InstructGPT (2022) introducerede RLHF — modellen trænedes til at følge instruktioner frem for blot at fortsætte tekst. Det var den afgørende tekniske forskel der muliggjorde ChatGPT.

Question 3

Hvad adskiller GPT-2 fundamentalt fra Markov-kæder og spintax?

Accepted Answer

Forskellen er ikke bare skala — den er arkitektonisk. Spintax har regler og skabeloner men ingen lærte mønstre. Markov-kæder lærer sandsynligheder fra data men ser kun de foregående n ord. GPT-2 er en transformer med attention-mekanismer der tillader hvert token at tage hensyn til alle andre tokens i konteksten — det giver langsigtet sammenhæng og semantisk forståelse som ingen af forgængerne kunne opnå. Resultatet er tekst der husker detaljer fra indledningen og kan følge komplekse instruktioner — en kvalitativ, ikke blot kvantitativ, forskel.

Question 4

Hvorfor introducerede InstructGPT en fundamental ændring frem for GPT-3?

Accepted Answer

GPT-3 var et base-completion-system: givet en tekst-prompt fortsatte modellen teksten statistisk sandsynligt. Det er ikke det samme som at besvare spørgsmål eller følge instruktioner. InstructGPT (2022) introducerede RLHF og trænede modellen på menneskelig feedback til at prioritere instruktionsfølgning over ren tekstforudsigelse. Det var det afgørende tekniske spring: en model der følger 'Skriv en meta description til denne side' frem for at generere generisk tekst om meta descriptions. ChatGPT er i bund og grund InstructGPT gjort tilgængeligt via en chat-interface.

Question 5

Hvad er BERT og hvorfor er det relevant for søgemaskineforståelse?

Accepted Answer

BERT (Bidirectional Encoder Representations from Transformers, Google 2018) er en encoder-only transformer der forstår sprogets kontekst i begge retninger — hvert ord ses i relation til alle omgivende ord. Det gør BERT fremragende til tekstforståelse og klassificering. Google integrerede BERT i søgealgoritmen i 2019 (Google BERT-opdateringen) — en af de mest signifikante ranking-ændringer i årtiet. BERT forbedrede Googles evne til at forstå naturligt sprog i søgeforespørgsler, særligt prepositionale fraser og spørgsmål. Det er en direkte årsag til at søgeintention og naturligt sprog er vigtigere end keyword-stuffing i SEO i dag.

GPT-2 og tidlig generativ AI — Springet til transformer-baseret tekstgenerering

GPT-2: Tekst der overraskede

Perioden 2019-2022

GPT-3 (2020)

GitHub Copilot (2021)

InstructGPT (2022)

Hvad der adskilte GPT-2 fra spintax og Markov

Andre artikler i samme emne

Ofte stillede spørgsmål

Placering i ordbogen