Overskrifter

OpenAI afslører GPT-4.5: Venligste model hidtil til 1300% prisen.

OpenAI afslører GPT-4.5: Venligste model hidtil til 1300% prisen. OpenAI afslører GPT-4.5: Venligste model hidtil til 1300% prisen.

OpenAI frigav GPT-4.5 torsdag, blot én dag efter Anthropic lancerede Claude 3.7 Sonnet og knap en uge efter xAI’s Grok-3 debut og DeepSeek’s annoncering af en ny model, der kommer snart.
Og dyrt er det afgørende ord her. OpenAI’s nye model kommer med en stærkt API pris på $75 per million input tokens og $150 per million output tokens.
Det ser ud til at være en ny konkurrencefase i AI-løbet, hvor virksomheder forsøger at overgå hinanden med stadig mere kapable—og stadig dyrere—modeller.
Til sammenligning er det ti gange dyrere end Claude 3.7 Sonnet, hvilket potentielt kan være en hindring for mange udviklere og startups, der ønsker at bygge på teknologien.
GPT-4 (dens forgænger) kostede $2.50 per 1M tokens af input og $10.00 per 1M tokens af output—hvilket gør GPT-4.5 2900% mere dyr at input og 1300% dyrere at få et svar.
Sam Altman, OpenAI’s administrerende direktør, undgik ikke at anerkende modellens massive ressourcekrav i sin meddelelse. “Dårlige nyheder: Det er en gigantisk, dyr model,” sagde han.
“En forhåndsmeddelelse: Dette er ikke en resonansmodel og vil ikke slå benchmarks. Det er en anden form for intelligens,” sagde Altman. “Der er en magi ved det, jeg ikke har følt før.”
GPT-4.5 er klar!
gode nyheder: det er den første model, der føles som at tale med en eftertænksom person for mig. jeg har haft flere øjeblikke, hvor jeg har lænet mig tilbage i min stol og været forbløffet over at få faktisk god rådgivning fra en AI.
dårlige nyheder: det er en gigantisk, dyr model. vi…
— Sam Altman (@sama) 27. februar 2025
Og dette synes at være nøglen. Brugere betaler 1300% mere for ikke at have en mere intelligent model, men for at have en pænere model, der føles mere menneskelig.
For eksempel er en ting, hvor GPT-4.5 skinner ifølge OpenAI, i hvad de kalder “vibes”, eller i bund og grund modellens EQ, varme og samarbejdende følelse.
Virksomheden skabte et “Vibes test sæt” for at måle kreativ intelligens og samtalekvalitet, hvor GPT-4.5 angiveligt overgik andre modeller.
Eksemplerne delt under præsentationen introducerede ikke nødvendigvis noget nyt.
Den første demonstration havde bogstaveligt talt denne prompt: “UGHHH! Min ven har aflyst igen!!! Skriv en sms besked, hvor du fortæller dem, at JEG HADER DEM!!!!” hvilket muligvis ikke er noget, man ville bruge en kompetent stor sprogmodel til.
I en efterfølgende demonstration, hvor GPT-4.5 blev sammenlignet med OpenAI’s o1 model, bad forskerne begge AI’erne om at forklare behovet for AI-tilpasning og hjælpe med at formulere en besked til en ven, der havde aflyst planer.
Svarene, mens de viser forbedret nuance i GPT-4.5, virkede næppe revolutionerende. Forskellen lå i tonen.
I et andet eksempel spurgte forskerholdet den kraftfulde GPT-4.5, hvorfor havvandet er salt.
Den nye model svarede med mindre komplekse udtryk—”på grund af regn, floder og sten”—sammenlignet med tidligere modeller.
GPT-4-Turbo gav et mere omfattende og detaljeret svar, som holdet ikke kunne lide, idet de argumenterede for at “man får følelsen af, at den vil have, at du skal vide, hvor klog den er.”
Et humoristisk detalje fra præsentationen var et påskeæg, der antydede en mulig GPT-6, med en forespørgsel der lød: “Num GPUs for GPT-6 Training.”
Måske når den model kommer, vil demonstrationerne være mere imponerende.
De præsenterede benchmarks tegner et blandet billede. GPT-4.5 scorer 71.4% på GPQA (en videnskabelig evaluering), sammenlignet med GPT-4o’s 53.6%.
Dog ligger den stadig bagud OpenAI’s o3-mini model, der scorer 79.7% gennem dens resonansegenskaber.
Lignende mønstre opstod på tværs af andre benchmarks. På AIME ’24 matematik evalueringen, scorede GPT-4.5 36.7%, og overgik dermed GPT-4o’s 9.3%, men var stadig langt bagud o3-mini’s 87.3%.
Til kodningsopgaver, klarede GPT-4.5 sig bedre end dens forgænger og o3-mini på SWE-Lancer Diamond benchmarket, men klarede sig dårligere på SWE-Bench Verified sammenlignet med den resonansfokuserede model.
Altman beskrev modellen i næsten mystiske termer, og kaldte den “den første model, der føles som at tale med en eftertænksom person.”
Han tilføjede: “Jeg har haft flere øjeblikke, hvor jeg har lænet mig tilbage i min stol og været forbløffet over at få faktisk god rådgivning fra en AI.”
Under modellens præsentation forklarede OpenAI-forskere, at virksomheden fremskridt AI gennem to forskellige tilgange: usuperviseret læring og resonans.
Mens resonans lærer modeller at “tænke, før de svarer,” hjælper usuperviseret læring med at øge “ordmodelens præcision og intuition.” GPT-4.5 fordobler det sidste.
“GPT-4.5 er vores næste skridt i at skalerer usuperviseret læring, øge verdensviden, intuition, og mindske hallucinationer,” forklarede en OpenAI forskningsleder under præsentationen.
Udviklingen af GPT-4.5 krævede massiv teknisk innovation, ifølge holdet. De måtte opbygge nye slutningssystemer for at kunne betjene sådan en stor model effektivt, bruge træning med lav præcision for at maksimere GPU-udnyttelse og endda træne på tværs af flere datacentre samtidig.
Udgivelsen kommer på et tidspunkt, hvor forbrugerforventninger til AI er skyhøje, og konkurrencen rummet er intensiveret. Om GPT-4.5’s “forskellige form for intelligens” og forbedrede “vibes” berettiger dens enorme ressourcekrav og stejle priser, forbliver at se.
GPT-4.5 er i øjeblikket tilgængelig for Pro-brugere, der betaler $200 om måneden. Plus-brugere, der betaler $20 om måneden, vil have adgang til modellen næste uge.
Redigeret af Sebastian Sinclair.

Leave a Reply

Your email address will not be published. Required fields are marked *