OpenAI udgiver GPT-4.1: Hvorfor denne superkraftige AI-model vil dræbe GPT-4.5.

OpenAI udgiver GPT-4.1: Hvorfor denne superkraftige AI-model vil dræbe GPT-4.5.

OpenAI afslørede GPT-4.1 på mandag, en trio af nye AI-modeller med kontekstvinduer på op til en million tokens – nok til at behandle hele kodebaser eller små romaner på én gang. Lineup’en inkluderer standard GPT-4.1, Mini og Nano varianter, alle rettet mod udviklere.
Virksomhedens seneste tilbud kommer blot uger efter frigivelsen af GPT-4.5, hvilket skaber en tidsplan, der giver cirka lige så meget mening som rækkefølgen af udgivelsen af Star Wars-filmene. “Beslutningen om at navngive disse 4.1 var målrettet. Jeg mener, det er ikke kun fordi, vi er dårlige til at navngive,” sagde OpenAI-produktleder Kevin Weil under annonceringen – men vi forsøger stadig at finde ud af, hvad disse intentioner var.
GPT-4.1 viser ret interessante evner. Ifølge OpenAI opnåede den 55 % nøjagtighed på SWEBench-kodningsbenchmark (op fra GPT-4o’s 33%), mens den koster 26% mindre. Den nye Nano-variant, markedsført som virksomhedens “mindste, hurtigste, billigste model nogensinde”, kører til kun 12 cent pr. million tokens.
Desuden opkræver OpenAI ikke ekstragebyrder for at behandle massive dokumenter og faktisk bruge den en million tokens kontekst. “Der er ingen prisstigning for lang kontekst,” understregede Kevin.
De nye modeller viser imponerende ydelsesforbedringer. Under en live demonstration genererede GPT-4.1 en komplet webapplikation, der kunne analysere en 450.000-tokens NASA-serverlogfil fra 1995. OpenAI hævder, at modellen består denne test med næsten 100 % nøjagtighed selv ved en million tokens i kontekst.
Michelle, OpenAIs leder af posttræningsforskning, viste også modellernes forbedrede evner til at følge instruktioner. “Modellen følger alle dine instruktioner til punkt og prikke,” sagde hun, da GPT-4.1 pligtopfyldende overholdt komplekse formateringskrav uden den sædvanlige AI-tendens til at “kreativt fortolke” retninger.
Sådan tæller man ikke: OpenAIs vejledning til at navngive modeller
Udgivelsen af GPT-4.1 efter GPT-4.5 føles som at se nogen tælle “5, 6, 4, 7” med et alvorligt ansigt. Det er det seneste kapitel i OpenAIs bizarre versions-saga.
Efter frigivelsen af GPT-4 opgraderede den modellen med multimodale evner. Virksomheden besluttede at kalde den nye model GPT-4o (“o” for “omni”), et navn der også kunne læses som “four zero” afhængigt af skrifttypen du bruger.
Herefter introducerede OpenAI en model med fokus på logik, der bare blev kaldt “o.” Men forveksl ikke OpenAIs GPT-4o med OpenAIs o, for de er ikke det samme. Ingen ved, hvorfor de valgte dette navn, men som en generel tommelfingerregel var GPT-4o en “normal” LLM, mens OpenAI o1 var en logisk model.
Nogle måneder efter frigivelsen af OpenAI o1 kom OpenAI o3.
Men hvad med o2? – Jo, den model eksisterede aldrig.
“Man ville logisk set tænke (vores nye model) måske burde have heddet o2, men af respekt for vores venner hos Telefonica – og i den stolte tradition af OpenAI med virkelig at være dårlige til at navngive ting – bliver den kaldt o3,” sagde Sam Altman under præsentationen af modellen.
Lineup’en fragmenteres yderligere med varianter som den normale o3 og en mindre mere effektiv version kaldet o3 mini. Dog udgav de også en model ved navn “OpenAI o3 mini-high”, som sætter to absolutte antonymer ved siden af hinanden, fordi kunstig intelligens kan gøre mirakler. I essensen er OpenAI o3 mini-high en mere kraftfuld version end o3 mini, men ikke så kraftfuld som OpenAI o3 – som henvises til i et enkelt diagram af OpenAI som “o3 (Medium)”, som det bør være. Lige nu kan ChatGPT-brugere vælge enten OpenAI o3 mini eller OpenAI o3 mini-high. Den normale version er ingen steder at finde.
Desuden må vi ikke forvirre dig mere, men OpenAI har allerede annonceret planer om at frigive o4 snart. Men for guds skyld, forveksl ikke o4 med 4o, for de er absolut ikke det samme: o4 tænker – 4o gør ikke det.
Nu, lad os vende tilbage til den nyankomne GPT-4.1. Modellen er så god, at den snart vil slå GPT-4.5, hvilket gør den model til den kortestlevende LLM i ChatGPT’s historie. “Vi annoncerer, at vi vil udfase GPT-4.5 i API’en,” erklærede Kevin og gav udviklere en tidsfrist på tre måneder til at skifte. “Vi har virkelig brug for de GPU’er tilbage,” tilføjede han og bekræftede, at selv OpenAI ikke kan undgå den siliciummangel, der plager branchen.
På dette tidspunkt er vi næsten garanteret at se GPT-π eller GPT-4.√2 inden årets udgang – men nåja, trods alt bliver de bedre med tiden, uanset navnene.
Modellerne er allerede tilgængelige via API’en og i OpenAIs legeplads, og vil ikke være tilgængelige i den brugervenlige ChatGPT-grænseflade – i hvert fald endnu.
Redigeret af James Rubin

Leave a Reply

Your email address will not be published. Required fields are marked *