I korte træk
– Mistral Medium 3 konkurrerer med Claude 3.7 og Gemini 2.0 til en ottendedel af prisen og sigter mod skalerbar enterprise AI.
– Modellen excellerer inden for kodning og forretningsapplikationer og overgår Llama 4 Maverick og Cohere Command A i benchmarktests.
– Nu live på Mistral La Plateforme og Amazon Sagemaker, med Google Cloud og Azure-integrationer på vej.
Mistral Medium 3 blev frigivet i går og positionerer modellen som en direkte udfordring til økonomien ved implementering af enterprise AI.
Den i Paris-baserede opstart, grundlagt i 2023 af tidligere forskere fra Google DeepMind og Meta AI, udgav det, som det hævdes at levere topydelse til en ottendedel af omkostningerne ved sammenlignelige modeller.
“Mistral Medium 3 leverer topydelse og er samtidig en størrelsesorden billigere,” sagde selskabet.
Modellen repræsenterer Mistral AI’s hidtil mest kraftfulde proprietære tilbud og adskiller sig fra en portefølje af open-source, som inkluderer Mistral 7B, Mixtral, Codestral og Pixtral.
Med en pris på $0,4 pr. million input-tokens og $2 pr. million output-tokens undercut Medium 3 markant konkurrenterne samtidig med at vedligeholde ydelsesparitet. Uafhængige evalueringer af Artificial Analysis placerede modellen “blandt de førende ikke-reasoning-modeller med Medium 3, der matcher Llama 4 Maverick, Gemini 2.0 Flash og Claude 3.7 Sonnet.”
Mistral Medium 3 uafhængige evalueringer: Mistral er tilbage blandt de førende ikke-reasoning-modeller med Medium 3, der matcher Llama 4 Maverick, Gemini 2.0 Flash og Claude 3.7 Sonnet
Vigtigste point:
➤ Intelligens: Vi ser betydelige intelligensgevinster på tværs af alle 7 af vores evalueringer sammenlignet… pic.twitter.com/mc9il9WV8J— Artificial Analysis (@ArtificialAnlys) 8. maj 2025
Modellen excellerer især inden for professionelle domæner.
Menneskelige evalueringer demonstrerede overlegen ydeevne i kodningsopgaver, med Sophia Yang, en repræsentant fra Mistral AI, der bemærkede at “Mistral Medium 3 skinner inden for kodningsdomænet og leverer langt bedre præstation på tværs af bordet end nogle af dens meget større konkurrenter.”
Benchmark-resultater indikerer, at Medium 3 præsterer på niveau med eller over Anthropics Claude Sonnet 3.7 på tværs af forskellige testkategorier, mens den væsentligt overgår Meta Llama 4 Maverick og Cohere Command A inden for specialiserede områder som kodning og logisk tænkning.
Modellens 128.000-token-kontekstvindue er standard, og dens multimodalitet muliggør behandling af dokumenter og visuelle input på tværs af 40 sprog.
Men i modsætning til modellerne, der gjorde Mistral berømt, vil brugerne ikke kunne ændre den eller køre den lokalt.
Lige nu er den bedste kilde for open-source-entusiaster Mixtral-8x22B-v0.3, en model af eksperter, der kører 8 eksperter af 22 milliarder parametre hver. Ud over Mixtral har selskabet over et dusin forskellige open-source-modeller tilgængelige.
Den er også i første omgang tilgængelig til enterprise-implementering og ikke til brug for private via LeChat—Mistrals chatbot-interface. Mistral AI understregede modellens evne til at tilpasse sig enterprise og understøtte kontinuerlig fortræning, fuld finjustering og integration i virksomheders videnbaser til domænespecifikke applikationer.
Betakunder inden for finansielle tjenester, energi og sundhedssektorerne tester modellen til forbedring af kundeservice, personalisering af forretningsprocesser og analyse af komplekse datasæt.
API’en vil blive lanceret straks på Mistral La Plateforme og Amazon Sagemaker med en kommende integration planlagt til IBM WatsonX, NVIDIA NIM, Azure AI Foundry og Google Cloud Vertex.
Meddelelsen vakte betydelig diskussion på sociale medieplatforme, hvor AI-forskere roste gennembruddet med hensyn til omkostningseffektivitet, samtidig med at de bemærkede den proprietære karakter som en potentiel begrænsning.
Modellens lukkede kildeindkode-status markerer en afvigelse fra Mistrals open-weight-tilbud, selvom selskabet antydede fremtidige udgivelser.
“Med lanceringen af Mistral Small i marts og Mistral Medium i dag, er det ingen hemmelighed, at vi arbejder på noget ‘stort’ i de kommende uger,” drillede Mistrals Chef for Udviklerrelationer, Sophia Yang, i meddelelsen. “Med selv vores mellemstore model klart bedre end flagskibs-open-source-modeller som Llama 4 Maverick, er vi spændte på at ‘åbne’ op for, hvad der kommer.”
Mistral har tendens til at hallucinere mindre end den gennemsnitlige model, hvilket er fremragende nyt med tanke på dens størrelse.
Den er bedre end Meta Llama-4 Maverick, Deepseek V3 og Amazon Nova Pro, for at nævne et par få. Lige nu er modellen med færrest hallucinationer Googles nyligt lancerede Gemini 2.5 Pro.
Denne udgivelse kommer midt i imponerende forretningsvækst for det i Paris-baserede selskab, på trods af at det har været stille siden frigivelsen af Mistral Large 2 sidste år.
Mistral lancerede for nylig en enterprise-version af sin Le Chat chatbot, der integrerer med Microsoft SharePoint og Google Drive, med administrerende direktør Arthur Mensch, der fortæller Reuters, at de har “tredoblet (deres) forretning i de sidste 100 dage, særligt i Europa og uden for USA.”
Selskabet, der nu er værdisat til 6 milliarder dollars, viser sin teknologiske uafhængighed ved at drive sin egen compute-infrastruktur og reducere afhængigheden af amerikanske skyudbydere—en strategisk manøvre, der resonerer i Europa midt i anstrengte forbindelser efter præsident Trumps told på tech-produkter.
Om Mistral’s påstand om at opnå enterprise-grade ydeevne til forbrugervenlige priser holder i virkelige implementeringer, skal ses. Men foreløbig har Mistral positioneret Medium 3 som et overbevisende midtpunkt i en branche, der ofte antager, at større (og dyrere) er lig med bedre.
Redigeret af Josh Quittner og Sebastian Sinclair.
Ny Mistral AI-version frigives: En værdig ChatGPT og Claude til en brøkdel af prisen.
Ny Mistral AI-version frigives: En værdig ChatGPT og Claude til en brøkdel af prisen.
