Et nyt AI-agentplatform fra Kina kaldet Manus bliver hurtigt populært blandt teknologieksperter, og hvis hypen skal troes, kunne det være en troværdig rival til OpenAIs Deep Research- og Operator-agenter.
Selvfølgelig er det endnu ikke bevist, om hypen er sand, da adgangen til platformen stadig er tæt holdt, og kun er tilgængelig ved invitation, hvor nogle angiveligt betaler astronomiske summer for at få en invitation.
Selv blandt dem, der tilsyneladende har adgang til modellen, er der debat om, hvorvidt den er lige så revolutionerende, som nogle brugere hævder.
Platformen, der fokuserer på agenter, blev lanceret tidligere på måneden af opstartsselskabet Monica AI, som angiveligt har hovedkontor i Beijing.
Manus selv beskriver sig som en “generel AI-agent”, der kan booke rejser, analysere aktier, skabe uddannelsesmateriale, sammenligne forsikringspolicer og mere.
Platformen er designet til at udføre opgaver uden at brugeren skal konfigurere API’er eller oprette komplekse miljøer. Den skulle kunne forstå en anmodning, gå på nettet, analysere hvad der er på skærmen, og udføre opgaver autonomt.
OpenAI opkræver $200 om måneden for adgang til sine avancerede agenter, som angiveligt skulle være sammenlignelige. Manus er pt. gratis, men vil opkræve et beskedent månedligt gebyr, når den er fuldt implementeret.
Adgangs-sjældenhed på grund af serverbelastning har skabt et sekundært marked for invitationkoder på det kinesiske marked Xianyu, hvor priserne for en betakonto angiveligt har nået 10 millioner yuan (over $1,3 millioner).
Det sagt, hvis et sådant link var på Xianyu, er det ikke længere tilgængeligt, og transaktionen kunne være designet til at skabe FOMO, eller frygt for at gå glip af noget.
På nuværende tidspunkt er omtaler af koder til Manus blevet forbudt på appen.
Manus har endnu ikke reageret på en anmodning fra Decrypt om kommentarer.
Manus tager sit navn fra det latinske ord for “hånd”, idet det positionerer sig som en “universel hånd” for brugerne. Virksomheden hævder, at den har opnået førsteklasses præstation på GAIA-testen (en test der måler, hvor gode modeller er til agentevner) på alle sværhedsniveauer, og overgår langt OpenAIs modeller og andre agentevner-teknologier.
Manus er Fantastisk—Men Det Er Ikke DeepSeek 2
Nogle brugere har allerede prøvet modellen, og reaktionerne var blandende.
“Det er fuldstændig vanvittigt. Jeg føler, at jeg lige er blevet transporteret seks måneder ind i fremtiden,” skrev Andrew Wilkinson, medstifter af teknologivirksomheden Tiny, efter hans første test.
Andre er enige.
“Manus er det mest imponerende AI-værktøj, jeg nogensinde har prøvet,” skrev AI-forskeren Victor Mustar. “De agentevner, den besidder, er fantastiske og omdefinerer, hvad der er muligt.”
Og Deedy Das, en investor hos Menlo Ventures, har også hypet modellen.
“Dette er den AI-agent, vi blev lovet,” tweetede han og bemærkede, at den har “Deep Research+Operator+Computer Use+Lovable+Memory.”
Det sagt, skeptikerne har været på stigning, siden svindlere skabte en krypto-token med samme navn, hvilket førte til, at Manus’ X-konto midlertidigt blev suspenderet.
“Manus AI gjorde intet andet end at blive pludselig alt for populært til det punkt, hvor deres navn blev brugt af den tilsvarende kryptocurrency med høj svindelrisiko. Det førte til, at deres X-konto blev forbudt,” skrev appudvikleren AlvinWeb3.
Faktisk hævder en række brugere, at platformen primært er et markedsføringsstunt: “Manus ser ud til at have hyret mange kinesiske AI-influencere til at rose det… Kinesiske netborgere indså, at det var et stort markedsføringsfupnummer, og Manus’ ry i Kina er blevet ødelagt,” tweetede en bruger.
Andre fandt Manus’ præstation skuffende. Efter at have givet agenten nogle komplekse opgaver, bemærkede brugere, at den var langsom, faldt ind i løkker og fejlede nogle gange i at udføre det, der var påkrævet.
“Efter at have givet Manus en tur, konkluderer jeg, at det er et produkt djævelsk optimeret til influencere, hvilket er grunden til at det er eksploderet så meget,” tweetede pseudonym bruger Teortaxes sidste uge. “At generere trådboy-indhold, rejseplaner og sådan noget generelt interessant – ja. Faglig bistand, kodning – værre end googling. Mere LLM end agent.”
Andre virkede skuffede over, at Manus AI er afhængig af Claude og ikke er en agent med en proprietær basismodel.
“Vi bruger Claude og forskellige Qwen-finetunings,” indrømmede Monica AI’s Jichao Yi.
Virksomheden benytter sine egne fintunede modeller og proprietære teknikker, men dens kerneydelser ser ud til primært at afhænge af disse to modeller.
Open Source For at Redde Dagen
Nogle brugere spekulerede i, at da Monica AI brugte tredjepartsmodeller, ville det være muligt snart at komme med et åbent alternativ, og de havde ret.
For dem, der ikke ønsker at bruge $200 eller vente på en Manus-invitation, kan OpenManus, et open-source-projekt oprettet af bidragsydere fra MetaGPT-fællesskabet, være en god mulighed.
Dette gratis alternativ giver brugerne mulighed for at køre AI-agenter lokalt ved hjælp af hvilken som helst model, de ønsker.
“Sammenlignet med Manus, der kræver en invitation, kræver OpenManus ingen adgangsbarriere, og brugerne skal blot klone koden og konfigurere LLM API’en for at komme hurtigt i gang,” står der på modellens kort på AI Share Net.
OpenManus har fået meget opbakning, og dets GitHub-repository har på få dage samlet næsten 25.000 stjerner. Projektet fortsætter udviklingen med planer om webbaseret adgang og optimerede konfigurationer.
AI-agenter er et hurtigt voksende marked, der er værdisat til $5,4 milliarder i 2024 med en forventet årlig vækst på 45,8% gennem 2030 ifølge Grand View Research. Disse autonome programmer bliver brugt i brancher lige fra sundhedsvæsen til detailhandel og effektiviserer processer, der tidligere krævede menneskelig indgriben.
Selvom AI-agenter er en lovende idé, er de endnu ikke pålideligt succesrige til at udføre virkelig komplekse opgaver. OpenAI ser ud til at arbejde på specialiserede agenter, der kan opfylde disse krav – til $20.000 om måneden.
For nuværende koges kampen om at bygge din perfekte AI-hjælper ned til tre valg: betale, vente i kø eller bygge den selv.
Redigeret af Sebastian Sinclair og Josh Quittner.
