3月6日,一款名為Manus的國產AI智能體(AI Agent)產品橫空出世,熱度瞬間席卷全網,一度有超過當紅大模型DeepSeek的勢頭。
Manus的驚艷之處,在于其只需要一個簡單的指令,就能解決各類復雜多變的任務,不僅提供建議或答案,還能直接交付完整任務成果。譬如像開發團隊發布的案例,其可以進行簡歷篩選、房產研究、股票分析等。
然而,這股Manus熱潮僅僅持續了兩三天,業內就傳出不少質疑的聲音。首先是業內熱傳其“體驗邀請碼一碼難求,內測碼二手交易價已經炒到了5萬一個”,最后卻發現可能是假新聞,之后是各類自媒體主播話題討論、投資人急尋開發團隊、資本市場熱炒股價等諸多亂象。
最新消息則是Manus在實際測評中,部分運行效果不盡如人意,而Manus創始人季逸超在社交平臺坦承,產品使用了基于阿里千問大模型(Qwen)的微調模型,這是承認“套殼”本質創新不足了,還是站在了巨擘阿里的“肩膀上”?
VCG供圖
海內外熱評Manus
3月6日凌晨,中國AI團隊Monica.im發布了一款通用型AI智能體產品Manus,稱其是一款通用型的智能體,有獨立思考能力,能規劃并執行復雜任務,并直接交付成果。
據該團隊發布的演示視頻,Manus可以自主完成篩選簡歷、房產研究、股票分析等任務,且用戶可以看到這些任務完成的全流程。
Manus的能力不止于此,其團隊介紹,個性化旅行規劃、教育課程開發、保險政策比較、B2B供應商采購、財務報告分析、公司名單整理、在線商店運營分析……需要規劃分析、執行總結的活,它幾乎都能干。
團隊還稱Manus在GAIA基準測試中取得了SOTA(State Of The Art,即當前最好的)成績,其性能超越OpenAI的同級別大模型。
在經過發布后頭兩天的行業熱捧后,國內外的一些測評揭示了Manus的真實“工作表現”。
在知名科技自媒體闌夕的測評中,Manus被要求制作一個國家的極簡編年史,需包含漫畫表選和網頁設計。盡管Manus的最終作品配色不佳,且因服務器宕機未能進一步修改,但整體效果仍可作為“人機協同的樣板間”,無論用作課外教案還是作品預覽,都具有極低的使用門檻。
在闌夕測評中,Manus也展現出局限性。當被要求制作使用原神角色圖標的消消樂游戲時,它在嘗試搜集素材時遭遇網盤登錄阻礙,不得不向用戶發出接管請求。在處理復雜任務時,Manus在細節方面還存在不足,比如屏幕適配問題需要更多人工指導。
自媒體MindCode在深入體驗分析后認為,Manus讓一般用戶感到驚艷,主要是因為它營造了一種“真人干活感”。但這種驚艷主要針對普通用戶,對于熟悉AI領域的人士而言,Manus的基礎能力與已有產品如Devin相比并無革命性突破。
在海外,一些用戶和專家對其技術成熟度提出質疑,也有一些早期用戶表示體驗Manus的過程并不順暢,而且存在一些事實性錯誤。
如科技媒體TechCrunch記者Kyle Wiggers體驗就不太好:在嘗試讓Manus從他所在地區的頂級快餐店訂購一份炸雞三明治時,第一次直接系統崩潰了,第二次嘗試中,Manus找到了符合他標準的菜單項,但無法完成訂購過程;讓Manus預訂從紐約到日本的航班,只能提供幾個航空網站和像Kayak這樣的機票搜索引擎的鏈接,其中一些鏈接是無效的。
“Manus是一個很好的產品,但并不是一項技術突破。”麻省理工學院博士秦增益認為,受限于預設流程和工具環境,Manus難以處理開放場景任務,比如無法控制PowerPoint制作幻燈片。
質疑與意義
從3月6日凌晨起,Manus以驚人速度霸占各大社交媒體熱門話題榜單,官網的注冊系統很快便因訪問過載崩潰。而凡涉及Manus的話題,評論區都會很快演變為“求碼”集散地,閑魚上的Manus邀請碼標價幾十到上萬不等,甚至有賣家聲稱持有“官方渠道”邀請碼,售價5萬元且拒不議價……
這樣的“新聞”引發關注的同時,市場對于Manus的評價開始出現兩極分化的趨勢。在一部分人看來,Manus采用邀請內測的機制,存在“饑餓營銷”的嫌疑。
迫于輿論壓力,Manus團隊合伙人張濤先后兩次澄清“從未投入任何市場推廣預算”“閑魚等平臺發布的邀請碼為虛假信息”,采用邀請碼機制是“服務器容量有限不得已而為之”。
一波未平一波又起。在Manus的官方宣傳中,它被冠以“首個通用AI智能體”的稱號,但其實在它之前,OpenAI Operator、Claude Computer Use,都已經在AI智能體領域進行了探索,并且部分已經進入實際應用階段。
技術層面上,Manus并沒有自研大模型,而是通過調用不同的基礎大模型來實現其功能,這種做法在業界被稱為“套殼”。因此,有業內人士直言,Manus的核心能力,如任務拆解其實與Devin、Cursor等現有產品相似,其創新更多體現在工程封裝而非底層技術突破。
甚至Manus合伙人張濤都表示,“(Manus)真的非常簡單,就是沒有秘密,就是相信模型的力量。”目前,已有多個團隊成功復刻Manus并開源,其中,MetaGPT的4人團隊只用了1個小時就完成了Open Manus(Manus“平替”)的核心系統,整體也只用了3個小時。
除此之外,網絡流傳的消息指,Manus一次任務就需要消耗2美元,而類似于Manus的編程特化版Agent Devin的月訂閱價格是500美元。
之所以這么貴是因為Token消耗問題,參考DeepSeek的API文檔中給出的標準:1個英文字符約等于0.3個Token。1個中文字符約等于0.6個Token。如果是以DeepSeek-R1為基底的Agent,每百萬Token輸出的價格為2.19美元。單次命令響應的輸出消耗在1000個Token左右(即回答一個難度適中的數學問題),而有科技博主推測Manus一次復雜任務就會消耗百萬Token甚至更高。
有媒體就算力消耗問題詢問了Manus團隊,但暫未得到回應。有業內人士表達了對Manus算力成本的擔憂,認為就Manus目前的狀態,大規模商業化可能還比較遙遠。
盡管如此,華源證券認為,“市場對Manus有分歧,但產業意義更大,終局是什么樣、誰將最終跑出來尚未定論,但Manus的范式對各家都有啟示,我們能看到更多、更好的產品出來,產業趨勢的確定性或將提升。”
中泰證券在研報中表示,Manus或將標志著通用Agent商業化元年到來。Agent瞄準和替代的絕不僅是傳統軟件市場,而是以萬億美元計的服務市場。通過將服務轉化為軟件(Service-as-a-Software)的模式,Agent為代表的應用模式將創造遠超傳統軟件的價值量。
采寫:新快報記者 鄭志輝
本文鏈接:從“一碼難求”到被多方質疑 Manus過山車式走紅的冷思考http://m.lensthegame.com/show-1-37882-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 廣東出臺新規 規范中小學教育收費管理