設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          “AI界的拼多多”DeepSeek推出新款大模型,水平如何?

          2024-12-28 12:48:37 來源: 觀察者網

          8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          開源和閉源AI的差距,進一步被這家中國公司縮小了。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          近日,被稱為“AI界拼多多”的中國人工智能初創公司深度求索(DeepSeek)發布了全新大模型DeepSeek-V3(下稱V3)并同步開源。該模型在Aider多語言編程測試排行榜中,已超越Anthropic的Claude 3.5 Sonnet大模型,僅次于榜首的OpenAI o1大模型。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          開源No.1,多方面追平閉源大模型 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          DeepSeek是知名私募巨頭幻方量化旗下的人工智能公司,根據DeepSeek公布的測試結果,其運行了多項基準測試來比較性能,V3模型已明顯優于包括Meta公司的Llama-3.1-405B和阿里云的Qwen 2.5-72B等一眾領先開源模型。在大多數基準測試中,它甚至部分超越了OpenAI的閉源模型GPT-4o。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Deepseek-V3在多方面超越、追平各種開源、閉源大模型。Deepseek 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          首先是百科知識上,V3的知識類任務(MMLU, MMLU-Pro, GPQA, SimpleQA)水平相比前代 DeepSeek-V2.5 (下稱V2.5)顯著提升,接近當前表現最好的模型 Claude-3.5-Sonnet-1022。長文本測評方面,在DROP、FRAMES 和 LongBench v2 上,V3 平均表現超越其他模型。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          此外,V3 在算法類代碼場景(Codeforces),遠遠領先于市面上已有的全部非o1類模型,并在工程類代碼場景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          值得注意的是,V3在中文和數學相關基準測試中表現尤為突出。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在美國數學競賽(AIME 2024, MATH)和全國高中數學聯賽(CNMO 2024)上,V3大幅超過了所有開源閉源模型。在中文能力上,V3 與 Qwen2.5-72B 在教育類測評 C-Eval 和代詞消歧等評測集上表現相近,但在事實知識 C-SimpleQA 上更為領先。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          訓練成本極低 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          按照美媒Venture Beat的說法,雖然V3已成為市場上最強大的開源模型,但其訓練成本卻非常非常低。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          通過在上一代DeepSeek-V2上的成功驗證,V3沿用了可以大幅降低顯存占用的MLA(多頭潛注意)和DeepSeekMoE(混合專家)架構,其具有6710億參數,每次推理激活370億參數,這種方法確保了高效的訓練及推理。在訓練階段,DeepSeek使用了多種硬件和算法優化,包括FP8混合精度訓練框架和用于管道并行的DualPipe算法,以降低訓練成本。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          V3基礎架構,DeepSeek創新的MLA被用于高效推理,DeepSeekMoE則用于經濟訓練。DeepSeek論文 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          DeepSeek聲稱,V3 實現了極高的訓練效率。在約278.8萬個英偉達 H800 GPU小時內完成了V3的整個訓練,假設GPU的小時租金為2美元,總成本就是約為557萬美元。這遠低于通常用于預訓練大語言模型動輒上億美元的成本,比如Llama-3.1的預訓練成本估計就超過5億美元。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          DeepSeek還通過算法和工程上的創新,使V3的生成吐字速度從20TPS大幅提高至60TPS,相比V2.5模型實現了3倍的提升,在處理多模態數據和長文本時表現突出。而隨著性能更強、速度更快的V3更新上線,DeepSeek的模型API服務定價也調整為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          量化基金轉型人工智能 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          公開資料顯示,在DeepSeek背后是量化私募巨頭幻方(High-Flyer Quant),也是大廠外唯一一家儲備上萬張英偉達 A100芯片的公司。幻方成立于2008年,總部位于中國杭州,專注于利用數學、統計學和計算機技術進行金融市場的量化分析和交易。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          自2023年四季度以來,A股市場不斷下行,而利用數學模型和計算機程序等技術手段進行投資決策的量化基金曾被作為“罪魁禍首”受到輿論的沖擊,這也讓幻方旗下基金表現一直落后于滬深300指數4個百分點。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          不過,隨著今年5月DeepSeek-V2發布,幻方量化卻成功轉型為人工智能先驅,其超低價格甚至引發了國內大模型的價格戰,DeepSeek也被迅速冠以“AI界拼多多”之稱。這反映出百度和阿里巴巴等科技巨頭,盡管在生成式人工智能領域已處于領先地位,但仍需要面對著來自新玩家的激烈競爭。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          幻方創始人梁文鋒此前曾回應稱,DeepSeek定價原則就是不貼錢,但也不賺取暴利。只是讓他也沒想到的是,DeepSeek的定價卻讓各大廠商紛紛降價,然而DeepSeek自身反而卻是有利潤的。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “字節是第一個跟進的,其旗艦模型降到和我們一樣的價格,然后觸發了其它大廠紛紛降價”,梁文鋒解釋說,“因為大廠的模型成本比DeepSeek高很多,所以DeepSeek沒想到會有人虧錢做這件事,最后就變成了互聯網時代的燒錢補貼的邏輯。”8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          梁文鋒認為,更多的投入并不一定產生更多的創新,否則大廠可以把所有的創新包攬了。8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文系觀察者網獨家稿件,未經授權,不得轉載。 8kt流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:“AI界的拼多多”DeepSeek推出新款大模型,水平如何?http://m.lensthegame.com/show-3-56428-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 工信部:2025年推進工業5G獨立專網建設

          下一篇: 萬億鋰電巨頭寧德時代官宣將赴港上市

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 久久精品国产一区| 一区二区视频在线观看| 久久无码人妻一区二区三区| 国产一区二区福利久久| 久久精品国产AV一区二区三区| 日韩精品无码Av一区二区 | 日韩在线一区二区三区视频| 亚洲国产精品一区第二页| 久99精品视频在线观看婷亚洲片国产一区一级在线| 亚洲天堂一区二区三区| 亚洲av福利无码无一区二区| 亚洲一区二区三区乱码A| 无码欧精品亚洲日韩一区夜夜嗨| 国模无码视频一区二区三区| 人妖在线精品一区二区三区| 射精专区一区二区朝鲜| 色窝窝无码一区二区三区| 国产成人无码一区二区三区| 精品一区二区三区中文字幕| 成人精品视频一区二区三区| 国产福利电影一区二区三区,亚洲国模精品一区 | 风间由美性色一区二区三区 | 精品视频无码一区二区三区 | 国产女人乱人伦精品一区二区 | 精品国产伦一区二区三区在线观看| 久久亚洲中文字幕精品一区四| 国产成人精品一区二区三区| 国产成人无码精品一区在线观看| 国产精品男男视频一区二区三区| 爆乳熟妇一区二区三区| 国产伦一区二区三区高清| 中文字幕在线一区二区在线| 亚洲乱色熟女一区二区三区蜜臀| 亚洲国产成人久久一区二区三区 | 69福利视频一区二区| 精品一区二区三区在线播放视频 | 一区二区三区在线观看视频| 精品伦精品一区二区三区视频| 国产精品一区二区av| 亚洲国产精品综合一区在线| 精品国产AV无码一区二区三区|