設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          DeepSeek開源FlashMLA,意味著什么?

          2025-02-25 10:51:51 來源: 澎湃新聞

           BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          國產(chǎn)AI公司深度求索(DeepSeek)開源周正式啟動(dòng),并公布首個(gè)開源代碼。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2月24日,DeepSeek宣布啟動(dòng)“開源周”,首個(gè)開源的代碼庫為FlashMLA,這是針對Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,針對可變長度序列作了優(yōu)化,目前已投入生產(chǎn)。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          此前2月21日午間,DeepSeek宣布,從下周開始,他們將開源5個(gè)代碼庫,以完全透明的方式與全球開發(fā)者社區(qū)分享他們的研究進(jìn)展,每日都有新內(nèi)容解鎖,進(jìn)一步分享新的進(jìn)展,并將這一計(jì)劃定義為“Open Source Week”。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          根據(jù)DeepSeek在社交媒體上的內(nèi)容,在H800上可以實(shí)現(xiàn)每秒處理3000GB數(shù)據(jù),每秒執(zhí)行580萬億次浮點(diǎn)運(yùn)算。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          Hopper是英偉達(dá)的GPU(圖形處理芯片)架構(gòu),例如H100和H800,發(fā)布于2022年,主要用于AI計(jì)算。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          有意思的是,如果把這段內(nèi)容交給DeepSeek網(wǎng)頁版,詢問開源意義,DeepSeek回答稱,可以理解為專門給高性能顯卡(比如英偉達(dá)的Hopper系列GPU)設(shè)計(jì)的“加速神器”,用來提高AI處理任務(wù)的效率。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          DeepSeek舉例,假如開了一家快遞分揀站,每天要處理不同大小的包裹,傳統(tǒng)方法是用固定大小的筐子裝,小包裹浪費(fèi)空間,大包裹又得分筐裝,效率很低。而FlashMLA就像一套“智能分揀系統(tǒng)”,能自動(dòng)根據(jù)包裹大小調(diào)整筐子尺寸,讓所有包裹快速、整齊地裝車,既省時(shí)間又省錢。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          馬斯克旗下xAI的大模型Grok3則評價(jià)稱,F(xiàn)lashMLA表明DeepSeek在AI硬件加速領(lǐng)域有深厚積累。MLA本身是他們的創(chuàng)新,而 FlashMLA則是將這種創(chuàng)新落地到硬件的具體實(shí)現(xiàn),性能指標(biāo)(3000GB/s和580TFLOPS)足以媲美業(yè)界頂尖方案(如 FlashAttention)。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          Grok3 稱,“想象你有個(gè)超級聰明的 AI,但它跑得不夠快,因?yàn)槊看翁幚砭渥訒r(shí)都要浪費(fèi)很多時(shí)間搬數(shù)據(jù)和算復(fù)雜的數(shù)學(xué)題。FlashMLA 就像給AI加了個(gè)‘渦輪增壓引擎’,專門裝在英偉達(dá)的Hopper GPU上。它能讓AI用更少的內(nèi)存、更快的速度處理各種長短不一的句子,開源之后,AI開發(fā)會(huì)變得更快、更省錢。”BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          作為開源大模型,DeepSeek的火爆已經(jīng)帶動(dòng)了開源成為如今的AI產(chǎn)業(yè)新趨勢。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋在2025全球開發(fā)者先鋒大會(huì)(GDC)上表示,盡管當(dāng)前閉源的份額仍然超過開源的份額,但接下來一兩年將劇烈變化,平衡開源與閉源,引領(lǐng)未來。“大模型時(shí)代,開源并沒有像以往那么多、那么快,我想,通過上海的努力,我相信開源這件事情會(huì)越做越好。中國的團(tuán)隊(duì)、上海的團(tuán)隊(duì)一定會(huì)引領(lǐng)開源潮流。”BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          頭部大廠紛紛跟進(jìn)開源潮流。2月21日,據(jù)阿里巴巴通義實(shí)驗(yàn)室科學(xué)家黃斐介紹,到目前為止,整個(gè)通義千問(Qwen)系列模型的下載量達(dá)到了1.8億,累計(jì)衍生模型總數(shù)達(dá)到9萬個(gè),衍生模型數(shù)已經(jīng)超越Meta的Llama系列,成為了全球第一大開源模型系列。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          百度宣布將在未來幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源;文心一言自4月1日起全面免費(fèi),所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型。BWm流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          本文鏈接:DeepSeek開源FlashMLA,意味著什么?http://m.lensthegame.com/show-11-17754-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 2025年研考國家線發(fā)布

          下一篇: 航空工業(yè)集團(tuán)原董事長譚瑞松被開除黨籍

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲AV无码一区二三区| 一区二区三区在线免费观看视频| 日韩免费一区二区三区在线| 精品国产日韩亚洲一区91| 亚洲Av无码一区二区二三区| 国产午夜精品一区二区三区极品 | 中文字幕AV一区二区三区| 成人精品一区久久久久| 97久久精品午夜一区二区| 无码aⅴ精品一区二区三区浪潮| 亚洲视频一区在线| 人妻夜夜爽天天爽一区| 国产精品一区12p| 毛片一区二区三区| 日本夜爽爽一区二区三区| 久久国产精品一区免费下载| 国产精品无码一区二区三区不卡 | 2021国产精品视频一区| 日韩一区二区三区免费播放| 亚洲欧洲一区二区| 精品人妻一区二区三区四区| 久久国产精品一区二区| 久久精品成人一区二区三区| 波多野结衣的AV一区二区三区| 91精品一区二区| 亚洲一区二区三区在线视频| 精品亚洲A∨无码一区二区三区| 国产一区精品视频| 午夜精品一区二区三区免费视频| 在线一区二区三区| 无码一区二区三区老色鬼| 精品乱人伦一区二区| 亚洲一区免费视频| 中文字幕一区二区三区有限公司| 亚洲欧美一区二区三区日产| 国产精品毛片一区二区三区| 全国精品一区二区在线观看| 中文字幕无码不卡一区二区三区| 国产综合一区二区在线观看 | 国产精品538一区二区在线| 亚洲色无码一区二区三区|