國產(chǎn)AI公司深度求索(DeepSeek)開源周正式啟動(dòng),并公布首個(gè)開源代碼。
2月24日,DeepSeek宣布啟動(dòng)“開源周”,首個(gè)開源的代碼庫為FlashMLA,這是針對Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,針對可變長度序列作了優(yōu)化,目前已投入生產(chǎn)。
此前2月21日午間,DeepSeek宣布,從下周開始,他們將開源5個(gè)代碼庫,以完全透明的方式與全球開發(fā)者社區(qū)分享他們的研究進(jìn)展,每日都有新內(nèi)容解鎖,進(jìn)一步分享新的進(jìn)展,并將這一計(jì)劃定義為“Open Source Week”。
根據(jù)DeepSeek在社交媒體上的內(nèi)容,在H800上可以實(shí)現(xiàn)每秒處理3000GB數(shù)據(jù),每秒執(zhí)行580萬億次浮點(diǎn)運(yùn)算。
Hopper是英偉達(dá)的GPU(圖形處理芯片)架構(gòu),例如H100和H800,發(fā)布于2022年,主要用于AI計(jì)算。
有意思的是,如果把這段內(nèi)容交給DeepSeek網(wǎng)頁版,詢問開源意義,DeepSeek回答稱,可以理解為專門給高性能顯卡(比如英偉達(dá)的Hopper系列GPU)設(shè)計(jì)的“加速神器”,用來提高AI處理任務(wù)的效率。
DeepSeek舉例,假如開了一家快遞分揀站,每天要處理不同大小的包裹,傳統(tǒng)方法是用固定大小的筐子裝,小包裹浪費(fèi)空間,大包裹又得分筐裝,效率很低。而FlashMLA就像一套“智能分揀系統(tǒng)”,能自動(dòng)根據(jù)包裹大小調(diào)整筐子尺寸,讓所有包裹快速、整齊地裝車,既省時(shí)間又省錢。
馬斯克旗下xAI的大模型Grok3則評價(jià)稱,F(xiàn)lashMLA表明DeepSeek在AI硬件加速領(lǐng)域有深厚積累。MLA本身是他們的創(chuàng)新,而 FlashMLA則是將這種創(chuàng)新落地到硬件的具體實(shí)現(xiàn),性能指標(biāo)(3000GB/s和580TFLOPS)足以媲美業(yè)界頂尖方案(如 FlashAttention)。
Grok3 稱,“想象你有個(gè)超級聰明的 AI,但它跑得不夠快,因?yàn)槊看翁幚砭渥訒r(shí)都要浪費(fèi)很多時(shí)間搬數(shù)據(jù)和算復(fù)雜的數(shù)學(xué)題。FlashMLA 就像給AI加了個(gè)‘渦輪增壓引擎’,專門裝在英偉達(dá)的Hopper GPU上。它能讓AI用更少的內(nèi)存、更快的速度處理各種長短不一的句子,開源之后,AI開發(fā)會(huì)變得更快、更省錢。”
作為開源大模型,DeepSeek的火爆已經(jīng)帶動(dòng)了開源成為如今的AI產(chǎn)業(yè)新趨勢。
香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋在2025全球開發(fā)者先鋒大會(huì)(GDC)上表示,盡管當(dāng)前閉源的份額仍然超過開源的份額,但接下來一兩年將劇烈變化,平衡開源與閉源,引領(lǐng)未來。“大模型時(shí)代,開源并沒有像以往那么多、那么快,我想,通過上海的努力,我相信開源這件事情會(huì)越做越好。中國的團(tuán)隊(duì)、上海的團(tuán)隊(duì)一定會(huì)引領(lǐng)開源潮流。”
頭部大廠紛紛跟進(jìn)開源潮流。2月21日,據(jù)阿里巴巴通義實(shí)驗(yàn)室科學(xué)家黃斐介紹,到目前為止,整個(gè)通義千問(Qwen)系列模型的下載量達(dá)到了1.8億,累計(jì)衍生模型總數(shù)達(dá)到9萬個(gè),衍生模型數(shù)已經(jīng)超越Meta的Llama系列,成為了全球第一大開源模型系列。
百度宣布將在未來幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源;文心一言自4月1日起全面免費(fèi),所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型。
本文鏈接:DeepSeek開源FlashMLA,意味著什么?http://m.lensthegame.com/show-11-17754-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 2025年研考國家線發(fā)布