21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 北京報(bào)道
一支來(lái)自“中國(guó)的神秘力量”,一再震撼硅谷和華爾街,以算法打破了算力神話,重構(gòu)AI敘事。
當(dāng)?shù)貢r(shí)間1月27日,美股芯片板塊大幅調(diào)整,英偉達(dá)暴跌16.86%,創(chuàng)市值最大蒸發(fā)紀(jì)錄;博通大跌逾17%,甲骨文下跌近14%,納斯達(dá)克下挫3.07%。
很多投資者將這次的調(diào)整歸因于DeepSeek的崛起。這家位于杭州的人工智能公司,最近推出了最新開源大模型R1,其性能直追OpenAI大模型o1。
該公司去年12月推出的大模型DeepSeek-V3,多項(xiàng)測(cè)試性能比肩Anthropic的Claude-3.5和OpenAI的閉源模型GPT-4o,個(gè)別項(xiàng)目甚至有所超越。
正當(dāng)一批AI分析師認(rèn)為DeepSeek只聚焦于語(yǔ)言大模型而暫時(shí)放棄開發(fā)多模態(tài)模型時(shí),該公司卻于1月28日發(fā)布了一款多模態(tài)大模型Janus-Pro,而該模型在圖像生成基準(zhǔn)測(cè)試中超過了OpenAI的DALL-E3,令人驚艷。
最令硅谷震驚的是,DeepSeek的開源大模型,性能卓越,卻是在更低成本、更短時(shí)間、更少算力的基礎(chǔ)上實(shí)現(xiàn)的。V3和R1的訓(xùn)練成本均只有550萬(wàn)美元左右,不及Anthropic和OpenAI同類模型成本的十分之一。
1月27日,DeepSeek登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)App下載排行榜,超越了ChatGPT。
這當(dāng)然是不折不扣的奇跡。
美國(guó)總統(tǒng)特朗普當(dāng)?shù)貢r(shí)間27日在佛羅里達(dá)州邁阿密舉行的共和黨會(huì)議上表示,中國(guó)人工智能初創(chuàng)公司DeepSeek的崛起應(yīng)當(dāng)為美國(guó)企業(yè)敲響“警鐘”,“這可能是非常積極的發(fā)展。因此,與其投入數(shù)十億資金,不如花費(fèi)更少的(資源),但愿能得出同樣的解決方案?!?span style="display:none">gAh流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM
人工智能國(guó)際大佬又是如何看待這一奇跡?
微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)日前在達(dá)沃斯世界經(jīng)濟(jì)論壇上談到DeepSeek時(shí)表示:“DeepSeek的新模型令人印象深刻,他們不僅有效地構(gòu)建了一個(gè)開源模型,能夠在推理計(jì)算時(shí)高效運(yùn)行,而且在計(jì)算效率方面表現(xiàn)出色。我們必須非常非常認(rèn)真地對(duì)待中國(guó)的AI進(jìn)步?!?span style="display:none">gAh流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM
創(chuàng)立于2022年的Perplexity,估值90億美元,是僅次于Anthropic和OpenAI等第一梯隊(duì)的人工智能新創(chuàng)企業(yè)。近日,Perplexity首席執(zhí)行官Aravind Srinivas(阿拉溫德·斯里尼瓦斯)在一次訪談中詳談了對(duì)DeepSeek的看法。
斯里尼瓦斯表示,需求是發(fā)明之母。由于硬件資源條件受限,中國(guó)企業(yè)不得不尋找變通方案,最終,“他們(DeepSeek)以更高效、更低成本的方式開發(fā)了類似(Anthropic和OpenAI)的技術(shù)。這確實(shí)讓人感到壓力”。如果說Meta正在趕上OpenAI或Anthropic,那么同樣的說法也可以用于中國(guó)趕上美國(guó)。
但是,為DeepSeek的成就感到興奮自豪之余,也要對(duì)世界人工智能永不停歇的發(fā)展勢(shì)頭保持客觀理性的認(rèn)識(shí),不可盲目自滿。記者近期采訪了多位國(guó)內(nèi)專家和相關(guān)從業(yè)人員、投資者,關(guān)于DeepSeek現(xiàn)象,有以下共識(shí):
其一,V3和R1的重大突破,并不能證明算力不重要。
近幾年以O(shè)penAI為代表的美國(guó)人工智能發(fā)展,是建立在更強(qiáng)的算力、更大的參數(shù)、更高的成本之上。某種程度上,它可稱之為人工智能的“硅谷敘事”。這個(gè)粗放豪橫的模式講到極致,就是5000億美元的星際之門計(jì)劃。
但中國(guó)企業(yè)無(wú)法獲得高性能的芯片,也沒有那么多的資金。客觀條件受限,只能在底層算力基礎(chǔ)上進(jìn)行架構(gòu)、算法和數(shù)據(jù)利用方面的探索,在特定領(lǐng)域走出一條高效率、低成本的實(shí)用主義路子。
這條路子就是如浙江大學(xué)計(jì)算機(jī)博士、美國(guó)南加州大學(xué)訪問學(xué)者傅聰所說的,在“后訓(xùn)練”過程中,通過學(xué)習(xí)CoT(思維鏈)的方式,一步一步推理得出結(jié)果,而不是直接預(yù)測(cè)答案,“這一方案,也是圈子內(nèi)對(duì)OpenAI o1模型實(shí)現(xiàn)路徑的猜測(cè),而Deepseek用極快的速度,驗(yàn)證了這一路徑的可行性!”
事實(shí)上,DeepSeek創(chuàng)始人梁文鋒透露,此前該公司已儲(chǔ)備了萬(wàn)張A100芯片等。這比一般初創(chuàng)公司強(qiáng)多了。只不過,在開發(fā)V3和R1時(shí),由于效率超出預(yù)期,他們無(wú)須使用那么多算力罷了。
其二,英偉達(dá)等芯片股的調(diào)整,主要是市場(chǎng)風(fēng)險(xiǎn)的釋放,與DeepSeek的重大突破之間,邏輯上沒有必然聯(lián)系。
以英偉達(dá)為代表的人工智能板塊,已持續(xù)上漲幾年。中間雖然偶有波動(dòng),但調(diào)整并不充分。英偉達(dá)PE長(zhǎng)期橫移在40倍上方,17日收盤后仍有45倍。
1月17日納斯達(dá)克芯片股的大跌,更多是在高估值風(fēng)險(xiǎn)預(yù)期之下一種市場(chǎng)情緒的釋放。DeepSeek只是提供或者觸發(fā)了風(fēng)險(xiǎn)情緒釋放的媒介?,F(xiàn)在沒有證據(jù)足以表明,全球算力尤其是高端算力資源已經(jīng)過剩。更大的可能是,如果2025年打開了人工智能應(yīng)用的空間,算力需求也會(huì)隨之增加,只不過,像DeepSeek這樣高效率利用算力,將會(huì)被更多企業(yè)借鑒。AI硬件仍有很大的增長(zhǎng)空間,算力敘事沒有過時(shí)。
當(dāng)?shù)貢r(shí)間1月27日,英偉達(dá)發(fā)表聲明表示,DeepSeek所取得的進(jìn)展,顯示出其芯片在中國(guó)市場(chǎng)的實(shí)用價(jià)值,且未來(lái)為滿足DeepSeek的服務(wù)需求,將需要更多英偉達(dá)芯片。
其三,探索與追趕:中國(guó)企業(yè)的創(chuàng)新能力在增強(qiáng)。
梁文鋒去年7月在接受媒體采訪時(shí)說,硅谷習(xí)慣于將中國(guó)AI公司視為follow的角色,當(dāng)一個(gè)中國(guó)公司以創(chuàng)新貢獻(xiàn)者的身份,加入到他們游戲里去,而且表現(xiàn)優(yōu)異時(shí),他們就很震驚。
毫無(wú)疑問,在大模型開發(fā)路徑上,DeepSeek扮演了一種創(chuàng)新者的角色,亦即低成本、少算力的高效集成之路。
作為追趕者,存在后發(fā)優(yōu)勢(shì)。1月26日,在拾象創(chuàng)始人兼CEO李廣密組織的關(guān)于 DeepSeek的閉門討論會(huì)上,專家提出,AI 類似階躍函數(shù),現(xiàn)在做追趕者的算力需求少了 10 倍。追趕者的算力成本一直不太高,而探索者還是要訓(xùn)練很多模型,有大量試錯(cuò)成本。
后發(fā)者可以聰明地進(jìn)行創(chuàng)新。舉個(gè)例子。大模型開發(fā)需要龐大的數(shù)據(jù)集(數(shù)據(jù)庫(kù))。而數(shù)據(jù)有沒有標(biāo)注,其精確度是不一樣的。前述專家透露,DeepSeek 非常重視數(shù)據(jù)標(biāo)注,聽說梁文鋒自己也會(huì)打標(biāo)簽,這就大大提高了他們數(shù)據(jù)的精確度。再比如,DeepSeek還善于做數(shù)據(jù)蒸餾(優(yōu)化篩選),當(dāng)然如果是開發(fā)通用大模型就不能做數(shù)據(jù)蒸餾。這些都是?該公司Post-training更高效率的體現(xiàn)。
DeepSeek給國(guó)內(nèi)同行的其他啟示還包括,大模型開發(fā)在降低成本的同時(shí)也可以探索智能的邊界,在Transformer之外尋找其他架構(gòu);產(chǎn)品上,AI agent在未獲得大規(guī)模應(yīng)用之前,有很大的探索空間,存在多領(lǐng)域商用的機(jī)會(huì),今年在多模態(tài)方面,可能會(huì)出現(xiàn)能挑戰(zhàn)ChatGPT形態(tài)的產(chǎn)品。
硅谷一位華裔資深A(yù)I工程師對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者說,DeepSeek以低成本、高效率開發(fā)了幾款了不起的產(chǎn)品,探索出了一條全新的路徑,讓國(guó)際同行也不得不佩服,但我們?cè)谧院乐啵惨陀^認(rèn)識(shí)到,DeepSeek等中國(guó)AI新創(chuàng)企業(yè),目前還不具備全面挑戰(zhàn)OpenAI、Anthropic這些巨頭的實(shí)力。人工智能的競(jìng)爭(zhēng)才剛剛開始,前面有無(wú)限可能。
本文鏈接:21觀察|DeepSeek崛起:中國(guó)奇跡重構(gòu)AI敘事http://m.lensthegame.com/show-2-10399-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任,僅提供存儲(chǔ)服務(wù)。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 量子材料領(lǐng)域十年難題獲破解,理想外爾半金屬首次合成
下一篇: 布局?jǐn)?shù)據(jù)產(chǎn)業(yè)、叫停政府?dāng)?shù)據(jù)“轉(zhuǎn)讓”……屬于數(shù)據(jù)人的2024十大歷史events