21觀察｜DeepSeek崛起：中國(guó)奇跡重構(gòu)AI敘事

2025-01-29 11:16:46 來(lái)源：

觀看：79

21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗北京報(bào)道

一支來(lái)自“中國(guó)的神秘力量”，一再震撼硅谷和華爾街，以算法打破了算力神話，重構(gòu)AI敘事。

當(dāng)?shù)貢r(shí)間1月27日，美股芯片板塊大幅調(diào)整，英偉達(dá)暴跌16.86%，創(chuàng)市值最大蒸發(fā)紀(jì)錄；博通大跌逾17%，甲骨文下跌近14%，納斯達(dá)克下挫3.07%。

很多投資者將這次的調(diào)整歸因于DeepSeek的崛起。這家位于杭州的人工智能公司，最近推出了最新開源大模型R1，其性能直追OpenAI大模型o1。

該公司去年12月推出的大模型DeepSeek-V3，多項(xiàng)測(cè)試性能比肩Anthropic的Claude-3.5和OpenAI的閉源模型GPT-4o，個(gè)別項(xiàng)目甚至有所超越。

正當(dāng)一批AI分析師認(rèn)為DeepSeek只聚焦于語(yǔ)言大模型而暫時(shí)放棄開發(fā)多模態(tài)模型時(shí)，該公司卻于1月28日發(fā)布了一款多模態(tài)大模型Janus-Pro，而該模型在圖像生成基準(zhǔn)測(cè)試中超過了OpenAI的DALL-E3，令人驚艷。

最令硅谷震驚的是，DeepSeek的開源大模型，性能卓越，卻是在更低成本、更短時(shí)間、更少算力的基礎(chǔ)上實(shí)現(xiàn)的。V3和R1的訓(xùn)練成本均只有550萬(wàn)美元左右，不及Anthropic和OpenAI同類模型成本的十分之一。

1月27日，DeepSeek登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)App下載排行榜，超越了ChatGPT。

這當(dāng)然是不折不扣的奇跡。

美國(guó)總統(tǒng)特朗普當(dāng)?shù)貢r(shí)間27日在佛羅里達(dá)州邁阿密舉行的共和黨會(huì)議上表示，中國(guó)人工智能初創(chuàng)公司DeepSeek的崛起應(yīng)當(dāng)為美國(guó)企業(yè)敲響“警鐘”，“這可能是非常積極的發(fā)展。因此，與其投入數(shù)十億資金，不如花費(fèi)更少的（資源），但愿能得出同樣的解決方案?！?span style="display:none">gAh流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

人工智能國(guó)際大佬又是如何看待這一奇跡？

微軟首席執(zhí)行官薩蒂亞·納德拉（Satya Nadella）日前在達(dá)沃斯世界經(jīng)濟(jì)論壇上談到DeepSeek時(shí)表示：“DeepSeek的新模型令人印象深刻，他們不僅有效地構(gòu)建了一個(gè)開源模型，能夠在推理計(jì)算時(shí)高效運(yùn)行，而且在計(jì)算效率方面表現(xiàn)出色。我們必須非常非常認(rèn)真地對(duì)待中國(guó)的AI進(jìn)步?！?span style="display:none">gAh流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

創(chuàng)立于2022年的Perplexity，估值90億美元，是僅次于Anthropic和OpenAI等第一梯隊(duì)的人工智能新創(chuàng)企業(yè)。近日，Perplexity首席執(zhí)行官Aravind Srinivas（阿拉溫德·斯里尼瓦斯）在一次訪談中詳談了對(duì)DeepSeek的看法。

斯里尼瓦斯表示，需求是發(fā)明之母。由于硬件資源條件受限，中國(guó)企業(yè)不得不尋找變通方案，最終，“他們（DeepSeek）以更高效、更低成本的方式開發(fā)了類似（Anthropic和OpenAI）的技術(shù)。這確實(shí)讓人感到壓力”。如果說Meta正在趕上OpenAI或Anthropic，那么同樣的說法也可以用于中國(guó)趕上美國(guó)。

但是，為DeepSeek的成就感到興奮自豪之余，也要對(duì)世界人工智能永不停歇的發(fā)展勢(shì)頭保持客觀理性的認(rèn)識(shí)，不可盲目自滿。記者近期采訪了多位國(guó)內(nèi)專家和相關(guān)從業(yè)人員、投資者，關(guān)于DeepSeek現(xiàn)象，有以下共識(shí)：

其一，V3和R1的重大突破，并不能證明算力不重要。

近幾年以O(shè)penAI為代表的美國(guó)人工智能發(fā)展，是建立在更強(qiáng)的算力、更大的參數(shù)、更高的成本之上。某種程度上，它可稱之為人工智能的“硅谷敘事”。這個(gè)粗放豪橫的模式講到極致，就是5000億美元的星際之門計(jì)劃。

但中國(guó)企業(yè)無(wú)法獲得高性能的芯片，也沒有那么多的資金。客觀條件受限，只能在底層算力基礎(chǔ)上進(jìn)行架構(gòu)、算法和數(shù)據(jù)利用方面的探索，在特定領(lǐng)域走出一條高效率、低成本的實(shí)用主義路子。

這條路子就是如浙江大學(xué)計(jì)算機(jī)博士、美國(guó)南加州大學(xué)訪問學(xué)者傅聰所說的，在“后訓(xùn)練”過程中，通過學(xué)習(xí)CoT（思維鏈）的方式，一步一步推理得出結(jié)果，而不是直接預(yù)測(cè)答案，“這一方案，也是圈子內(nèi)對(duì)OpenAI o1模型實(shí)現(xiàn)路徑的猜測(cè)，而Deepseek用極快的速度，驗(yàn)證了這一路徑的可行性！”

事實(shí)上，DeepSeek創(chuàng)始人梁文鋒透露，此前該公司已儲(chǔ)備了萬(wàn)張A100芯片等。這比一般初創(chuàng)公司強(qiáng)多了。只不過，在開發(fā)V3和R1時(shí)，由于效率超出預(yù)期，他們無(wú)須使用那么多算力罷了。

其二，英偉達(dá)等芯片股的調(diào)整，主要是市場(chǎng)風(fēng)險(xiǎn)的釋放，與DeepSeek的重大突破之間，邏輯上沒有必然聯(lián)系。

以英偉達(dá)為代表的人工智能板塊，已持續(xù)上漲幾年。中間雖然偶有波動(dòng)，但調(diào)整并不充分。英偉達(dá)PE長(zhǎng)期橫移在40倍上方，17日收盤后仍有45倍。

1月17日納斯達(dá)克芯片股的大跌，更多是在高估值風(fēng)險(xiǎn)預(yù)期之下一種市場(chǎng)情緒的釋放。DeepSeek只是提供或者觸發(fā)了風(fēng)險(xiǎn)情緒釋放的媒介?，F(xiàn)在沒有證據(jù)足以表明，全球算力尤其是高端算力資源已經(jīng)過剩。更大的可能是，如果2025年打開了人工智能應(yīng)用的空間，算力需求也會(huì)隨之增加，只不過，像DeepSeek這樣高效率利用算力，將會(huì)被更多企業(yè)借鑒。AI硬件仍有很大的增長(zhǎng)空間，算力敘事沒有過時(shí)。

當(dāng)?shù)貢r(shí)間1月27日，英偉達(dá)發(fā)表聲明表示，DeepSeek所取得的進(jìn)展，顯示出其芯片在中國(guó)市場(chǎng)的實(shí)用價(jià)值，且未來(lái)為滿足DeepSeek的服務(wù)需求，將需要更多英偉達(dá)芯片。

其三，探索與追趕：中國(guó)企業(yè)的創(chuàng)新能力在增強(qiáng)。

梁文鋒去年7月在接受媒體采訪時(shí)說，硅谷習(xí)慣于將中國(guó)AI公司視為follow的角色，當(dāng)一個(gè)中國(guó)公司以創(chuàng)新貢獻(xiàn)者的身份，加入到他們游戲里去，而且表現(xiàn)優(yōu)異時(shí)，他們就很震驚。

毫無(wú)疑問，在大模型開發(fā)路徑上，DeepSeek扮演了一種創(chuàng)新者的角色，亦即低成本、少算力的高效集成之路。

作為追趕者，存在后發(fā)優(yōu)勢(shì)。1月26日，在拾象創(chuàng)始人兼CEO李廣密組織的關(guān)于 DeepSeek的閉門討論會(huì)上，專家提出，AI 類似階躍函數(shù)，現(xiàn)在做追趕者的算力需求少了 10 倍。追趕者的算力成本一直不太高，而探索者還是要訓(xùn)練很多模型，有大量試錯(cuò)成本。

后發(fā)者可以聰明地進(jìn)行創(chuàng)新。舉個(gè)例子。大模型開發(fā)需要龐大的數(shù)據(jù)集（數(shù)據(jù)庫(kù)）。而數(shù)據(jù)有沒有標(biāo)注，其精確度是不一樣的。前述專家透露，DeepSeek 非常重視數(shù)據(jù)標(biāo)注，聽說梁文鋒自己也會(huì)打標(biāo)簽，這就大大提高了他們數(shù)據(jù)的精確度。再比如，DeepSeek還善于做數(shù)據(jù)蒸餾（優(yōu)化篩選），當(dāng)然如果是開發(fā)通用大模型就不能做數(shù)據(jù)蒸餾。這些都是?該公司Post-training更高效率的體現(xiàn)。

DeepSeek給國(guó)內(nèi)同行的其他啟示還包括，大模型開發(fā)在降低成本的同時(shí)也可以探索智能的邊界，在Transformer之外尋找其他架構(gòu)；產(chǎn)品上，AI agent在未獲得大規(guī)模應(yīng)用之前，有很大的探索空間，存在多領(lǐng)域商用的機(jī)會(huì)，今年在多模態(tài)方面，可能會(huì)出現(xiàn)能挑戰(zhàn)ChatGPT形態(tài)的產(chǎn)品。

硅谷一位華裔資深A(yù)I工程師對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者說，DeepSeek以低成本、高效率開發(fā)了幾款了不起的產(chǎn)品，探索出了一條全新的路徑，讓國(guó)際同行也不得不佩服，但我們?cè)谧院乐啵惨陀^認(rèn)識(shí)到，DeepSeek等中國(guó)AI新創(chuàng)企業(yè)，目前還不具備全面挑戰(zhàn)OpenAI、Anthropic這些巨頭的實(shí)力。人工智能的競(jìng)爭(zhēng)才剛剛開始，前面有無(wú)限可能。

本文鏈接：21觀察｜DeepSeek崛起：中國(guó)奇跡重構(gòu)AI敘事http://m.lensthegame.com/show-2-10399-0.html

聲明：本網(wǎng)站為非營(yíng)利性網(wǎng)站，本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任，僅提供存儲(chǔ)服務(wù)。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：量子材料領(lǐng)域十年難題獲破解，理想外爾半金屬首次合成

下一篇：布局?jǐn)?shù)據(jù)產(chǎn)業(yè)、叫停政府?dāng)?shù)據(jù)“轉(zhuǎn)讓”……屬于數(shù)據(jù)人的2024十大歷史events

21觀察｜DeepSeek崛起：中國(guó)奇跡重構(gòu)AI敘事

熱門資訊

推薦資訊

科技最熱文章