ai芯片市場(chǎng)前景「業(yè)內(nèi)：過去數(shù)月老款A(yù)I芯片降價(jià)，大模型培訓(xùn)成本降60%」

2024-01-26 11:19:21 來源：

觀看：161

1月24日消息，眾所周知，開發(fā)大語(yǔ)言模型（LLM）成本高昂。這不僅包括模型本身的研發(fā)，還有在云端運(yùn)行這些模型的費(fèi)用。以人工智能初創(chuàng)公司Anthropic為例，云端運(yùn)行模型的成本幾乎占了該公司上個(gè)月收入的一半以上，這還未算上訓(xùn)練模型的成本。

然而，最近的技術(shù)進(jìn)步有望降低大語(yǔ)言模型的開發(fā)和運(yùn)行成本。目前尚不清楚這是否足以將大語(yǔ)言模型開發(fā)轉(zhuǎn)變?yōu)楦呃麧?rùn)的軟件業(yè)務(wù)，但它應(yīng)該有助于緩解許多最緊迫的成本問題。

以Writer為例，這家初創(chuàng)公司專門為企業(yè)開發(fā)人工智能工具。該公司聯(lián)合創(chuàng)始人兼首席技術(shù)官瓦西姆·阿爾謝赫（Waseem Alshikh）表示，過去三到四個(gè)月，一些老式人工智能芯片（如英偉達(dá)A100 GPU）的價(jià)格不斷下滑，幫助他們將模型培訓(xùn)成本降低了約60%。此外，英偉達(dá)還優(yōu)化了軟件性能，幫助開發(fā)者在這些芯片上更快地訓(xùn)練和運(yùn)行大型模型。

但與此同時(shí)，隨著云計(jì)算服務(wù)提供商推出更多H100芯片，Writer開始使用更多英偉達(dá)新款芯片來訓(xùn)練大語(yǔ)言模型。阿爾謝赫指出，這些較新的芯片價(jià)格高昂，但在模型訓(xùn)練方面比A100更快。

開發(fā)者還利用各種新的培訓(xùn)技術(shù)和配置來降低成本。像GPT-4這樣的大型語(yǔ)言模型實(shí)際上是由多個(gè)“專家”模型組成的，而非一個(gè)龐大的模型，每個(gè)模型專攻不同主題。這種混合專家系統(tǒng)（Mixture of Experts，簡(jiǎn)稱MoE或ME）的計(jì)算效率更高，因?yàn)椴樵儍H觸發(fā)模型的某些部分，而非整個(gè)模型。

其他技術(shù)，如量化和大語(yǔ)言模型的低階自適應(yīng)，使得訓(xùn)練和調(diào)整模型的成本更低，且對(duì)模型性能影響微乎其微。

大語(yǔ)言模型開發(fā)者還找到了更高效利用硬件的方法。谷歌研究人員估計(jì)，在訓(xùn)練GPT-3時(shí)，OpenAI的GPU大約有80%的時(shí)間處于閑置狀態(tài)，等待數(shù)據(jù)輸入。換句話說，它并未充分利用GPU資源。然而，GPU經(jīng)銷商Together的首席科學(xué)家特里·道（Tri Dao）表示，通過采用名為FlashAttention-2的不同技術(shù)，可將閑置時(shí)間縮短至30%左右。眾多開發(fā)者已開始利用這項(xiàng)技術(shù)，包括法國(guó)人工智能初創(chuàng)公司Mistral。

盡管人工智能開發(fā)人員擁有眾多降低成本的工具，但并不意味著他們會(huì)全都使用。OpenAI、Anthropic等前沿模型的開發(fā)商追求卓越的芯片、人才和數(shù)據(jù)資源，因此他們可能會(huì)暫時(shí)擱置利潤(rùn)率目標(biāo)。

例如，F(xiàn)acebook母公司Meta首席執(zhí)行官馬克·扎克伯格（Mark Zuckerberg）宣布，該公司計(jì)劃在今年年底前獲得3.5萬個(gè)H100 GPU（總成本超過70億美元）。這表明，實(shí)力雄厚的公司正不惜重金購(gòu)買尖端芯片，即便老款GPU價(jià)格更為親民。

此外，我們切勿忽視獲取新數(shù)據(jù)以訓(xùn)練大語(yǔ)言模型的成本。像OpenAI和蘋果等公司從出版商那里獲得內(nèi)容授權(quán)的費(fèi)用看似微不足道，但未來可能會(huì)大幅增長(zhǎng)。盡管大語(yǔ)言模型正逐步生成用于新模型的“合成”訓(xùn)練數(shù)據(jù)，但仍有許多高質(zhì)量信息是它們無法復(fù)制的。（小小）

本文鏈接：ai芯片市場(chǎng)前景「業(yè)內(nèi)：過去數(shù)月老款A(yù)I芯片降價(jià)，大模型培訓(xùn)成本降60%」http://m.lensthegame.com/show-3-7955-0.html

聲明：本網(wǎng)站為非營(yíng)利性網(wǎng)站，本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：矢量圖標(biāo)設(shè)計(jì)軟件「設(shè)計(jì)提效丨你要的免費(fèi)商用高質(zhì)量矢量圖標(biāo)庫(kù)來啦!」

下一篇：短劇投手掌錢：“揮金如土”，一晚虧10萬_投手是干什么的

ai芯片市場(chǎng)前景「業(yè)內(nèi)：過去數(shù)月老款A(yù)I芯片降價(jià)，大模型培訓(xùn)成本降60%」

熱門資訊

推薦資訊

財(cái)經(jīng)最熱文章