設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          ai芯片市場(chǎng)前景「業(yè)內(nèi):過去數(shù)月老款A(yù)I芯片降價(jià),大模型培訓(xùn)成本降60%」

          2024-01-26 11:19:21 來源:

          RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          1月24日消息,眾所周知,開發(fā)大語(yǔ)言模型(LLM)成本高昂。這不僅包括模型本身的研發(fā),還有在云端運(yùn)行這些模型的費(fèi)用。以人工智能初創(chuàng)公司Anthropic為例,云端運(yùn)行模型的成本幾乎占了該公司上個(gè)月收入的一半以上,這還未算上訓(xùn)練模型的成本。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          然而,最近的技術(shù)進(jìn)步有望降低大語(yǔ)言模型的開發(fā)和運(yùn)行成本。目前尚不清楚這是否足以將大語(yǔ)言模型開發(fā)轉(zhuǎn)變?yōu)楦呃麧?rùn)的軟件業(yè)務(wù),但它應(yīng)該有助于緩解許多最緊迫的成本問題。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          以Writer為例,這家初創(chuàng)公司專門為企業(yè)開發(fā)人工智能工具。該公司聯(lián)合創(chuàng)始人兼首席技術(shù)官瓦西姆·阿爾謝赫(Waseem Alshikh)表示,過去三到四個(gè)月,一些老式人工智能芯片(如英偉達(dá)A100 GPU)的價(jià)格不斷下滑,幫助他們將模型培訓(xùn)成本降低了約60%。此外,英偉達(dá)還優(yōu)化了軟件性能,幫助開發(fā)者在這些芯片上更快地訓(xùn)練和運(yùn)行大型模型。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          但與此同時(shí),隨著云計(jì)算服務(wù)提供商推出更多H100芯片,Writer開始使用更多英偉達(dá)新款芯片來訓(xùn)練大語(yǔ)言模型。阿爾謝赫指出,這些較新的芯片價(jià)格高昂,但在模型訓(xùn)練方面比A100更快。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          開發(fā)者還利用各種新的培訓(xùn)技術(shù)和配置來降低成本。像GPT-4這樣的大型語(yǔ)言模型實(shí)際上是由多個(gè)“專家”模型組成的,而非一個(gè)龐大的模型,每個(gè)模型專攻不同主題。這種混合專家系統(tǒng)(Mixture of Experts,簡(jiǎn)稱MoE或ME)的計(jì)算效率更高,因?yàn)椴樵儍H觸發(fā)模型的某些部分,而非整個(gè)模型。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          其他技術(shù),如量化和大語(yǔ)言模型的低階自適應(yīng),使得訓(xùn)練和調(diào)整模型的成本更低,且對(duì)模型性能影響微乎其微。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          大語(yǔ)言模型開發(fā)者還找到了更高效利用硬件的方法。谷歌研究人員估計(jì),在訓(xùn)練GPT-3時(shí),OpenAI的GPU大約有80%的時(shí)間處于閑置狀態(tài),等待數(shù)據(jù)輸入。換句話說,它并未充分利用GPU資源。然而,GPU經(jīng)銷商Together的首席科學(xué)家特里·道(Tri Dao)表示,通過采用名為FlashAttention-2的不同技術(shù),可將閑置時(shí)間縮短至30%左右。眾多開發(fā)者已開始利用這項(xiàng)技術(shù),包括法國(guó)人工智能初創(chuàng)公司Mistral。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          盡管人工智能開發(fā)人員擁有眾多降低成本的工具,但并不意味著他們會(huì)全都使用。OpenAI、Anthropic等前沿模型的開發(fā)商追求卓越的芯片、人才和數(shù)據(jù)資源,因此他們可能會(huì)暫時(shí)擱置利潤(rùn)率目標(biāo)。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          例如,F(xiàn)acebook母公司Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)宣布,該公司計(jì)劃在今年年底前獲得3.5萬個(gè)H100 GPU(總成本超過70億美元)。這表明,實(shí)力雄厚的公司正不惜重金購(gòu)買尖端芯片,即便老款GPU價(jià)格更為親民。RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          此外,我們切勿忽視獲取新數(shù)據(jù)以訓(xùn)練大語(yǔ)言模型的成本。像OpenAI和蘋果等公司從出版商那里獲得內(nèi)容授權(quán)的費(fèi)用看似微不足道,但未來可能會(huì)大幅增長(zhǎng)。盡管大語(yǔ)言模型正逐步生成用于新模型的“合成”訓(xùn)練數(shù)據(jù),但仍有許多高質(zhì)量信息是它們無法復(fù)制的。(小小)RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          RDb流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          本文鏈接:ai芯片市場(chǎng)前景「業(yè)內(nèi):過去數(shù)月老款A(yù)I芯片降價(jià),大模型培訓(xùn)成本降60%」http://m.lensthegame.com/show-3-7955-0.html

          聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 矢量圖標(biāo)設(shè)計(jì)軟件「設(shè)計(jì)提效丨你要的免費(fèi)商用高質(zhì)量矢量圖標(biāo)庫(kù)來啦!」

          下一篇: 短劇投手掌錢:“揮金如土”,一晚虧10萬_投手是干什么的

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 中文字幕一区二区在线播放| 亚洲熟女少妇一区二区| 久久亚洲一区二区| 天堂一区二区三区精品| 少妇精品久久久一区二区三区 | 国产一区二区三区乱码| 无码少妇一区二区浪潮av| 亚洲av无码成人影院一区| 日韩一区二区在线观看视频| 国产一区二区视频在线播放| 精品国产香蕉伊思人在线在线亚洲一区二区 | 国产一区二区三区在线| 欧洲精品免费一区二区三区| 极品少妇一区二区三区四区| 亚洲一区AV无码少妇电影| 日韩免费无码一区二区三区| 亚洲福利视频一区| 精品一区二区三区波多野结衣| 无码精品黑人一区二区三区| 日韩人妻精品无码一区二区三区 | 国产视频一区在线播放| 福利国产微拍广场一区视频在线| 色婷婷av一区二区三区仙踪林 | 色偷偷久久一区二区三区| 久久久无码精品国产一区| 亚洲av无码一区二区三区网站| 久久精品国产一区二区三| 99精品国产一区二区三区不卡| 久久久老熟女一区二区三区| 亚洲欧洲专线一区| 色国产在线视频一区| 一区二区不卡视频在线观看| 91久久精一区二区三区大全| 高清一区二区三区免费视频| 精品一区二区三区在线播放视频| 成人一区二区三区视频在线观看| 精品一区二区三区免费毛片| 国产日韩一区二区三免费高清| 无码人妻精品一区二区三区66| 国产一区二区三区小说| 日韩社区一区二区三区|