設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          AI推理芯片激發(fā)新一輪應(yīng)用創(chuàng)新

          2025-01-16 09:57:13 來源: 中國科技網(wǎng)

          隨著ChatGPT橫空出世,人工智能(AI)領(lǐng)域的競爭進入白熱化。英偉達公司的高端圖形處理單元(GPU)芯片“一飛沖天”,受到各大科技公司追捧。與此同時,也有一些初創(chuàng)公司另辟蹊徑,專注于研制另一種芯片——AI推理芯片,為AI產(chǎn)品的蓬勃發(fā)展和應(yīng)用注入全新動力。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          據(jù)物理學家組織網(wǎng)近日報道,這些AI推理芯片旨在降低生成式AI所需的高昂計算成本,更貼合AI工具的日常運行要求。此類芯片成本的不斷下探和性能的持續(xù)提升,有望掀起新一輪AI應(yīng)用創(chuàng)新浪潮,讓更多復雜且強大的AI應(yīng)用走進千家萬戶。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          推理計算需求水漲船高oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          訓練與推理,是AI大語言模型兩大核心能力的堅固基石。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在應(yīng)用過程中,經(jīng)過訓練的ChatGPT等生成式AI工具會吸納新信息,從中進行推理并生成回應(yīng),如撰寫文檔、生成圖像等。這類AI工具可應(yīng)用于醫(yī)療診斷、自動駕駛、自然語言理解等領(lǐng)域。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          隨著AI模型的廣泛應(yīng)用,需要進行推理計算的硬件日益增多,對推理芯片的需求也將“水漲船高”。國際數(shù)據(jù)公司(IDC)的報告顯示,未來幾年,推理端的AI服務(wù)器占比將持續(xù)攀升。預計到2027年,用于推理的工作負載將占據(jù)七成以上。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          科技公司競推新產(chǎn)品oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Cerebras、Groq和d-Matrix等初創(chuàng)公司,以及超威半導體公司(AMD)和英特爾等傳統(tǒng)巨頭,紛紛推出了AI推理芯片。這些公司敏銳捕捉到了AI推理芯片“大顯身手”的契機。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          據(jù)Cerebras公司官網(wǎng)報道,2024年8月28日,該公司推出了同名AI推理芯片。這款芯片在Llama 3.1-8B模型上實現(xiàn)了1800token/秒的推理速度;在Llama 3.1 70B上實現(xiàn)了450token/秒的推理速度,約是英偉達GPU推理速度的20倍。Token指AI處理文本的最小單元或基本元素,如一個單詞、一個字符等。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Cerebras公司解釋說,這一卓越表現(xiàn)得益于其創(chuàng)新的AI芯片設(shè)計方案。其晶圓級引擎(WSE)宛如一座龐大的“計算工廠”,最大特點是尺寸驚人——單個芯片幾乎占據(jù)了一整塊晶圓的面積。在這個超大芯片上,計算單元和內(nèi)存單元高度集成,形成一個密集的網(wǎng)格結(jié)構(gòu)。這樣的設(shè)計,讓數(shù)據(jù)能在極短距離內(nèi),于計算單元和存儲單元之間傳輸,從根本上降低了數(shù)據(jù)移動成本,解決了GPU推理無法避免的內(nèi)存帶寬瓶頸。此類大芯片能更快處理信息,從而在更短時間內(nèi)給出答案。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          早在去年2月,Groq公司就發(fā)布了自己的AI推理芯片GroqCloud。它在Llama 3.1 70B模型上實現(xiàn)了250token/秒的推理服務(wù),速度比GPU幾乎提升了一個量級。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          去年11月19日,硅谷初創(chuàng)公司d-Matrix宣布,其首款AI推理芯片Corsair已開始出貨,旨在提供聊天機器人和視頻生成等服務(wù)。Corsair在單服務(wù)器環(huán)境下,能讓Llama3 8B模型實現(xiàn)60000token/秒的處理能力,且每個token的延遲僅為1毫秒,充分彰顯了其在高速處理大規(guī)模數(shù)據(jù)方面的卓越性能。更值得一提的是,與GPU及其他方案相比,Corsair能在提供同等性能的同時,大幅降低能耗和成本。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          應(yīng)用開發(fā)走上新賽道oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          亞馬遜、谷歌、元宇宙平臺、微軟等科技公司紛紛斥巨資,搶購昂貴的GPU,以期在AI開發(fā)賽道拔得頭籌。與此同時,AI推理芯片制造商則將目光瞄準了更廣泛的客戶群體,希望能在這片新藍海中大顯身手。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          這些潛在客戶不乏那些渴望利用新興的生成式AI技術(shù),卻又不想大費周章自建AI基礎(chǔ)設(shè)施的財富500強企業(yè)。而且,購買AI推理芯片比從英偉達等公司購買GPU便宜。AI推理芯片旨在優(yōu)化推理計算的速度與效率,尤其擅長智能建議、語音識別、自然語言處理等領(lǐng)域。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          業(yè)內(nèi)專家稱,一旦推理速度提升至每秒數(shù)千token,AI模型將能在眨眼之間完成復雜問題的思考與回答過程。這不僅能讓現(xiàn)有應(yīng)用的交互效率實現(xiàn)質(zhì)的飛躍,還將帶來一系列令人耳目一新的人機交互場景。例如,在語音對話領(lǐng)域,延時將被壓縮至毫秒級,能實現(xiàn)近乎自然的對話體驗;在虛擬現(xiàn)實/增強現(xiàn)實領(lǐng)域,AI將能實時生成和調(diào)整虛擬環(huán)境、角色對話以及交互邏輯,給用戶帶來個性化、沉浸式體驗。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          隨著ChatGPT橫空出世,人工智能(AI)領(lǐng)域的競爭進入白熱化。英偉達公司的高端圖形處理單元(GPU)芯片“一飛沖天”,受到各大科技公司追捧。與此同時,也有一些初創(chuàng)公司另辟蹊徑,專注于研制另一種芯片——AI推理芯片,為AI產(chǎn)品的蓬勃發(fā)展和應(yīng)用注入全新動力。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          據(jù)物理學家組織網(wǎng)近日報道,這些AI推理芯片旨在降低生成式AI所需的高昂計算成本,更貼合AI工具的日常運行要求。此類芯片成本的不斷下探和性能的持續(xù)提升,有望掀起新一輪AI應(yīng)用創(chuàng)新浪潮,讓更多復雜且強大的AI應(yīng)用走進千家萬戶。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          推理計算需求水漲船高oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          訓練與推理,是AI大語言模型兩大核心能力的堅固基石。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在應(yīng)用過程中,經(jīng)過訓練的ChatGPT等生成式AI工具會吸納新信息,從中進行推理并生成回應(yīng),如撰寫文檔、生成圖像等。這類AI工具可應(yīng)用于醫(yī)療診斷、自動駕駛、自然語言理解等領(lǐng)域。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          隨著AI模型的廣泛應(yīng)用,需要進行推理計算的硬件日益增多,對推理芯片的需求也將“水漲船高”。國際數(shù)據(jù)公司(IDC)的報告顯示,未來幾年,推理端的AI服務(wù)器占比將持續(xù)攀升。預計到2027年,用于推理的工作負載將占據(jù)七成以上。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          科技公司競推新產(chǎn)品oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Cerebras、Groq和d-Matrix等初創(chuàng)公司,以及超威半導體公司(AMD)和英特爾等傳統(tǒng)巨頭,紛紛推出了AI推理芯片。這些公司敏銳捕捉到了AI推理芯片“大顯身手”的契機。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          據(jù)Cerebras公司官網(wǎng)報道,2024年8月28日,該公司推出了同名AI推理芯片。這款芯片在Llama 3.1-8B模型上實現(xiàn)了1800token/秒的推理速度;在Llama 3.1 70B上實現(xiàn)了450token/秒的推理速度,約是英偉達GPU推理速度的20倍。Token指AI處理文本的最小單元或基本元素,如一個單詞、一個字符等。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Cerebras公司解釋說,這一卓越表現(xiàn)得益于其創(chuàng)新的AI芯片設(shè)計方案。其晶圓級引擎(WSE)宛如一座龐大的“計算工廠”,最大特點是尺寸驚人——單個芯片幾乎占據(jù)了一整塊晶圓的面積。在這個超大芯片上,計算單元和內(nèi)存單元高度集成,形成一個密集的網(wǎng)格結(jié)構(gòu)。這樣的設(shè)計,讓數(shù)據(jù)能在極短距離內(nèi),于計算單元和存儲單元之間傳輸,從根本上降低了數(shù)據(jù)移動成本,解決了GPU推理無法避免的內(nèi)存帶寬瓶頸。此類大芯片能更快處理信息,從而在更短時間內(nèi)給出答案。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          早在去年2月,Groq公司就發(fā)布了自己的AI推理芯片GroqCloud。它在Llama 3.1 70B模型上實現(xiàn)了250token/秒的推理服務(wù),速度比GPU幾乎提升了一個量級。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          去年11月19日,硅谷初創(chuàng)公司d-Matrix宣布,其首款AI推理芯片Corsair已開始出貨,旨在提供聊天機器人和視頻生成等服務(wù)。Corsair在單服務(wù)器環(huán)境下,能讓Llama3 8B模型實現(xiàn)60000token/秒的處理能力,且每個token的延遲僅為1毫秒,充分彰顯了其在高速處理大規(guī)模數(shù)據(jù)方面的卓越性能。更值得一提的是,與GPU及其他方案相比,Corsair能在提供同等性能的同時,大幅降低能耗和成本。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          應(yīng)用開發(fā)走上新賽道oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          亞馬遜、谷歌、元宇宙平臺、微軟等科技公司紛紛斥巨資,搶購昂貴的GPU,以期在AI開發(fā)賽道拔得頭籌。與此同時,AI推理芯片制造商則將目光瞄準了更廣泛的客戶群體,希望能在這片新藍海中大顯身手。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          這些潛在客戶不乏那些渴望利用新興的生成式AI技術(shù),卻又不想大費周章自建AI基礎(chǔ)設(shè)施的財富500強企業(yè)。而且,購買AI推理芯片比從英偉達等公司購買GPU便宜。AI推理芯片旨在優(yōu)化推理計算的速度與效率,尤其擅長智能建議、語音識別、自然語言處理等領(lǐng)域。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          業(yè)內(nèi)專家稱,一旦推理速度提升至每秒數(shù)千token,AI模型將能在眨眼之間完成復雜問題的思考與回答過程。這不僅能讓現(xiàn)有應(yīng)用的交互效率實現(xiàn)質(zhì)的飛躍,還將帶來一系列令人耳目一新的人機交互場景。例如,在語音對話領(lǐng)域,延時將被壓縮至毫秒級,能實現(xiàn)近乎自然的對話體驗;在虛擬現(xiàn)實/增強現(xiàn)實領(lǐng)域,AI將能實時生成和調(diào)整虛擬環(huán)境、角色對話以及交互邏輯,給用戶帶來個性化、沉浸式體驗。oWP流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:AI推理芯片激發(fā)新一輪應(yīng)用創(chuàng)新http://m.lensthegame.com/show-2-10172-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務(wù)。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

          上一篇: 瑞典研究警告:AI生成的“垃圾科學”正侵蝕谷歌學術(shù)平臺

          下一篇: 磷化鈮薄膜在超薄線路制造中展現(xiàn)潛力 有助解決電子產(chǎn)品能耗問題

          熱門資訊

          推薦資訊

          • 云南省商務(wù)廳原副廳長王曉華被“雙開”

              中新經(jīng)緯2月21日電 中央紀委國家監(jiān)委網(wǎng)站21日通報,據(jù)云南省紀委監(jiān)委消息:日前,經(jīng)云南省委批準,云南省紀委監(jiān)委對云南省商務(wù)廳原黨組成員、副廳長王曉華嚴重違紀違法問題進行

          • 國美電器再新增被執(zhí)行2.8億

              中新經(jīng)緯2月21日電 國美電器有限公司(下稱:國美電器)再新增5條被執(zhí)行人信息,執(zhí)行標的合計2.8億元。  中國執(zhí)行信息公開網(wǎng)截圖  中國執(zhí)行信息公開網(wǎng)顯示,2月19-2月20日,

          • 怡和通基金收警示函,法定代表人曾拒不配合約談

              中新經(jīng)緯2月21日電 近日,深圳市怡和通基金管理有限公司(以下簡稱“怡和通基金”)及公司法定代表人孫紅衛(wèi)收警示函。  證監(jiān)會深圳監(jiān)管局網(wǎng)站截圖  證監(jiān)會深圳監(jiān)管局網(wǎng)

          • 微信支付推出App Store充值優(yōu)惠活動 新用戶獨享9折福利_微信蘋果充值折扣

            2月23日 消息:微信支付近日宣布,自2月23日至3月3日,將舉行一場針對App Store的充值優(yōu)惠活動。此次活動為新老用戶帶來了不同程度的優(yōu)惠,特別是新用戶,將有機會享受到高達10%的充

          • 多家央企業(yè)績考核措施“上新”,央國企改革受險資關(guān)注

              多家央企業(yè)績考核措施“上新”,央國企改革受險資關(guān)注  今年央企負責人業(yè)績考核指標有望于近期落地,其中將增加市值管理考核相關(guān)指標,并按“一企一策”進行設(shè)計。在去年中

          • 華晨汽車集團原副總裁劉同富被開除黨籍

              中新經(jīng)緯2月23日電 據(jù)中央紀委國家監(jiān)委網(wǎng)站23日公告,華晨汽車集團控股有限公司原副總裁劉同富嚴重違紀違法被開除黨籍。  據(jù)遼寧省紀委監(jiān)委消息:日前,經(jīng)遼寧省委批準,遼寧

          • 探店1天|中式快餐店,為何蒸蛋賣得最好?

              “春節(jié)后開工第一天,店里已經(jīng)恢復到節(jié)前的忙碌狀態(tài)。午高峰時客人一波接一波,排隊的隊伍甚至排到了隔壁店門口。”老鄉(xiāng)雞太陽宮門店店長屠培培表示。

          • 法爾勝股東張錫良收監(jiān)管函

              中新經(jīng)緯2月23日電 23日,深交所發(fā)布關(guān)于對江蘇法爾勝股份有限公司股東張錫良的監(jiān)管函。  深交所監(jiān)管函截圖  據(jù)監(jiān)管函,法爾勝于2月19日披露的《關(guān)于股東持股比例達到5

          • 國家外匯局:1月外匯交易理性有序

              中新經(jīng)緯2月23日電 國家外匯管理局網(wǎng)站23日公布《2024年1月銀行結(jié)售匯和銀行代客涉外收付款數(shù)據(jù)》顯示,2024年1月,銀行結(jié)匯14515億元人民幣,售匯15216億元人民幣。按美元計

          • 奔馳召回部分進口GLE SUV汽車:存起火風險

              中新經(jīng)緯2月23日電 據(jù)國家市場監(jiān)督管理總局網(wǎng)站消息,日前,梅賽德斯-奔馳(中國)汽車銷售有限公司根據(jù)《缺陷汽車產(chǎn)品召回管理條例》和《缺陷汽車產(chǎn)品召回管理條例實施辦法

          • 歐洲央行2004年來首虧!加息推高凈利息支出

              中新經(jīng)緯2月23日電 據(jù)英國《金融時報》23日報道,歐洲央行錄得2004年以來首次虧損。  該報道指出,歐洲央行宣布了近二十年來的首次年度虧損,促使政策制定者首次結(jié)轉(zhuǎn)年度赤

          • 山姆的“窮鬼套餐”火了,4億中產(chǎn)汗流浹背!

            編排 | 李硯 審核 | 李硯來源 | 品牌頭版近年來,受宏觀經(jīng)濟環(huán)境影響,在大眾消費領(lǐng)域,消費降級趨勢

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 蜜臀AV一区二区| 国产午夜毛片一区二区三区| 激情综合一区二区三区| 三级韩国一区久久二区综合| 国产a∨精品一区二区三区不卡| 日韩好片一区二区在线看| 国产婷婷色一区二区三区深爱网 | 久久久久人妻一区精品色| 国产福利日本一区二区三区| 无码囯产精品一区二区免费 | 亚洲国产av一区二区三区| 最美女人体内射精一区二区| 女人18毛片a级毛片一区二区| 国产在线aaa片一区二区99| 精品国产一区二区三区久久狼| 久久精品亚洲一区二区| 久久久久人妻一区精品| 性色av闺蜜一区二区三区| 日韩人妻一区二区三区免费| 久久精品国产一区二区三区| 美女AV一区二区三区| 香蕉久久ac一区二区三区| 91一区二区三区四区五区| 日本不卡一区二区三区视频| 99精品国产高清一区二区三区| jazzjazz国产精品一区二区| 立川理惠在线播放一区| 精品无码中出一区二区| 好湿好大硬得深一点动态图91精品福利一区二区 | 人体内射精一区二区三区| 国产在线一区二区三区| 久久综合一区二区无码| 亚洲av无码一区二区三区网站| 国产主播福利精品一区二区 | 国产午夜精品一区二区三区小说 | 99精品国产一区二区三区不卡| 久久国产精品一区| 老熟女五十路乱子交尾中出一区| 人妻无码久久一区二区三区免费 | 蜜臀AV一区二区| 国产精品一区二区久久沈樵|