設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          Llama 3模型的推理性能 延遲降低2倍_英特爾披露至強6處理器針對Meta

          2024-04-20 16:46:21 來源:

          【】4月20日消息,近日,Meta重磅推出其80億和700億參數的Meta Llama 3開源大模型。該模型引入了改進推理等新功能和更多的模型尺寸,并采用全新標記器(Tokenizer),旨在提升編碼語言效率并提高模型性能。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在模型發布的第一時間,英特爾即驗證了Llama 3能夠在包括英特爾至強處理器在內的豐富AI產品組合上運行,并披露了即將發布的英特爾至強6性能核處理器(代號為Granite Rapids)針對Meta Llama 3模型的推理性能。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          英特爾至強處理器可以滿足要求嚴苛的端到端AI工作負載的需求。以第五代至強處理器為例,每個核心均內置了AMX加速引擎,能夠提供出色的AI推理和訓練性能。截至目前,該處理器已被眾多主流云服務商所采用。不僅如此,至強處理器在進行通用計算時,能夠提供更低時延,并能同時處理多種工作負載。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          事實上,英特爾一直在持續優化至強平臺的大模型推理性能。例如,相較于Llama 2模型的軟件,PyTorch及英特爾?PyTorch擴展包(Intel?Extension for PyTorch)的延遲降低了5倍。這一優化是通過Paged Attention算法和張量并行實現的,這是因為其能夠最大化可用算力及內存帶寬。下圖展示了80億參數的Meta Lama 3模型在AWS m7i.metal-48x實例上的推理性能,該實例基于第四代英特爾至強可擴展處理器。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          AWS實例上Llama 3的下一個Token延遲N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          不僅如此,英特爾還首次披露了即將發布的產品——英特爾至強?6性能核處理器(代號為Granite Rapids)針對Meta Llama 3的性能測試。結果顯示,與第四代至強處理器相比,英特爾至強6處理器在80億參數的Llama 3推理模型的延遲降低了2倍,并且能夠以低于100毫秒的token延遲,在單個雙路服務器上運行諸如700億參數的Llama 3這種更大參數的推理模型。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          基于英特爾至強 6性能核處理器(代號Granite Rapids)的Llama 3下一個Token延遲N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          考慮到Llama 3具備更高效的編碼語言標記器(Tokenizer),測試采用了隨機選擇的prompt對Llama 3和Llama 2進行快速比較。在prompt相同的情況下,Llama 3所標記的token數量相較Llama 2減少18%。因此,即使80億參數的Llama 3模型比70億參數的Llama 2模型參數更高,在AWS m7i.metal-48xl實例上運行BF16推理時,整體prompt的推理時延幾乎相同(該評估中,Llama 3比Llama 2快1.04倍)。N2a流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:Llama 3模型的推理性能 延遲降低2倍_英特爾披露至強6處理器針對Metahttp://m.lensthegame.com/show-3-17157-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 2024北京國際車展展位圖公布:小米、智己“冤家聚頭”_21年4月北京車展

          下一篇: “芯”之“力”|“云啟芯篇,一云多芯激活新質生產力”主題交流會在京成功舉辦!

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 无码国产精品一区二区免费vr | 国产一区二区三区美女 | 亚洲AV无码一区二区三区性色 | 日本美女一区二区三区| 精品福利一区二区三区| 亚洲国产精品一区| 日本一区二区三区免费高清在线| 亚洲一区视频在线播放 | 精品免费AV一区二区三区| 亚洲一区二区三区在线观看网站| 乱码人妻一区二区三区| 免费无码一区二区三区蜜桃| 中文字幕av人妻少妇一区二区| 国产伦精品一区二区三区免费下载 | 美女免费视频一区二区三区| 少妇精品无码一区二区三区 | 伊人色综合一区二区三区| 亚洲日韩一区二区三区| 中文字幕一区二区日产乱码| 国产在线观看一区二区三区四区 | 国产伦精品一区二区三区| 国产精品视频免费一区二区| 最美女人体内射精一区二区| 日本一区二区三区在线网| 91无码人妻精品一区二区三区L| 夜夜精品无码一区二区三区| 成人精品一区二区不卡视频| 亚洲视频一区在线| 一区二区三区视频在线| 日本免费一区二区久久人人澡 | 国产免费一区二区视频| 日本一区二区三区在线视频| 精品无码国产AV一区二区三区| 精品国产a∨无码一区二区三区| 无码精品人妻一区二区三区人妻斩| 国产91一区二区在线播放不卡| 成人无号精品一区二区三区| 在线免费一区二区| 精品一区二区三区AV天堂| 国产91精品一区| 国产成人高清精品一区二区三区|