設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          Anthropic推出混合推理模型,可控制模型思考時間

          2025-02-26 09:11:50 來源: 澎湃新聞

           bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          2月25日,由亞馬遜支持的AI初創公司Anthropic推出首個混合推理模型Claude 3.7 Sonnet。它可以產生近乎即時的反應和對用戶可見、可擴展的逐步思考。API用戶還可以控制模型思考時間。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Anthropic表示,正如人類使用一個大腦進行快速反應和深度思考一樣,推理應該是前沿模型的綜合能力,而不是完全獨立的模型。這種統一方法可以為用戶創造無縫體驗。Claude 3.7 Sonnet既是一個普通的大模型,也是一個推理模型,用戶可以選擇何時讓模型在標準模式下回答,何時讓模型在回答前思考更長時間。Anthropic聯合創始人兼首席科學官賈里德·卡普蘭(Jared Kaplan)表示:“我們想要一個連貫的人工智能,它可以幫助我們做任何事情。”bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在標準模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級版。在擴展思維模式下,Claude 3.7 Sonnet在回答問題前會自我反思,數學、物理、指令遵循、編程等任務上的表現得到提高。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在標準模型和擴展思維模式下,Claude 3.7 Sonnet每百萬輸入token為3美元,每百萬輸出token為15美元,其中包括思考的token。當通過API使用Claude 3.7 Sonnet時,用戶還可以控制思考的預算,在速度和成本上換取質量,例如用戶可以要求Claude思考不超過多少個token。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Anthropic表示,擴展思維模式使模型在數學、物理、指令遵循、編程等任務方面獲得提升。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Anthropic產品負責人、Instagram的聯合創始人邁克·克里格(Mike Krieger)表示,這種混合方式可以簡化聊天機器人流程,用戶可以使用多種功能,而不需要考慮哪個是最好的選擇。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Anthropic在開發推理模型時降低了對數學和計算機科學競賽問題的優化程度,而是將優化的重點轉移到現實世界任務上,這些任務更好地反映企業實際如何使用大模型。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Claude 3.7 Sonnet在編程和前端網絡開發方面優化改進,并引入一個用于智能編程的命令行工具Claude Code。Claude Code可以搜索和讀取代碼、編輯文件、編寫和運行測試、提交和推送代碼到GitHub,并使用命令行工具,開發者可以直接將大量工程任務委托給Claude Code。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在早期測試中,Claude Code一次性完成了通常需要45分鐘以上手動工作的任務,減少了開發時間和開銷。Anthropic表示,在接下來的幾周里計劃根據開發者的使用情況繼續改進,增強工具調用的可靠性、增加對長時間運行命令的支持等。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “我們使用Claude Code的目標是更好地理解開發者如何使用Claude編程,為未來的模型改進提供信息。”Anthropic表示,Claude 3.7 Sonnet是該企業迄今最好的編程模型,隨著對用戶工作和開源項目的深入了解,它可以在GitHub項目中修復bug(漏洞)、開發功能和構建文檔。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          2月以來,大模型競爭態勢愈發激烈。2月18日,特斯拉創始人埃隆·馬斯克旗下xAI推出最新大模型Grok 3。Grok 3和輕量化的Grok 3 mini在多個性能上超過或媲美Gemini、DeepSeek和GPT-4o等對手。Grok 3在xAI位于孟菲斯的Colossus超算中心進行訓練。xAI透露,這一超算中心的算力已經翻倍,擁有的英偉達GPU數量達20萬顆。bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          2月13日,OpenAI首席執行官山姆·奧特曼(Sam Altman)在社交媒體上表示,下一個將發布的模型是OpenAI最后一個非思維鏈模型GPT-4.5,也被稱為Orion(獵戶座)模型。在那之后,OpenAI的最高目標是創建可以使用所有工具的系統來統一o系列模型和GPT系列模型,它能夠知道什么時候應該長時間思考,并且通常適用于廣泛任務。OpenAI將發布GPT-5,GPT-5將成為一個集成o3模型等OpenAI諸多技術的系統。“我們希望AI ‘只為你工作’,我們意識到我們的模式和產品供應變得多么復雜。我們和你一樣討厭模型選擇器,希望回歸神奇的統一智能。”bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          (原題:《大模型競爭愈發激烈:Anthropic推出混合推理模型,可控制模型思考時間》)bL5流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:Anthropic推出混合推理模型,可控制模型思考時間http://m.lensthegame.com/show-11-17787-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: “雅典娜”發射在即 計劃在月表最南端著陸

          下一篇: 狂吃零食沒長胖不意味著大腦沒變化

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲午夜日韩高清一区| 好看的电影网站亚洲一区| 国产成人欧美一区二区三区 | 色综合视频一区中文字幕| 精品理论片一区二区三区| 亚洲国产综合无码一区| 天天看高清无码一区二区三区| 国产美女一区二区三区| 国产AV午夜精品一区二区三区| 国产一区二区三区露脸| 亚洲熟女综合色一区二区三区| 亚洲伦理一区二区| 国模无码人体一区二区| 日韩精品一区二区三区不卡| 日美欧韩一区二去三区| 中文字幕av人妻少妇一区二区| 熟妇人妻AV无码一区二区三区| 精品国产一区二区22| 亚洲一区二区高清| 中文字幕一区二区三区在线播放| 国产精品免费综合一区视频| 国产一区二区好的精华液| 亚洲愉拍一区二区三区| 亚洲Av无码国产一区二区 | 亚洲福利电影一区二区?| 国产裸体歌舞一区二区| 亚洲国产成人一区二区精品区 | 熟妇人妻一区二区三区四区| 一区二区三区在线免费| 一区二区三区日本电影| 中文字幕一区二区日产乱码| 国产波霸爆乳一区二区 | 一区二区三区观看免费中文视频在线播放| 福利视频一区二区牛牛| 一区二区三区中文字幕| 精品亚洲一区二区三区在线播放| 中文字幕一区二区三区有限公司 | 99久久精品国产一区二区成人 | 精品人妻AV一区二区三区| 亚洲综合av一区二区三区不卡| 在线|一区二区三区|