1月15日,科大訊飛發布了我國“全國產”算力平臺第一個深度推理大模型——訊飛星火X1。據公開測試,該模型中文數學能力表現突出,目前已應用于教育、醫療等場景。
在大模型研發領域,訊飛星火堅持走全國產化路線。據科大訊飛研究院副院長殷兵介紹,盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出我國首個基于全國產算力訓練的、具備深度思考和推理能力的大模型——訊飛星火X1。
發布會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、美國數學邀請賽(AIME)賽題以及高中奧賽題的表現。訊飛星火X1對解題思路和步驟進行了詳細拆解,準確給出了這些題目的答案。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。
“訊飛星火X1充分展現深度推理模型的三大典型特征:化繁為簡,將復雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否的優質反饋信息進行強化訓練。”殷兵介紹說。
目前,訊飛星火X1率先在教育等真實場景中實現了應用落地。去年“1024開發者節”,科大訊飛聯合中國教育科學研究院發布了基于“問題鏈”的高中數學智能教師助手,目前正面向全國百個試點區域、聯合千名優秀教研員和老師打造上萬個優秀案例。在已部署的上述試點區域,星火X1廣獲好評,老師們反饋稱訊飛X1在一題多解、教學知識關聯、拓展學生高階思維等方面表現出色。
在醫療領域,訊飛星火X1的模型策略已取得初步驗證成效,可使得專科輔助診斷和復雜病歷內涵質控的準確率均達90%。發布會上,科大訊飛宣布將在2025年上半年正式發布基于訊飛星火X1的醫療大模型升級版,確保其深層次診斷推理效果和質控能力的領先水平。
此次發布會上,訊飛星火4.0 Turbo底座能力實現了全新升級,七大核心能力全面提升,全面對標OpenAI 最新版的GPT-4o。此次升級最重要的特點,是針對行業、企業的痛點問題,在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。
在備受關注的數學能力上,此次基于訊飛星火X1的高質量合成數據,訊飛星火4.0 Turbo的數學能力變得更強,可以在數學教學、金融分析和科研推演等工作中更好地幫助用戶。此外,科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小于5秒。
本文鏈接:訊飛聯手華為攻克全國產算力下推理模型訓練難關http://m.lensthegame.com/show-11-16436-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 發現推廣清潔能源有助于促進家庭收入增長和減少不平等
下一篇: 科學家發現非酒精性脂肪性肝炎潛在新靶點