IT之家 1 月 23 日消息,谷歌日前發布新聞稿,介紹了一款專為大語言模型設計的 ASPIRE 訓練框架,該框架號稱可以增強 AI 模型的選擇性預測能力。
谷歌提到,當下大語言模型在自然語言理解和生成內容方面發展迅速,已被用于構建各種創新應用,但要應用于高風險決策類場合依然不妥。這是由于模型預測具有不確定性及“幻覺”可能,因此谷歌開發了一款 ASPIRE 訓練框架,為系列模型引入了“可信度”機制,即 —— 模型會輸出一系列答案,每個答案都會具有正確概率評分。
▲ 圖源 谷歌新聞稿(下同)
在技術層面,IT之家注意到該訓練框架主要分為三階段,分別為“特定任務調整”、“答案采樣”和“自我評估學習”。
其中“特定任務調整”階段是對已接受過基礎訓練的大型語言模型進行深入訓練,專注于強化模型的預測能力。研究人員主要為模型引入一系列可調參數,在特定任務的訓練數據集上微調預訓練語言模型,從而提升模型預測性能,讓模型能夠更好地解決特定問題。
第二階段為“答案采樣”,經過特定微調后,模型可以利用先前學習到的可調參數,為每個訓練問題生成不同的答案,并創建用于自我評估學習的數據集,生成一系列可信度較高的答案。研究人員同時使用“集束搜索(Beam Search)”方法及 Rouge-L 算法來評估答案的質量,并將生成的答案及評分重新輸入給模型開啟第三階段。
而在第三階段“自我評估學習”中,研究人員為模型添加一組可調參數,專門用于提升模型自我評估能力。該階段的目標是讓模型學會“自己判斷輸出的答案準確性”,從而讓大語言模型在生成答案時,還會附上答案的正確概率評分。
谷歌研究人員使用 CoQA、TriviaQA 和 SQuAD 三個問答數據集來驗證 ASPIRE 訓練框架的成果,據稱“經過 ASPIRE 調整的 OPT-2.7B 小模型,表現遠超更大的 OPT-30B 模型”。而這項實驗結果也同時表明,只要經過適當的調整,即使是小語言模型,在部分場景下也可以超越大語言模型。
研究人員總結稱,ASPIRE 框架訓練能夠顯著提升大語言模型輸出準確率,即使是較小的模型,也可以在經過微調后進行“準確且有自信”的預測。
本文鏈接:可令 AI 自我判斷輸出內容正確性,谷歌公布模型訓練框架 ASPIREhttp://m.lensthegame.com/show-3-7517-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。