科技日報北京12月14日電 (記者張夢然)“深度思維”團隊利用大語言模型(LLM)對一個著名的數(shù)學(xué)問題提出了“新見解”,并通過系統(tǒng)的、迭代的評估框架確保其正確。這一研究或可改進LLM用來解決問題和學(xué)習(xí)新知識的途徑。相關(guān)論文發(fā)表在14日的《自然》雜志上。
基于人工智能的工具(例如LLM)有時受制于“幻覺”,導(dǎo)致作出看似合理但實際是錯誤的陳述。加入一個評估步驟,系統(tǒng)地衡量潛在解決方案的準(zhǔn)確性,使得利用LLM應(yīng)對復(fù)雜問題成為可能。這些問題一般需要可驗證且定義明確,從而使這一工具在數(shù)學(xué)科學(xué)中有潛在價值。
研究團隊此次介紹了一種方法,稱為“FunSearch”。他們將一組產(chǎn)生創(chuàng)造性解決方案的LLM和一個作為檢查者以避免錯誤建議的評估程序結(jié)合起來。接著,將一個多次迭代此過程的演化方法,作為輸入來引導(dǎo)LLM。結(jié)果表明,這種方法可以得到新的、可驗證的正確結(jié)果。他們將“FunSearch”應(yīng)用到了著名的上限集問題(數(shù)學(xué)中涉及計數(shù)和排列領(lǐng)域的一個中心問題),發(fā)現(xiàn)了超越最著名上限集的大上限集新構(gòu)造。
研究人員表示,“FunSearch”的成功關(guān)鍵是它會尋找那些描述怎樣解決問題的程序,而非直接尋找解決辦法。因為“FunSearch”的結(jié)果易于被解釋和驗證,這意味著這一方法有望激發(fā)科學(xué)家在該領(lǐng)域的進一步思考。
數(shù)學(xué)真要成為首個借助AI實現(xiàn)突破的學(xué)科嗎?一方面,數(shù)學(xué)家越來越頻繁地使用AI;另一方面,AI也很“配合”——既可用于解決編程等應(yīng)用學(xué)科的問題,也可用來攻克包括數(shù)學(xué)在內(nèi)的自然學(xué)科。本文中這項成果,現(xiàn)階段可能還不適合解決大多數(shù)類型的挑戰(zhàn),但研究團隊提出了未來改進的可能。或許在不久之后,“FunSearch”將可用于破解數(shù)學(xué)界更大范圍、更多種多樣的難題。
本文鏈接:大語言模型對著名數(shù)學(xué)問題有“新見解”http://m.lensthegame.com/show-11-1579-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任,僅提供存儲服務(wù)。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 四大新功能讓生成式AI“如虎添翼”