生成式AI“幻覺”困境如何破解

2025-02-05 15:38:45 來源：中國科技網(wǎng)

觀看：21

人工智能（AI）技術(shù)正以前所未有的速度發(fā)展，生成式AI憑借其驚人的創(chuàng)造力，不斷刷新人們的認(rèn)知。然而，即便是看似“聰明絕頂”的AI，也難逃“幻覺”的困擾。這里的“幻覺”，指的是AI生成看似合理但實(shí)際不準(zhǔn)確或虛假的信息。

英國《自然》雜志網(wǎng)站在1月22日的報(bào)道中指出，AI“幻覺”可能會(huì)引發(fā)嚴(yán)重后果，科學(xué)家正各出奇招，力求降低其發(fā)生率。這些措施包括增加事實(shí)核查、對(duì)AI進(jìn)行“腦部掃描”等，以促進(jìn)AI的健康、高效發(fā)展。

主因是數(shù)據(jù)模糊

各種生成式AI，包括由大語言模型驅(qū)動(dòng)的聊天機(jī)器人，常常會(huì)編造信息。它們有時(shí)會(huì)模糊事實(shí)與虛構(gòu)，在看似真實(shí)的陳述中夾雜錯(cuò)誤信息。這既是其創(chuàng)造力的體現(xiàn)，也是其不足之處。

美國佐治亞理工學(xué)院理論計(jì)算機(jī)科學(xué)家桑托什·威姆帕拉解釋稱，大語言模型的設(shè)計(jì)原理并非輸出準(zhǔn)確事實(shí)，而是通過模式識(shí)別生成答案。其內(nèi)部復(fù)雜的運(yùn)行機(jī)制迄今仍像一個(gè)“黑匣子”，人們難以洞悉其推理過程。

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達(dá)拉表示，在訓(xùn)練過程中，這些模型會(huì)壓縮數(shù)萬億個(gè)單詞間的關(guān)系，隨后通過一個(gè)龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓(xùn)練內(nèi)容，但剩下2%的內(nèi)容卻會(huì)讓其“誤入歧途”，生成不準(zhǔn)確或虛假信息。

導(dǎo)致AI出現(xiàn)“幻覺”的原因多種多樣，其中訓(xùn)練數(shù)據(jù)中的模糊性和錯(cuò)誤是常見因素。也有人認(rèn)為，即使訓(xùn)練數(shù)據(jù)準(zhǔn)確無誤，AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實(shí)的稀缺程度密切相關(guān)。因此，即使經(jīng)過人類反饋調(diào)整過的聊天機(jī)器人，也無法完全避免出錯(cuò)。

多領(lǐng)域面臨考驗(yàn)

AI的“幻覺”可能會(huì)給人們的工作和生活帶來較大影響。

在新聞?lì)I(lǐng)域，大語言模型可能生成虛假新聞事件，擾亂信息傳播秩序，誤導(dǎo)公眾認(rèn)知。Vectara公司針對(duì)文檔內(nèi)容開展的研究表明，一些聊天機(jī)器人編造事實(shí)、虛構(gòu)信息的幾率高達(dá)30%。世界經(jīng)濟(jì)論壇發(fā)布的《2025年全球風(fēng)險(xiǎn)報(bào)告》顯示，錯(cuò)誤和虛假信息是2025年全球面臨的五大風(fēng)險(xiǎn)之一。

在法律領(lǐng)域，它可能引用虛構(gòu)的法律條文和案例。比如，2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT，在法庭文件中引用了并不存在的法律案例。而在醫(yī)學(xué)領(lǐng)域，它可能提供錯(cuò)誤的診斷和治療建議，危及患者生命。

《自然》在報(bào)道中指出，AI“幻覺”在科學(xué)參考文獻(xiàn)方面出現(xiàn)錯(cuò)誤的情況也極為普遍。2024年的一項(xiàng)研究發(fā)現(xiàn)，各類聊天機(jī)器人在提及參考文獻(xiàn)時(shí)的出錯(cuò)率在30%至90%之間。它們至少會(huì)在論文標(biāo)題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機(jī)器人都帶有警告標(biāo)簽，提醒用戶對(duì)重要信息進(jìn)行二次核實(shí)。但如果用戶對(duì)聊天機(jī)器人的回復(fù)深信不疑，可能會(huì)引發(fā)一系列問題。

多舉措減少“幻覺”

為進(jìn)一步提升AI的精確度，科學(xué)家正想方設(shè)法降低其“幻覺”。

例如，增加模型訓(xùn)練參數(shù)和訓(xùn)練時(shí)長(zhǎng)可有效減少“幻覺”。但這種方法需要付出高昂的計(jì)算成本，并可能削弱聊天機(jī)器人的其他能力，如機(jī)器學(xué)習(xí)算法對(duì)未知數(shù)據(jù)的預(yù)測(cè)和處理能力。

此外，使用更大、更干凈的數(shù)據(jù)集進(jìn)行訓(xùn)練，也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而，當(dāng)前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。

檢索增強(qiáng)生成（RAG）技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機(jī)器人在回復(fù)問題前參考給定的可信文本，從而確保回復(fù)內(nèi)容的真實(shí)性，以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴(yán)格遵循經(jīng)過驗(yàn)證的知識(shí)的領(lǐng)域，RAG技術(shù)備受青睞。

不過，美國斯坦福大學(xué)計(jì)算機(jī)科學(xué)家米拉柯·蘇茲根表示，盡管RAG能提升內(nèi)容真實(shí)性，但其能力有限。蘇茲根團(tuán)隊(duì)的研究表明，一些為法律研究開發(fā)的、號(hào)稱“無幻覺”的RAG增強(qiáng)模型雖有所改進(jìn)，但仍存在不足。

開發(fā)者也可以使用一個(gè)與AI訓(xùn)練方式不同的獨(dú)立系統(tǒng)，通過網(wǎng)絡(luò)搜索對(duì)聊天機(jī)器人的回復(fù)進(jìn)行事實(shí)核查，谷歌的“雙子星”系統(tǒng)便是一個(gè)典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能：內(nèi)容如果突出顯示為綠色，表示其已通過網(wǎng)絡(luò)搜索驗(yàn)證；內(nèi)容如果突出顯示為棕色，則表示其為有爭(zhēng)議或不確定的內(nèi)容。但是，這種方法計(jì)算成本高昂且耗時(shí)，而且系統(tǒng)仍會(huì)產(chǎn)生“幻覺”，因?yàn)榛ヂ?lián)網(wǎng)上錯(cuò)誤信息泛濫。

在去年6月出版的《自然》雜志上，英國牛津大學(xué)科學(xué)家刊發(fā)論文稱，他們利用“語義熵”，通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種，被用于量化物理系統(tǒng)中所包含的信息量。通過評(píng)估AI模型在特定提示詞下生成內(nèi)容的不確定性，來計(jì)算模型的困惑程度，從而為用戶或模型提供警示，提醒其采取必要的循證措施，確保更準(zhǔn)確的答案輸出。

美國卡內(nèi)基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時(shí)，繪制其內(nèi)部計(jì)算節(jié)點(diǎn)的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計(jì)算節(jié)點(diǎn)活動(dòng)模式，可以告訴我們AI模型是在“說真話”，還是在“胡說八道”。

主因是數(shù)據(jù)模糊

多領(lǐng)域面臨考驗(yàn)

AI的“幻覺”可能會(huì)給人們的工作和生活帶來較大影響。

多舉措減少“幻覺”

為進(jìn)一步提升AI的精確度，科學(xué)家正想方設(shè)法降低其“幻覺”。

本文鏈接：生成式AI“幻覺”困境如何破解http://m.lensthegame.com/show-2-10430-0.html

聲明：本網(wǎng)站為非營(yíng)利性網(wǎng)站，本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：標(biāo)記速度、均勻性和多功能性超出以往，新技術(shù)可高效標(biāo)記細(xì)胞蛋白質(zhì)

下一篇：頂夸克遵循狹義相對(duì)論通過最強(qiáng)測(cè)驗(yàn)

熱門資訊

站在“人工智能+”探索前列
今年全國兩會(huì)期間，人工智能成為熱點(diǎn)話題，“人工智能+”首次被寫入政府工作報(bào)告。一頭連著數(shù)字經(jīng)濟(jì)發(fā)展大局，一頭連著行業(yè)變革與創(chuàng)新，“人工智能+”既是
全國首個(gè)煤炭行業(yè)能源智算中心在山西建成
3月18日，記者從山西省人民政府獲悉，“山西煤炭工業(yè)互聯(lián)網(wǎng)智算平臺(tái)”日前在山西聯(lián)通大數(shù)據(jù)中心建設(shè)完成。該平臺(tái)由中國聯(lián)通與山西晉云互聯(lián)科技有限公
電驅(qū)氣吸播種機(jī)亮相農(nóng)機(jī)展，價(jià)格親民助增產(chǎn)
3月18日，在2024年黑龍江農(nóng)機(jī)產(chǎn)品展示交易會(huì)上，一部可智能播種，又可助力增產(chǎn)的電驅(qū)氣吸播種機(jī)引發(fā)眾人關(guān)注。這臺(tái)高端智能電驅(qū)氣吸播種機(jī)的價(jià)格與機(jī)械
國家工程師丨鍛造能“聽”清眼疾的高精設(shè)備
眼眸深邃似海、璨如星河，中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)工程研究所眼科診療技術(shù)研發(fā)團(tuán)隊(duì)（以下簡(jiǎn)稱“團(tuán)隊(duì)”）正是眼眸“偵探”。該團(tuán)隊(duì)不久前被授予“國家卓越
我國建立“天-空-地-深”一體化鈾礦勘查技術(shù)體系
記者3月21日從核工業(yè)北京地質(zhì)研究院（以下簡(jiǎn)稱核地研院）獲悉，該院自1959年成立以來，在天然鈾保障、高放廢物地質(zhì)處置、核遙感技術(shù)與應(yīng)用、分析測(cè)試等領(lǐng)
多模態(tài)醫(yī)療大模型CARES Copilot 1.0發(fā)布?已面向香港神經(jīng)外科醫(yī)生開放使用
記者3月21日獲悉，由中國科學(xué)院自動(dòng)化研究所和中國科學(xué)院香港創(chuàng)新研究院聯(lián)合研發(fā)的醫(yī)療領(lǐng)域AI多模態(tài)大模型——CARES Copilot 1.0日前在香
量子互聯(lián)網(wǎng)：小荷已露尖尖角
近日，美國紐約州立大學(xué)石溪分校科學(xué)家菲格羅阿等人在一篇發(fā)表于《自然·量子信息》上的論文中稱，他們通過把兩個(gè)獨(dú)立的光子存儲(chǔ)在銣氣里，首次在
全球首列氫能源市域列車完成滿載運(yùn)行試驗(yàn)
3月21日上午，全球首列氫能源市域列車在中車長(zhǎng)客股份公司（以下簡(jiǎn)稱“中車長(zhǎng)客”）試驗(yàn)線上進(jìn)行了時(shí)速160公里滿載運(yùn)行試驗(yàn)。當(dāng)日試驗(yàn)過程中，車以160公里/
AI芯片巨頭低調(diào)賺錢
　　AI芯片巨頭低調(diào)賺錢　　駱軼琪　　在過去一年半導(dǎo)體行業(yè)下行周期中，除了英偉達(dá)以GPU霸主身份實(shí)現(xiàn)業(yè)績(jī)快速成長(zhǎng)之外，另一些主營(yíng)雖非GPU，但是立足于AI定制芯片市場(chǎng)的半導(dǎo)體巨
huaweiP70系列發(fā)布在即！供應(yīng)鏈已開始批量供貨：出貨目標(biāo)相當(dāng)樂觀
3月24日消息，據(jù)媒體報(bào)道，huawei電話供應(yīng)鏈公司，已開始向huaweiP70系列高端旗艦電話批量供貨。同時(shí)有產(chǎn)業(yè)鏈人士透露，huawei給出的P70系列出貨目標(biāo)指引相對(duì)
蘋果 16首發(fā)預(yù)裝！iOS 18將支持桌面自定義、引入大模型
3月25日消息，按照慣例，iPhone會(huì)在6月份的WWDC上發(fā)布iOS 18、watchOS 11、visionOS 2等全新系統(tǒng)。其中iOS 18比較受關(guān)注，被許多爆料者稱為iOS史上最大升級(jí)
推薦資訊
- 六連陽！沖擊3000點(diǎn)！
  　　中新經(jīng)緯2月21日電 (董文博)A股氣勢(shì)如虹！　　21日，A股三大指數(shù)從盤綠開始一路上揚(yáng)，午后滬指漲幅瞬間擴(kuò)大至2%劍指3000點(diǎn)整數(shù)關(guān)口，深成指同步走高；滬深300指數(shù)、北證50指數(shù)盤
- 小米總裁盧偉冰：2024年是“人車家全生態(tài)”全面展開之年_小米總裁盧偉冰身價(jià)
  通信世界網(wǎng)消息（CWW）2月22日，小米14 Ultra暨“人車家全生態(tài)”新品發(fā)布會(huì)在京召開，小米集團(tuán)合伙人、總裁盧偉冰表示，2024年將是小米“人車家全生態(tài)”全面展開之年，在“人車家全生態(tài)
- EgoGen官網(wǎng)體驗(yàn)入口微軟AI合成數(shù)據(jù)生成自我感知工具使用指南
  EgoGen是一個(gè)用于生成以自我為中心的合成數(shù)據(jù)的系統(tǒng)，它能夠模擬頭戴設(shè)備（HMDs）的相機(jī)裝置，并從相機(jī)佩戴者的視角渲染多種傳感器數(shù)據(jù)。該系統(tǒng)提供了豐富的多模態(tài)數(shù)據(jù)和準(zhǔn)確的注釋
- 兩月內(nèi)落地三家省級(jí)分公司平安健康險(xiǎn)經(jīng)營(yíng)版圖擴(kuò)張至16省
  南方財(cái)經(jīng)全媒體記者孫詩卉上海報(bào)道近日，21世紀(jì)經(jīng)濟(jì)報(bào)道記者發(fā)現(xiàn)自進(jìn)入2024年，平安健康險(xiǎn)旗下新設(shè)省級(jí)分公司密集開業(yè)：1月27日，平安健康險(xiǎn)安
- 撫順銀行股權(quán)二拍打“六折” 部分中小銀行股權(quán)拍賣“接盤難”
  21世紀(jì)經(jīng)濟(jì)報(bào)道記者張欣北京報(bào)道首次拍賣流拍后，撫順銀行迎來了第二次拍賣，本次起拍價(jià)較評(píng)估價(jià)打折近六成。近日，阿里司法拍賣平臺(tái)信息顯示，
- 蒙商銀行被罰近900萬元 10名涉事高管人員連帶被罰
  21世紀(jì)經(jīng)濟(jì)報(bào)道記者張欣北京報(bào)道近日，據(jù)央行內(nèi)蒙古自治區(qū)分行披露的一份行政處罰單顯示，蒙商銀行因未按規(guī)定履行客戶身份識(shí)別義務(wù)、未按規(guī)
- 報(bào)告：節(jié)后首周38城平均招聘月薪10361元
  　　中新經(jīng)緯2月23日電智聯(lián)招聘發(fā)布《2024年春招市場(chǎng)行業(yè)周報(bào)(第一期)》顯示，節(jié)后首周平均招聘月薪10361元，比去年同期上漲3%。　　節(jié)后首周平均招聘月薪10361元　　數(shù)據(jù)顯示
- 宅男財(cái)經(jīng)｜專家稱房?jī)r(jià)又漲回來了
  　　【宅男財(cái)經(jīng)｜專家面對(duì)面】23日，國家統(tǒng)計(jì)局發(fā)布的2024年1月70城房?jī)r(jià)數(shù)據(jù)顯示，商品住宅銷售價(jià)格環(huán)比下降城市個(gè)數(shù)減少，商品住宅銷售價(jià)格環(huán)比降幅整體收窄、同比整體延續(xù)降
- 山姆的“窮鬼套餐”火了，4億中產(chǎn)汗流浹背！
  編排 | 李硯審核 | 李硯來源 | 品牌頭版近年來，受宏觀經(jīng)濟(jì)環(huán)境影響，在大眾消費(fèi)領(lǐng)域，消費(fèi)降級(jí)趨勢(shì)
- 特斯拉人形機(jī)器人工廠漫步：越來越像正常人類_特斯拉機(jī)器人長(zhǎng)什么樣
  快科技2月25日消息，特斯拉日前通過其社交媒體賬號(hào)，分享了一段最新視頻，展示其正在研發(fā)的Optimus人形機(jī)器人的流暢步行能力。視頻中，該機(jī)器人在測(cè)試場(chǎng)地內(nèi)行走，并配有詼諧的標(biāo)題完
- 周鴻祎：企業(yè)應(yīng)“All in AI” 建立AI信仰
  快科技2月25日消息，據(jù)媒體報(bào)道，360公司創(chuàng)始人周鴻祎在接受采訪時(shí)表示，企業(yè)想要切入AI應(yīng)該首先建立AI信仰，要往All in AI”的方向走。周鴻祎稱，現(xiàn)在企業(yè)對(duì)AI普遍向往都比較向往，但
- 貝萊德基金官宣！首任總經(jīng)理張弛離任，督察長(zhǎng)陳劍代任
  21世紀(jì)經(jīng)濟(jì)報(bào)道記者李域實(shí)習(xí)生黃易鼎深圳報(bào)道貝萊德基金總經(jīng)理變更一事，正式官宣！ 2 月 24 日貝萊德基金公告稱，總經(jīng)理張弛因個(gè)人原因離任

生成式AI“幻覺”困境如何破解

熱門資訊

推薦資訊

科技最熱文章