設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          不靠譜的AI?這一研究領(lǐng)域需警惕

          2024-01-03 16:02:36 來(lái)源: 科學(xué)網(wǎng)微信公眾號(hào)

           2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          文|卜金婷 田瑞穎2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          《自然》近日發(fā)文警告,對(duì)人工智能(AI)的不當(dāng)使用或?qū)⒋呱罅坎豢煽炕驘o(wú)用的研究,導(dǎo)致可重復(fù)性危機(jī)。而基于AI的科學(xué)文獻(xiàn)中的錯(cuò)誤,是否已經(jīng)在實(shí)際臨床中造成真正的危險(xiǎn)尚不清楚。
          在2020年底新冠疫情大流行期間,由于一些國(guó)家病毒感染檢測(cè)試劑短缺,利用胸部X射線診斷的方法備受關(guān)注,但人眼很難準(zhǔn)確分辨感染與非感染個(gè)體之間的差異。一個(gè)印度團(tuán)隊(duì)的報(bào)告稱,AI可以利用機(jī)器學(xué)習(xí)分析X射線圖像。這篇論文被引用了900多次。
          次年9月,美國(guó)堪薩斯州立大學(xué)的計(jì)算機(jī)科學(xué)家Sanchari Dhar和Lior Shamir進(jìn)行了更深入的研究。他們使用與印度團(tuán)隊(duì)相同的圖像數(shù)據(jù)集來(lái)訓(xùn)練機(jī)器學(xué)習(xí)算法,但只分析其中不顯示任何身體部位的空白背景部分,結(jié)果顯示,AI仍然能夠在遠(yuǎn)高于隨機(jī)水平的情況下識(shí)別出感染病例。
          這意味著,AI系統(tǒng)可以利用這些圖像數(shù)據(jù)成功完成診斷任務(wù),卻無(wú)法學(xué)習(xí)到任何與臨床相關(guān)的特征——這可能使得它在醫(yī)學(xué)上毫無(wú)用處。
          Shamir和Dhar還發(fā)現(xiàn)其他幾個(gè)案例,AI從圖像的空白處或無(wú)意義部分得到了類似的結(jié)果,其中一些論文被引用了數(shù)百次。這也讓Shamir擔(dān)憂道:“這些例子很有趣,但在生物醫(yī)學(xué)領(lǐng)域可能是致命的。”

          “玩弄”數(shù)據(jù)和參數(shù)的AI2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2021年的一項(xiàng)研究,回顧檢查了62項(xiàng)使用機(jī)器學(xué)習(xí)從胸部X射線或計(jì)算機(jī)斷層掃描中診斷是否感染新冠,結(jié)論指出,由于方法論缺陷或圖像數(shù)據(jù)集中的偏見(jiàn),沒(méi)有一個(gè)AI模型在臨床上是有用的。
          “AI允許研究人員‘玩弄’數(shù)據(jù)和參數(shù),直到結(jié)果與期望一致。”Shamir說(shuō)。
          機(jī)器學(xué)習(xí)算法利用數(shù)據(jù)集訓(xùn)練,直到它們能產(chǎn)生正確的輸出,隨后研究人員在訓(xùn)練數(shù)據(jù)集的基礎(chǔ)上對(duì)其性能進(jìn)行評(píng)估。雖然專家強(qiáng)調(diào)必須保持訓(xùn)練集與測(cè)試集分開(kāi),但一些研究人員顯然沒(méi)有意識(shí)到這一點(diǎn)。
          這之間的關(guān)系很微妙:如果在訓(xùn)練數(shù)據(jù)集中取一個(gè)隨機(jī)子集作為測(cè)試數(shù)據(jù),很可能導(dǎo)致數(shù)據(jù)泄漏;如果數(shù)據(jù)集來(lái)自同一患者或同一科學(xué)儀器,AI可能會(huì)學(xué)習(xí)識(shí)別與該患者或該儀器相關(guān)的特征,而不是解決特定的醫(yī)學(xué)問(wèn)題。
          美國(guó)普林斯頓大學(xué)計(jì)算機(jī)科學(xué)家Sayash Kapoor和Arvind Narayanan在今年作報(bào)告時(shí)也指出,這種數(shù)據(jù)泄露問(wèn)題已在他們研究的17個(gè)領(lǐng)域中造成了可重復(fù)性問(wèn)題,影響了數(shù)百篇論文。
          糾正測(cè)試數(shù)據(jù)集也可能導(dǎo)致問(wèn)題。如果數(shù)據(jù)不平衡,研究人員可能會(huì)采用重新平衡算法,例如合成少數(shù)群體過(guò)度采樣技術(shù)(SMOTE),該技術(shù)可以為采樣不足的區(qū)域合成數(shù)據(jù)。事實(shí)上,SMOTE并沒(méi)有平衡數(shù)據(jù)集,而是制造了與原始數(shù)據(jù)固有偏見(jiàn)相同的數(shù)據(jù)集。
          即使是專家也很難避免這些問(wèn)題。2022年,法國(guó)數(shù)字科學(xué)與技術(shù)研究所的數(shù)據(jù)科學(xué)家Ga?l Varoquaux和同事在巴黎發(fā)起了一個(gè)挑戰(zhàn),要求參賽團(tuán)隊(duì)開(kāi)發(fā)出一種算法,能夠通過(guò)磁共振成像獲得的大腦結(jié)構(gòu)數(shù)據(jù)對(duì)自閉癥譜系障礙作出準(zhǔn)確診斷。
          該挑戰(zhàn)共收到了來(lái)自61個(gè)團(tuán)隊(duì)的589份算法,表現(xiàn)最佳的10個(gè)算法主要使用了機(jī)器學(xué)習(xí),但是,這些算法并不能很好地推廣到另一個(gè)數(shù)據(jù)集上,該數(shù)據(jù)集與提供給參賽團(tuán)隊(duì)用于訓(xùn)練和測(cè)試其模型的公共數(shù)據(jù)是保密的。
          Varoquaux認(rèn)為,本質(zhì)上是因?yàn)樵谛?shù)據(jù)集上開(kāi)發(fā)和測(cè)試算法,即使試圖避免數(shù)據(jù)泄露,最終也會(huì)因?yàn)榕c數(shù)據(jù)中的特定模式保持一致,從而使方法失去通用性。

          解決問(wèn)題2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM


          2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          今年8月,Kapoor、Narayanan及其同事提出了一種解決問(wèn)題的方法,即制定了一個(gè)基于AI的科學(xué)報(bào)告標(biāo)準(zhǔn)清單,包含涉及數(shù)據(jù)質(zhì)量、建模細(xì)節(jié)和數(shù)據(jù)泄漏風(fēng)險(xiǎn)等32個(gè)問(wèn)題。他們表示,該清單為基于機(jī)器學(xué)習(xí)的研究提供了跨學(xué)科的標(biāo)桿。2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          很多人認(rèn)為,使用AI的研究論文應(yīng)該完全公開(kāi)方法和數(shù)據(jù)。分析公司Booz Allen Hamilton的數(shù)據(jù)科學(xué)家Edward Raff在2019年進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),255篇使用AI的論文中只有63.5%能夠復(fù)現(xiàn),但加拿大蒙特利爾麥吉爾大學(xué)的計(jì)算機(jī)科學(xué)家Joelle Pineau等人表示,如果原始作者積極提供數(shù)據(jù)和代碼,那么重復(fù)率會(huì)高達(dá)85%。
          基于此,Pineau和同事提出了一份基于AI的論文協(xié)議,規(guī)定提交時(shí)必須包含源代碼,并根據(jù)機(jī)器學(xué)習(xí)可重復(fù)性清單進(jìn)行評(píng)估。但研究人員注意到,在計(jì)算科學(xué)領(lǐng)域進(jìn)行完全可重復(fù)性都是困難的,更不用說(shuō)在AI中了。
          實(shí)際上,可重復(fù)性并不能保證AI能提供正確的結(jié)果,只是保證提供自洽的結(jié)果。荷蘭埃因霍溫科技大學(xué)的計(jì)算機(jī)科學(xué)家Joaquin Vanschoren就警告說(shuō):“很多影響力高的AI是由大公司創(chuàng)建的,他們很少立即公開(kāi)代碼。有時(shí)也不愿意發(fā)布代碼,因?yàn)樗麄冋J(rèn)為還沒(méi)有準(zhǔn)備好接受公眾的審查。”
          “如果沒(méi)有足夠的數(shù)據(jù)集,研究人員就無(wú)法正確評(píng)估模型,最終只會(huì)發(fā)表能顯示很好性能的低質(zhì)量結(jié)果。”美國(guó)非營(yíng)利機(jī)構(gòu)可重復(fù)研究協(xié)會(huì)的主管Joseph Cohen強(qiáng)調(diào),這個(gè)問(wèn)題在醫(yī)學(xué)研究中十分嚴(yán)重。
          生成式AI潛在的風(fēng)險(xiǎn)更大,它們可以從其訓(xùn)練數(shù)據(jù)集中生成新的數(shù)據(jù)。例如,研究人員可以使用這些算法提高圖像的分辨率,除非十分小心,否則可能會(huì)引入人為痕跡。谷歌科學(xué)家Viren Jain表示,雖然自己致力于開(kāi)發(fā)用于可視化和操作數(shù)據(jù)集的AI,但他也擔(dān)心研究人員濫用生成式AI。
          另外,一些研究人員認(rèn)為,必須改變有關(guān)數(shù)據(jù)呈現(xiàn)和報(bào)告的文化規(guī)范,才能讓問(wèn)題真正得到解決。
          加拿大多倫多大學(xué)的計(jì)算機(jī)科學(xué)家Benjamin Haibe-Kains對(duì)此并不樂(lè)觀。2020年,他和同事就批評(píng)了一項(xiàng)關(guān)于機(jī)器學(xué)習(xí)檢測(cè)乳腺癌的研究:“由于缺乏支持該研究的計(jì)算代碼,該研究并沒(méi)有科學(xué)價(jià)值。”
          對(duì)此,該研究作者表示,由于部分?jǐn)?shù)據(jù)來(lái)自醫(yī)院,他們有隱私顧慮,無(wú)權(quán)分享全部信息。
          Haibe-Kains還指出,作者并不總是遵守?cái)?shù)據(jù)透明度準(zhǔn)則,期刊編輯在該方面通常沒(méi)有進(jìn)行強(qiáng)有力的反擊。他認(rèn)為問(wèn)題不在于編輯放棄透明度的原則,而是編輯和審稿人可能對(duì)拒絕分享數(shù)據(jù)、代碼等的真實(shí)理由了解不足,因此往往滿足于一些不合理的理由。
          事實(shí)上,作者可能并不了解確保其工作的可靠性和可重復(fù)性需要什么。
          今年Nature進(jìn)行的一項(xiàng)調(diào)查就詢問(wèn)了1600多名研究人員關(guān)于對(duì)AI論文的同行評(píng)審是否足夠的看法。對(duì)于使用AI進(jìn)行工作的科學(xué)家,有四分之一認(rèn)為評(píng)審是足夠的,四分之一認(rèn)為不夠,大約有一半表示不知道。

          “我們應(yīng)該努力適應(yīng)新工具”2Z5流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          并非所有人都認(rèn)為AI的危機(jī)正在逼近。
          “我還沒(méi)有看到AI導(dǎo)致無(wú)法重復(fù)的結(jié)果增加。事實(shí)上,如果謹(jǐn)慎使用,AI可以幫助消除研究人員工作中的認(rèn)知偏差。”神經(jīng)科學(xué)家Lucas Stetzik說(shuō)。
          雖然人們普遍擔(dān)心許多已發(fā)表AI研究結(jié)果的有效性或可靠性,但目前還不清楚這些結(jié)果是否會(huì)導(dǎo)致臨床實(shí)踐中誤診。“如果這種情況已經(jīng)發(fā)生,我也不會(huì)感到震驚。”芝加哥德保羅大學(xué)的Casey Bennett說(shuō)。
          在Cohen看來(lái),問(wèn)題可能會(huì)自行解決,就像其他新科學(xué)方法的初期一樣,“發(fā)表劣質(zhì)論文的作者今后也不會(huì)再有工作機(jī)會(huì),接受這些文章的期刊也會(huì)被認(rèn)為不可信,優(yōu)秀的作者也不會(huì)愿意在這些期刊上發(fā)表論文”。
          Bennett認(rèn)為,再過(guò)十幾年,研究人員將對(duì)AI能提供什么以及如何使用AI有更深入的認(rèn)知,就像生物學(xué)家花了很長(zhǎng)時(shí)間才更好地理解如何將基因分析與復(fù)雜疾病聯(lián)系起來(lái)一樣。
          “人們?cè)絹?lái)越多地向基礎(chǔ)模型靠攏,例如OpenAI的GPT-3和GPT-4。這比內(nèi)部訓(xùn)練的定制模型更有可能產(chǎn)生可重復(fù)的結(jié)果。”谷歌公司的科學(xué)家Viren Jain認(rèn)為,對(duì)于生成式AI,當(dāng)所使用的模型差不多時(shí),可重復(fù)性可能會(huì)提高。
          相關(guān)信息:
          https://www.nature.com/articles/d41586-023-03817-6

          本文鏈接:不靠譜的AI?這一研究領(lǐng)域需警惕http://m.lensthegame.com/show-11-1878-0.html

          聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任,僅提供存儲(chǔ)服務(wù)。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 2023年最“炫”的六大分子

          下一篇: 美國(guó)功勛火箭殞命:3年半重復(fù)使用19次

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲一区二区三区国产精品| 韩日午夜在线资源一区二区| 伊人久久大香线蕉AV一区二区| 日韩在线一区高清在线| 久久久国产精品亚洲一区| 日韩一区二区电影| 一区国严二区亚洲三区| 国产一区二区三区电影| 国语对白一区二区三区| 精品国产高清自在线一区二区三区| 无码午夜人妻一区二区三区不卡视频| 无码国产精品一区二区免费式影视 | 成人精品视频一区二区三区不卡| 日本一区视频在线播放| 丰满人妻一区二区三区视频53| 国产激情一区二区三区 | 久久一区二区三区99| 日本一区二区免费看| 91精品国产一区二区三区左线| 国产精品一区二区久久精品涩爱| 麻豆果冻传媒2021精品传媒一区下载| 亚洲午夜精品一区二区公牛电影院| 色噜噜狠狠一区二区| 日本一区免费电影| 亚洲av午夜福利精品一区| 男插女高潮一区二区| 91精品一区国产高清在线| 91福利视频一区| av无码一区二区三区| 亚洲av无码一区二区三区天堂古代 | 国产成人精品视频一区| 国产亚洲3p无码一区二区| 亚洲AV无码片一区二区三区| 精品免费久久久久国产一区| 99久久精品午夜一区二区| 日本一区二区在线| 国产一区二区三区在线观看影院 | 丰满爆乳一区二区三区| 多人伦精品一区二区三区视频| 日韩免费视频一区二区| 一级毛片完整版免费播放一区|