難辨真假！研究人員使用ChatGPT生成數據集支持科學假說

2023-12-17 23:19:52 來源：科學網微信公眾號

觀看：280

編譯｜卜金婷

ChatGPT又攤上事了。

11月9日，JAMA Ophthalmology刊登了一篇論文，研究人員使用GPT-4和其拓展的高級數據分析功能（ADA）配對，生成關于圓錐角膜患者的虛假數據集，從而支持一個未經證實的科學假說。

對于部分圓錐角膜患者而言，有兩種治療方法可供選擇：一種是穿透性角膜移植術（PK），即切除全層病變角膜，以捐贈者的健康組織取代；另一種是深板層角膜移植術（DALK），僅替換病變的部分角膜組織，保留角膜內層完整。

隨后，研究人員要求GPT-4 ADA編造臨床數據，以支持DALK比PK效果更好的結論。

GPT-4 ADA生成的數據包含160名男性和140名女性參與者。結果顯示，接受DALK的參與者在視力測量和眼部成像測試中得分均高于接受PK的參與者。

但真實情況并非如此。2010年報告的一項有77名參與者的試驗顯示，在術后長達兩年時間內，兩種手術效果相似。

“在外行看來，這顯然是一個真實的數據集。”英國曼徹斯特大學生物統計學家Jack Wilkinson說。

此外，Wilkinson還對其他版本的大語言模型生成的數據集進行了檢查，他表示這些數據集缺乏令人信服的證據，因為它們難以準確捕捉變量之間的關系。

應Nature新聞團隊的要求，Wilkinson和他的同事Zewen Lu評估了這個偽造的數據集。

結果顯示，許多“參與者”的性別和名字不匹配。此外，術前和術后進行的視力測量及眼部成像測試之間缺乏相關性。Wilkinson和Lu還檢查了數據集中是否存在非隨機的模式，眼部成像數值通過了這個測試，但年齡值以7或8結尾的參與者人數過多。

研究人員承認他們的數據集存在缺陷，只要仔細觀察就能發現端倪。意大利卡利亞里大學眼科外科醫生、研究的合著者Giuseppe Giannaccare說：“我們的目的是強調，在短短幾分鐘內，你就可以創建一個沒有真實數據支持的數據集，這些數據可以支持或反駁已有的科學證據。”

AI能夠深度偽造數據，這大大增加了研究人員和期刊編輯對研究誠信的擔憂。

微生物學家、職業學術打假人Elisabeth Bik表示，這意味著，研究人員能夠輕而易舉地生成大量虛假數據集。

EMBO Reports的主編Bernd Pulverer也認為這是一個令人擔憂的問題。“實際上，同行評審往往不會重新分析研究的數據，因此不太可能發現AI精心策劃的違規行為。”Pulverer補充說，“期刊需要更新質量檢查以識別AI偽造的數據。”

Wilkinson正在領導一個項目，主要是設計工具評估有問題的研究。“AI是導致問題產生的原因，但我們也可以基于AI自動化檢查其中一部分。”但他警告說，“AI的進步可能很快就可以規避這些檢查。”

參考鏈接：

https://www.nature.com/articles/d41586-023-03635-w

本文鏈接：難辨真假！研究人員使用ChatGPT生成數據集支持科學假說http://m.lensthegame.com/show-11-1569-0.html

聲明：本網站為非營利性網站，本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任，僅提供存儲服務。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

熱門資訊