科技日報記者 劉霞
《自然》雜志一項分析顯示,越來越多科研人員正借助大語言模型輔助文獻(xiàn)檢索、撰寫稿件與編排參考文獻(xiàn)。然而,人工智能(AI)模型卻時而“無中生有”,捏造查無實據(jù)的虛構(gòu)條目。據(jù)預(yù)測,自2025年起,或有數(shù)萬篇學(xué)術(shù)出版物混入此類AI生成的無效引文。
有學(xué)者指出,若任由“幻覺引文”滲入學(xué)術(shù)體系,不僅會催生錯誤結(jié)論、干擾后續(xù)研究,甚至可能誤導(dǎo)科研方向。長此以往,將會悄然侵蝕公眾對科學(xué)的信任。

“憑空捏造”愈演愈烈
今年早些時候,法國圖盧茲大學(xué)計算機科學(xué)家紀(jì)堯姆·卡巴納克收到谷歌學(xué)術(shù)通知,稱其文章被《國際牙科雜志》一篇論文引用。他頗感錯愕:自己的研究本系探討如何識破偽造論文,與牙科領(lǐng)域風(fēng)馬牛不相及,且他對那篇被引文章竟毫無印象。他推測,此條引文極可能是AI杜撰出來的幻覺。
這只是冰山一角。多項調(diào)查與研究顯示,隨著大語言模型在文獻(xiàn)檢索、手稿撰寫和參考文獻(xiàn)整理中的普及,AI“憑空捏造”學(xué)術(shù)引文的現(xiàn)象正愈演愈烈。
引文錯誤在學(xué)術(shù)出版界并非新鮮事。美國西北大學(xué)范伯格醫(yī)學(xué)院學(xué)術(shù)倫理與誠信研究專家穆罕默德·侯賽尼表示,在生成式AI問世前,引文錯漏便已存在,如作者姓名拼寫有誤、出版年份或期刊標(biāo)題張冠李戴、數(shù)字對象唯一標(biāo)識符(DOI)缺失錯錄、被引文獻(xiàn)的實際內(nèi)容與引用者所述細(xì)節(jié)存在出入等。但如今的“幻覺引文”已非單純的信息偏差,而是徹頭徹尾的虛構(gòu),兩者性質(zhì)截然不同。
過去一年間,“幻覺引文”已頻頻現(xiàn)身各類文獻(xiàn)。一項針對三場計算機科學(xué)會議近1.8萬篇論文的分析顯示,無法溯源至實際出版物的參考文獻(xiàn)數(shù)量呈井噴之勢。今年1月公布的數(shù)據(jù)表明,2025年已有2.6%的論文至少包含一條“幻覺引文”,而2024年該比例僅為0.3%。今年2月的另一項研究則估計,在另外四場2025年計算機會議上,2%至6%的論文含有無法通過數(shù)據(jù)庫與期刊檔案核驗的標(biāo)題或參考文獻(xiàn)。
《自然》雜志新聞團隊與英國Grounded AI公司合作開展的獨家分析進一步證實,2025年至少有數(shù)萬篇期刊論文、專著及會議記錄可能摻雜AI生成的“幻覺引文”。
Grounded AI公司聯(lián)合創(chuàng)始人兼首席產(chǎn)品官尼克·莫利透露,2025年暴露的引文錯誤類型,與大語言模型普及前團隊所見的傳統(tǒng)錯誤大相徑庭。這一變化清晰表明,AI的廣泛使用正是該問題滋生的主因。
對此,美國俄勒岡州立大學(xué)政治學(xué)家艾莉森·約翰斯頓直言,科研人員或?qū)⒚媾R“幻覺引文”泛濫成災(zāi)的亂象。
多措并舉逐一核驗
面對來勢洶洶的“幻覺引文”,各類應(yīng)對工具與機制正應(yīng)運而生。
德國柏林自由大學(xué)神經(jīng)科學(xué)博士邁克爾·沃爾希奇,用Python編寫了一款專用腳本,對Crossref數(shù)據(jù)庫中的引文樣本進行交叉比對,精準(zhǔn)核查元數(shù)據(jù)錯漏。目前,他已篩出500余篇存疑文獻(xiàn),經(jīng)人工逐一核驗后,悉數(shù)公示于學(xué)術(shù)評議平臺PubPeer。
開源平臺CheckIfExist可自動核驗參考文獻(xiàn)是否被指定學(xué)術(shù)數(shù)據(jù)庫收錄,助學(xué)者避開“查無此文”的陷阱。與此同時,法國國家科研中心與卡巴納克團隊聯(lián)合推出免費工具bibCheck,目前已面向研究人員開放。該工具能精準(zhǔn)比對引文,核查其是否指向真實存在或已被撤回的文獻(xiàn)。
總部位于瑞士洛桑的“前沿”出版集團亦開發(fā)了一款內(nèi)部AI篩查工具,專用于稿件初審階段標(biāo)記完整性缺陷,涵蓋“幻覺引文”與無關(guān)引文等問題。
筑牢學(xué)術(shù)堤壩
在卡巴納克看來,含有“幻覺引文”的論文絕不應(yīng)堂而皇之地出現(xiàn)于學(xué)術(shù)殿堂。一經(jīng)發(fā)現(xiàn),出版方應(yīng)立即發(fā)布聲明,并視情況啟動更正或撤稿程序。
面對此類問題,出版界的應(yīng)對策略各有側(cè)重。SAGE與泰勒-弗朗西斯集團坦言,若查出的引文錯誤不影響結(jié)論,且不涉及更廣泛的學(xué)術(shù)不當(dāng)行為,通常采取拒稿或要求修改的處理方式。威立出版集團發(fā)言人則表示,一般僅就細(xì)節(jié)問題向作者發(fā)函澄清。施普林格·自然出版集團立場明確:對查實含有虛構(gòu)引用的稿件一律撤稿。《國際政治經(jīng)濟學(xué)評論》主編約翰斯頓的態(tài)度則更為嚴(yán)格,凡向該期刊投稿被查出此類問題者,將被永久取消重投資格。
至于“幻覺引文”是否以及在何種情形下構(gòu)成學(xué)術(shù)不端,學(xué)界仍有爭議。此類疏漏有時并非作者蓄意為之,但可能釀成嚴(yán)重后果。例如,部分作者為求便捷,借助大語言模型自動排版參考文獻(xiàn),卻未察覺AI已悄然篡改引文表述、錯置DOI,甚至憑空捏造條目。今年3月,侯賽尼與美國國家環(huán)境健康科學(xué)研究所生物倫理學(xué)家戴維·雷斯尼克聯(lián)名撰文指出,若綜述或文獻(xiàn)計量研究將子虛烏有的引文作為支撐核心論點的關(guān)鍵證據(jù),理應(yīng)將其定性為學(xué)術(shù)不端,因為這無異于偽造數(shù)據(jù)。
目前,各期刊對AI工具的管控尺度不一。多數(shù)出版商雖強制要求作者申報AI使用情況,但具體申報范圍尚無統(tǒng)一標(biāo)準(zhǔn)。無論如何,“人工復(fù)核”始終是防范風(fēng)險的最后防線。
侯賽尼等人強調(diào),每一處虛假引用,都是學(xué)術(shù)生態(tài)中的一道裂縫,需要人們用心修補,還科學(xué)殿堂一片澄明晴空。

網(wǎng)友評論