電影《她》(2013)劇照。
這項研究以預印本的形式發布在arXiv服務器上,測試了11個廣泛使用的大型語言模型(LLM)如何回應超過11500個尋求建議的查詢,其中包括許多描述不當行為或傷害的內容。
【資料圖】
結果顯示,AI聊天機器人(包括ChatGPT、DeepSeek、Gemini等)經常為用戶加油鼓勁,給予他們過分奉承的反饋,并調整回應以附和他們的觀點,有時甚至以犧牲準確性為代價。分析AI行為的研究人員表示,這種被稱為“奉承”(sycophancy)的討好傾向,正在影響他們如何在科學研究中使用AI,涵蓋了從頭腦風暴、生成假設到推理和分析等各種任務。
“‘奉承’本質上意味著模型相信用戶所說的話是正確的,”蘇黎世聯邦理工學院的數據科學博士生Jasper Dekoninck說。“知道這些模型有奉承傾向,讓我在給它們任何問題時都變得非常謹慎,”他補充道。“我總是會仔細檢查它們寫的每一個字。”位于馬薩諸塞州波士頓的哈佛大學生物醫學信息學研究員Marinka Zitnik表示,AI的奉承“在生物學和醫學領域非常危險,錯誤的假設可能會帶來實實在在的代價”。
在這項研究中,研究人員測試了AI的奉承傾向是否會影響其解決數學問題的能力。研究人員使用了今年競賽中的504個數學問題設計了實驗,他們修改了每個定理陳述,引入了細微的錯誤。然后,他們要求四個大語言模型為這些有缺陷的陳述提供證明。如果模型未能檢測到陳述中的錯誤,并進而“幻覺”出一個證明,作者就認為該模型的回答是“奉承”的。
研究人員補充說,AI的奉承傾向似乎在人們使用AI聊天機器人進行學習時表現得最為明顯,因此未來的研究應該探索“人類在學習數學時常犯的典型錯誤”。
此外,AI的奉承傾向已經滲透到他們使用大語言模型的許多任務中。有人工智能領域的研究員表示,當她使用ChatGPT來總結論文和整理思路,這些工具有時會照搬她的輸入內容,而不去核查來源。多智能體系統也被觀察到了類似的情況,這些系統集成了多個大語言模型來執行復雜的多步驟流程,例如分析大型生物數據集、識別藥物靶點和生成假設。
參考資料:
(1)AI chatbots are sycophants — researchers say it’s harming science
https://www.nature.com/articles/d41586-025-03390-0
編譯/李永博
編輯/羅東
校對/穆祥桐
相關推薦
- (2025-10-29)播報:AI比人類更愛拍馬屁?研究稱AI的討好傾向正在損害科研
- (2025-10-28)越秀11.94億元競得廣州番禺區宅地-焦點熱門
- (2025-10-28)廣汽埃安i60將于11月1日發布 提供純電和增程動力可選
- (2025-10-28)當前看點!神舟二十一號滿足發射要求 發射場區完成全系統發射演練
- (2025-10-28)焦點快播:生意社:10月28日安徽金禾三聚氰胺價格上漲
- (2025-10-28)綠軍傷病報告:杰倫·布朗確認可出戰與鵜鶘的比賽
- (2025-10-28)國泰海通:煤炭板塊周期底部確認 多因素共振供需逆轉 即時焦點
- (2025-10-27)韓國棋手金升珍奪得中日韓聶衛平杯圍棋大師賽冠軍
- (2025-10-27)每日視點!中超第28輪跑動榜:英博4將上榜,佩尼亞14209米破本賽季紀錄
- (2025-10-27)紫光國微:前三季度凈利潤12.63億元 同比增長25.04% 新消息
- (2025-10-27)證監會:督促存在退市風險的上市公司充分揭示退市風險 保障投資者知情權 新資訊
- (2025-10-27)東陽光Q3凈利2.93億元 同比增240%
- (2025-10-27)南京港:2025年前三季度凈利潤約1.41億元
- (2025-10-27)【速看料】華東醫藥:第三季度凈利潤9.33億元 同比增長7.71%
- (2025-10-27)每日信息:上饒市廣豐區泉波小學開展班級文化建設評比活動
- (2025-10-27)快訊:中國人民銀行將會同執法部門繼續打擊境內虛擬貨幣的經營和炒作
- (2025-10-27)Truist上調英特爾目標價至39美元
- (2025-10-27)萬邦德WP203A獲得美國孤兒藥認定|今日熱議
- (2025-10-27)每日資訊:濟川藥業第三季度歸母凈利潤為2.98億元,同比下降47.2%
- (2025-10-27)小田的Vlog|在星城偶遇“泰式美學”
- (2025-10-27)焦點快報!港股異動 | 德昌電機股份(00179)尾盤漲近6% 機構稱公司發展人形機器人業務有獨特優勢
- (2025-10-27)數說“新”變化丨快了19天!新疆鐵路貨運量突破2億噸 每日快訊
- (2025-10-27)僅35個觀眾,片方分賬404塊錢,下半年最慘電影出爐_今日看點
- (2025-10-27)陳平獲批擔任瑞眾人壽保險副總經理 看點
- (2025-10-27)半導體沖高回落!發生什么了!A股大跳水!
- (2025-10-27)食品級白油商品報價動態(2025-10-27) 頭條
- (2025-10-27)投保人如何處理合同爭議?|頭條
- (2025-10-27)銀行的投資組合優化如何提升風險控制?-每日視點
- (2025-10-27)樂道L90上市86天交付破30,000臺,明星海清一家成為車主
- (2025-10-27)通往霍山方向,六安又一條市區主干道封閉施工
每日推薦
- ETF聯接基金是什么意思?ETF基金和ETF聯
- 貨幣基金的收益高嗎?貨幣基金一般年收益
- 基金賣出了怎么還有收益顯示?基金已經贖
- 投資的基金買了幾天可以賣掉?基金入手多
- 基金終于回本了該不該贖回?基金終于回本
- 二月出境復飛航線超40條 節后部分機票價
- 重大事項變更!網易寶獲批增加注冊資本至
- 信達證券上市首日漲幅44%
- 總投資約486億元 北京今年首批50個重大
- 新年北京首月二手住宅網簽量再探底 價格
- 股價大漲 博云新材股東高創投擬趁機減持
- 2019華人歌曲音樂盛典在澳門舉行
- 喜迎十九大?歡度中秋節—傳統文化進社區
- 突發!吳敏霞夫婦挑婚戒被曝光!兩百萬鉆
- 《鐘山說事》 熱點聚焦:胡鵬飛的最美鄉
- 湖南御福天益生物公司被指涉嫌傳銷進行非
- 大同市城投公司劉建婷遭群眾舉報
- 魯能集團 “一帶一路”履責行動暨“海南
圖片新聞
48小時頻道點擊排行
-
0
1播報:AI比人類更愛拍馬屁?研究稱AI -
0
2當前看點!神舟二十一號滿足發射要求 -
0
3綠軍傷病報告:杰倫·布朗確認可出戰 -
0
4南京港:2025年前三季度凈利潤約1.41 -
0
5Truist上調英特爾目標價至39美元 -
0
6焦點快報!港股異動 | 德昌電機股份 -
0
7陳平獲批擔任瑞眾人壽保險副總經理 -
0
8食品級白油商品報價動態(2025-10-27 -
0
9山東新華制藥股份(00719.HK)績后跌超3% -
0
1043名新生棄讀東華大學,學生姓名有必 -
0
11瓜迪奧拉:我們今天不夠有侵略性,但 -
0
12摩恩電氣(002451.SZ)發布前三季度業 -
0
13今頭條!萬孚生物:前三季度凈利潤1. -
0
14久遠銀海(002777.SZ)發布前三季度業 -
0
15日本新型H3火箭7號機發射升空 -
0
16經典國民神車上新!長城哈弗H6L核心 -
0
17新沃創新領航混合A:2025年第三季度 -
0
18金信諾:聯席總經理周慶華因工作調整 -
0
19吳彥祖觀戰 5億歐米蘭贏不了副班長 -
0
20熱門:國投智能(300188.SZ):前三季度
ETF聯接基金是什么意思?ETF基金和ETF聯接基金區別有哪些?
貨幣基金的收益高嗎?貨幣基金一般年收益率多少?
基金賣出了怎么還有收益顯示?基金已經贖回為什么還有收益?
投資的基金買了幾天可以賣掉?基金入手多久才可以賣?
二月出境復飛航線超40條 節后部分機票價格跳水