哈?AI 秘密潛入 Reddit 社區(qū)," 操縱 " 用戶觀點 4 個月。
離譜的是,人類全程毫無察覺,而且被 AI 說服改變想法的概率,高達正常基準的 6 倍!
Reddit Lies 在 X 上發(fā)布了一則帖子,引發(fā)二百多萬網(wǎng)友圍觀。
Reddit 的 r/changemyview(CMV)版主最近曝光了一項研究,稱蘇黎世大學研究人員在 2024 年 11 月至 2025 年 3 月期間,瞞著 CMV 社區(qū)用戶,搞了一場未經(jīng)授權(quán)的實驗。
他們違背 CMV 社區(qū)規(guī)則,部署了 AI 賬號生成評論以研究 AI 如何影響和改變?nèi)藗兊挠^點。
先來看一下這項實驗。
在 r/changemyview 中,用戶就各類話題分享觀點,通過提出論點和反駁觀點來促使他人改變看法。
通用條件:LLM 僅接收帖子的標題和正文內(nèi)容。
個性化條件:除帖子內(nèi)容外,LLM 還會獲取原發(fā)帖人(OP)的個人屬性(性別、年齡、種族、所在地…),這些屬性是通過另一個 LLM 從原發(fā)帖人的發(fā)帖歷史中推斷得出的。
社區(qū)對齊條件:為確保回復符合社區(qū)的寫作風格和潛在規(guī)范,回復由經(jīng)過微調(diào)的模型生成,該模型使用實驗前帖子中獲得 " Δ " 的評論進行訓練。
發(fā)帖流程如圖:
團隊報告了每種處理條件下獲得 " Δ " 的評論比例。
結(jié)果在所有處理條件下,AI 表現(xiàn)都大幅超越人類水平,說服率是人類基線水平 3-6 倍。個性化條件的說服率為 0.18,通用條件為 0.17,社區(qū)對齊條件略低,為 0.09,但仍顯著優(yōu)于僅為 0.03 的基線水平。
下圖展示了不同用戶個體說服率的累積分布情況 ,有一部分是 " 專家用戶 ",他們之前在社區(qū)就得到過很多 " Δ "。
在個性化條件下,LLM 表現(xiàn)特別突出,在所有用戶里排到了前 1%,在專家用戶里排到了前 2%;通用條件下,排在所有用戶的前 2%,專家用戶的前 4%;社區(qū)對齊條件相對弱一些,在所有用戶里排在前 12% ,專家用戶里排在前 25%。
另外值得一提的是,團隊指出本研究已獲蘇黎世大學倫理委員會批準,并在 OSF 進行了預注冊。所有生成評論均由團隊的一名研究人員審核,以保不會發(fā)布有害或不道德的內(nèi)容。
研究指出,實驗仍在進行中,結(jié)束后會向社區(qū)妥善披露相關(guān)情況。
雖說研究團隊有自己的說法,但一些網(wǎng)友們可不買賬,對這種不經(jīng)授權(quán)就進行 AI 實驗的做法進行了譴責。
參考鏈接:
[ 1 ] https://x.com/reddit_lies/status/1916916134630117814
[ 2 ] https://regmedia.co.uk/202504/29/supplied_can_ai_change_your_view.pdf
[ 3 ] https://www.reddit.com/r/changemyview/comments/1k8b2hj/meta_unauthorized_experiment_on_cmv_involving/
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
— 完 —
點亮星標
科技前沿進展每日見