數(shù)據(jù)“欺詐”:統(tǒng)計(jì)“失誤”如何影響了科研誠(chéng)信? — 新京報(bào)
《如何確保你的欺詐科研數(shù)據(jù)真實(shí)可靠:從一個(gè)明星學(xué)者的數(shù)據(jù)欺詐事件學(xué)到的教訓(xùn)》一書,可以說(shuō)是數(shù)據(jù)失誤荷蘭統(tǒng)計(jì)學(xué)家克拉斯·西茨馬教授親身經(jīng)歷的荷蘭蒂爾堡大學(xué)社會(huì)與行為科學(xué)學(xué)院的院長(zhǎng)、社會(huì)心理學(xué)家迪德里克?斯塔佩爾數(shù)據(jù)造假事件的統(tǒng)計(jì)審查總結(jié)。這位發(fā)表過(guò)100 多篇頂級(jí)期刊論文的何影明星學(xué)者,在 15 年間系統(tǒng)性偽造了 entire 數(shù)據(jù)集,響科信新包括那篇發(fā)表在《科學(xué)》(Science)上、研誠(chéng)聲稱 “骯臟環(huán)境會(huì)加劇歧視行為”的京報(bào)重磅研究,實(shí)則全是欺詐憑空編造的謊言。
據(jù)失誤x-oss-process=image/resize,m_lfit,w_800)
《如何確保你的科研數(shù)據(jù)真實(shí)可靠:從一個(gè)明星學(xué)者的數(shù)據(jù)欺詐事件學(xué)到的教訓(xùn)》
作者: [荷]克拉斯·西茨馬(Klaas Sijtsma)
譯者:齊心
版本:新星出版社
2025年8月14日
在統(tǒng)計(jì)學(xué)家眼中,
“學(xué)術(shù)造假”意味著什么?
學(xué)術(shù)造假所引發(fā)的誠(chéng)信危機(jī),會(huì)對(duì)整個(gè)社會(huì)的何影信任度造成極大的沖擊。作為統(tǒng)計(jì)學(xué)家,響科信新克拉斯·西茨馬教授在參與調(diào)查并得出結(jié)論時(shí),研誠(chéng)提出了學(xué)術(shù)造假的京報(bào)不同性質(zhì)及其分類——其一,是欺詐沒(méi)有經(jīng)過(guò)實(shí)驗(yàn)收集數(shù)據(jù),而是按照自己假設(shè)的理論去“造數(shù)據(jù)”,這一類屬于道德和誠(chéng)信問(wèn)題,要全盤否定。另一類,則是很多學(xué)科的研究人員并沒(méi)有學(xué)過(guò)統(tǒng)計(jì)學(xué),在收集到原始的實(shí)驗(yàn)數(shù)據(jù)后,不知道自己所采用的統(tǒng)計(jì)和分析方式是否能最具有代表性,換句話說(shuō),每個(gè)發(fā)言的個(gè)體都認(rèn)為自己無(wú)法被平均、被代表、被概括,而我們的研究則需要在不同的個(gè)體上得出共性,那么這個(gè)統(tǒng)計(jì)的數(shù)據(jù)樣本是否能最大程度的代表這個(gè)人群,這個(gè)數(shù)據(jù)均值是否能得到更多樣本中個(gè)體的認(rèn)同,就有一個(gè)方法技巧和局限性的問(wèn)題了。
例如,網(wǎng)上發(fā)布的統(tǒng)計(jì)局的數(shù)據(jù),為什么和我們的感受不一致?以至于評(píng)論區(qū)留言最多的是——“這又是36計(jì)中的哪一計(jì)”,看來(lái),統(tǒng)計(jì)口徑和方法,不僅僅是數(shù)學(xué)問(wèn)題,也是政治問(wèn)題和社會(huì)問(wèn)題。我們所熟知的人均收入的數(shù)據(jù)發(fā)布,每次都能收獲無(wú)數(shù)的口水和爛番茄、臭雞蛋,但在將收入中位數(shù)這個(gè)概念引入之后,似乎比平均值的罵聲就小了很多,然而,收入平均值和中位數(shù),哪一個(gè)更科學(xué)、更接近真實(shí)?統(tǒng)計(jì)學(xué)家相信算法公式,而普通人只知道自己的直覺(jué)和感受,在書中,作者在這里普及了“P值”這個(gè)概念,也就是P值差異超過(guò)0.05、甚至只有0.01或者0.005時(shí),就會(huì)引發(fā)信任危機(jī)。這包括選擇樣本時(shí),需要注意的方差,也包括處理個(gè)別極端數(shù)值,比如網(wǎng)上常舉的“我和馬云一平均,都是年入千萬(wàn)”例子。
樣本的選擇只能是大多數(shù)人的生存狀態(tài),合理選擇是應(yīng)該去掉極端數(shù)值。同時(shí),在樣本數(shù)據(jù)按照統(tǒng)計(jì)方法無(wú)法得出“顯著”的結(jié)論時(shí),也就是P值大于0.05時(shí),意味著你所選擇的樣本數(shù)據(jù)結(jié)果無(wú)法有力支持你的論文觀點(diǎn),這時(shí)候,如果你選擇修改數(shù)據(jù)源、更換有利于自己的數(shù)據(jù)樣本,那么,“造假”的帽子就結(jié)結(jié)實(shí)實(shí)地戴上了。完全吻合的數(shù)據(jù)結(jié)果,一般只有在排除了各種干擾的實(shí)驗(yàn)室里才能產(chǎn)生,自然環(huán)境中總有偏差,不完美的數(shù)據(jù)結(jié)果和結(jié)論,往往才更符合實(shí)際。

韓國(guó)電影《舉報(bào)者》劇照。
數(shù)據(jù)一直是簡(jiǎn)單的,
復(fù)雜的從來(lái)都是人
荷蘭研究理事會(huì)2022 年的全國(guó)調(diào)查顯示,62% 的研究者承認(rèn)曾“選擇性報(bào)告符合假設(shè)的結(jié)果”(通俗點(diǎn)說(shuō),就是報(bào)喜不報(bào)憂),48% 的人會(huì) “在看到數(shù)據(jù)后調(diào)整研究假設(shè)”。這些被視為“靈活處理”的操作,實(shí)則已觸碰科研誠(chéng)信的紅線。所以,在C刊論文數(shù)量的科研考核模式里,“非升即走”的競(jìng)爭(zhēng)壓力往往會(huì)逼得科研人員走入“隱形陷阱”。
2016年,威徹茨(Wicherts)等人在《前沿心理學(xué)》發(fā)表的研究指出,34% 的心理學(xué)論文存在“p 值操縱”—— 通過(guò)反復(fù)調(diào)整分析方法,讓原本不顯著的結(jié)果變得顯著。這也就是公眾對(duì)今天的專家(磚家)和教授(叫獸)缺乏信心,認(rèn)為其喪失道德底線的誘因。本來(lái),個(gè)體的體感差異就會(huì)對(duì)樣本數(shù)據(jù)的結(jié)果提出挑戰(zhàn),而經(jīng)過(guò)操縱的樣本數(shù)據(jù)所得出的結(jié)論,就更難令人信服。
當(dāng)然,也有一部分“失誤”是“新手”無(wú)意為之??死埂の鞔鸟R教授在審查數(shù)百篇論文后發(fā)現(xiàn),80% 的研究錯(cuò)誤源于對(duì)統(tǒng)計(jì)工具的誤讀和錯(cuò)誤使用,而非惡意造假,但問(wèn)題是,在公眾看來(lái),這同樣也是科研誠(chéng)信的喪失,因?yàn)楣姛o(wú)法得知科研人員是否有主觀造假的意愿,但習(xí)慣于將事情往最壞的方面考慮,這也是流行的“底線思維”影響的結(jié)果。
阿姆斯特丹大學(xué)心理學(xué)系曾有一項(xiàng)研究試圖證明“性別與數(shù)學(xué)能力存在關(guān)聯(lián)”,研究者在分析120 份樣本時(shí),剔除了 12 個(gè)“異常值”—— 這些數(shù)據(jù)顯示女生數(shù)學(xué)成績(jī)優(yōu)于男生。調(diào)整后的數(shù)據(jù)果然呈現(xiàn)“男性成績(jī)顯著更高”的結(jié)果,并發(fā)表在某知名期刊上。但事后第三方用完整數(shù)據(jù)重新分析,卻發(fā)現(xiàn)所謂“異常值”恰恰反映了樣本的真實(shí)分布,剔除它們純屬研究者對(duì)“極端值處理原則”的誤解。這種因統(tǒng)計(jì)無(wú)知導(dǎo)致的結(jié)論偏差,在書中被稱為“善意的謊言”,卻可能比惡意造假造成更廣泛的誤導(dǎo)。更常見(jiàn)的錯(cuò)誤出現(xiàn)在數(shù)據(jù)處理環(huán)節(jié):范?京克爾2010 年對(duì)人格心理學(xué)論文的調(diào)查顯示,53% 的研究者使用 “列表刪除法” 處理缺失數(shù)據(jù)(直接刪掉含缺失值的樣本),卻未檢驗(yàn)這種方法是否會(huì)扭曲數(shù)據(jù)分布,從而導(dǎo)致結(jié)論出現(xiàn)系統(tǒng)性偏差。、

韓國(guó)電影《舉報(bào)者》劇照。
最后,克拉斯·西茨馬教授在書中給我們提出了一套“數(shù)據(jù)誠(chéng)信生存指南”。首先,完善預(yù)注冊(cè)制度。研究者需在收集數(shù)據(jù)前,將研究假設(shè)、方法和分析計(jì)劃上傳至開放科學(xué)框架(OSF)等公共數(shù)據(jù)庫(kù),同時(shí),作者在數(shù)據(jù)收集前需要通過(guò)同行評(píng)審,無(wú)論結(jié)果是否顯著都予以發(fā)表,增強(qiáng)了研究的可信度。其次,開放數(shù)據(jù)。數(shù)據(jù)不是私產(chǎn),而是科學(xué)共同體的公共資源?!缎睦砜茖W(xué)》2014 年開始強(qiáng)制要求作者公開原始數(shù)據(jù),結(jié)果發(fā)現(xiàn) 38% 的 “突破性研究” 因無(wú)法提供完整數(shù)據(jù)被撤回。2016 年,威徹茨團(tuán)隊(duì)調(diào)查發(fā)現(xiàn),要求公開數(shù)據(jù)后,論文中統(tǒng)計(jì)錯(cuò)誤的修正率從12% 升至 47%。最后,實(shí)行“統(tǒng)計(jì)咨詢強(qiáng)制制”—— 所有科研項(xiàng)目申請(qǐng)必須包含統(tǒng)計(jì)專家的審核意見(jiàn)。斯塔佩爾事件之后的蒂爾堡大學(xué),在實(shí)施3 年“統(tǒng)計(jì)咨詢強(qiáng)制制”后,論文因統(tǒng)計(jì)“失誤”被撤回的比例下降了54%。
數(shù)據(jù)一直都是不變的、最簡(jiǎn)單的,而復(fù)雜多變的從來(lái)都是人。在這本“數(shù)據(jù)生存手冊(cè)”中,克拉斯·西茨馬教授揭開了學(xué)術(shù)論文背后的數(shù)據(jù)江湖。畢竟,科學(xué)的偉大不在于永不犯錯(cuò),而在于敢于直面錯(cuò)誤。或許你曾為了“顯著結(jié)果” 反復(fù)調(diào)整分析方法,或許你因“樣本不夠”而猶豫是否要“優(yōu)化數(shù)據(jù)”,或許你從未想過(guò)自己信賴的統(tǒng)計(jì)軟件會(huì)給出誤導(dǎo)性結(jié)果,但正如書中所說(shuō):“科研誠(chéng)信不是道德枷鎖,而是讓數(shù)據(jù)說(shuō)話的底氣?!彼顾鍫栐诜ㄍド系膽曰诹钊诉駠u:“我創(chuàng)造的不是知識(shí),而是學(xué)術(shù)界想要的幻想?!边@句話戳中了科研生態(tài)的痛點(diǎn)——當(dāng)“發(fā)表數(shù)量”壓倒“研究質(zhì)量”,當(dāng)“完美結(jié)果”比“真實(shí)過(guò)程”更受追捧,科學(xué)的本質(zhì)正在被異化。
作者/李杰
編輯/劉亞光 申璐
校對(duì)/楊許麗
本文地址:http://m.818618.com/news/97d99198911.html
版權(quán)聲明
本文僅代表作者觀點(diǎn),不代表本站立場(chǎng)。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。