抑郁癥是一種非常復(fù)雜的疾病,沒有扎實的證據(jù)表明抗抑郁藥可以幫助患者改善癥狀。 文章圍繞”抗抑郁藥是否對抑郁癥患者有好處”“現(xiàn)行抑郁癥治療方案是否合理”等爭議性問題,基于實證證據(jù)提出了截然相反的觀點。文章僅代表作者觀點。如有診斷或用藥方面的疑問,還請咨詢醫(yī)師。 1 悲傷與愧疚淹沒了你。你太累了,以至于無法思考。你的快樂迷失在無形的痛苦中。你的頭、背、腹部都在痛——真實的疼痛。你窒息在自己的靈魂沼澤中。這全部都是你的錯。你毫無價值,不如干脆去死。 盡管人們的經(jīng)歷以及癥狀的嚴(yán)重程度各有不同,這就是抑郁癥患者們的感受。這種可怕疾病的發(fā)生率大概是十分之一。為了治療,數(shù)百萬人在服用抗抑郁藥物。不幸的是,我們現(xiàn)在有理由相信抗抑郁藥是無效的。 要知道抗抑郁藥是否有效,我們需要密切關(guān)注這些藥物的最佳證據(jù)。學(xué)界已有許多抗抑郁藥的臨床研究,而且在過去十多年中也出現(xiàn)了很多涵蓋了這些研究的薈萃分析(meta-analysis,一種將多個研究的數(shù)據(jù)匯集到一個單一的分析中的方法)。然而,這類研究背后有一個問題:專家們對這些研究的優(yōu)缺點無法達(dá)成共識,至于這些研究可以得出怎樣的結(jié)論,他們也沒有統(tǒng)一答案。 在這個問題上,哲學(xué)可以幫忙??茖W(xué)哲學(xué)是研究科學(xué)概念和方法的學(xué)科,它可以告訴我們科學(xué)證據(jù)如何解釋世界。我目睹過抑郁癥的黑暗,一些親人和朋友與它斗爭許久;我開始利用自己身為哲學(xué)家的專業(yè)技能分析抗抑郁藥的證據(jù)。在深入挖掘抗抑郁藥數(shù)據(jù)的生成、分析和發(fā)表之后,我得出的結(jié)論是:抗抑郁藥幾乎沒有效果。 2 抑郁癥影響著許多人。就算你認(rèn)為本文的論證令人信服,最終傳達(dá)的信息可能會令你失望。如果你已服用抗抑郁藥,你可能會決定停藥,但我建議你謹(jǐn)慎決斷。關(guān)于停用抗抑郁藥會帶來什么,可靠的證據(jù)很少;但已有的證據(jù)表明,停用抗抑郁藥可導(dǎo)致戒斷反應(yīng)。此外,我們對于其他干預(yù)方式,例如談話療法和生活方式改變,也沒有扎實的證據(jù)。 因此,患者在考慮改變藥物或療法時,應(yīng)格外謹(jǐn)慎。在一篇短文中探討一個復(fù)雜主題,必然需要犧牲深度。所以,如果想更全面地了解文中的論點,請參考我的書《醫(yī)學(xué)虛無主義》(Medical Nihilism)。如果你患有抑郁癥,你的醫(yī)生應(yīng)該已經(jīng)對你的病情有足夠的臨床經(jīng)驗和深度認(rèn)識。盡管大部分醫(yī)生都高估了抗抑郁藥的優(yōu)點,而低估了其危害,你還是應(yīng)該繼續(xù)咨詢他們,或許還可以讓他們參考這篇文章。 關(guān)于抗抑郁藥有效性的最佳證據(jù),來自于隨機(jī)試驗(randomised trials)和這些試驗的薈萃分析。這些研究中的絕大多數(shù),都是由抗抑郁藥制造商所資助和控制的,其中顯然有利益沖突;這些試驗通常只持續(xù)數(shù)周,遠(yuǎn)遠(yuǎn)短于大多數(shù)人服用抗抑郁藥的時長;這些試驗中的受試者是經(jīng)過精心挑選的,通常不包括老年人、患有其他疾病或同時服用其他藥物的患者;換言之,受試者中不包含經(jīng)常使用抗抑郁藥的人群,意味著這些試驗結(jié)果不能推論到真正的病人身上;認(rèn)為抗抑郁藥有效的研究能發(fā)表,認(rèn)為它們無效的研究則通常不能發(fā)表(這種普遍現(xiàn)象被稱作“發(fā)表偏差”)。 舉一個著名的例子:2012 年英國制藥公司葛蘭素史克(GlaxoSmithKline)遭到刑事指控,他們承認(rèn)向兒童推廣使用抗抑郁藥帕羅西?。]有證據(jù)表明它對兒童有效)并誤報試驗數(shù)據(jù)。 3 這種量表的問題在于,受試者實際抑郁程度的微小變化,可能導(dǎo)致得分的大幅變化。例如,有三個關(guān)于睡眠質(zhì)量的問題,總共有 6 分,還有一個關(guān)于焦躁(fidgeting)的問題,總共有 4 分。因此,一種讓人睡得更好而且減少焦躁動作的藥物就可以將一個人的抑郁評分降低 10 分。 舉一個現(xiàn)實生活中的例子:英國最近的臨床指南要求藥物在這個量表上降低的抑郁評分,平均只有 3 分。當(dāng)一種尺度能夠衡量我們想要衡量的東西時,我們說該尺度具有“建構(gòu)效度”(construct validity)。抑郁癥量表的一個普遍問題是缺乏建構(gòu)效度,這會導(dǎo)致我們高估抗抑郁藥的有效性。 每項針對抗抑郁藥的試驗都使用了量表,來衡量試驗前后受試者抑郁的嚴(yán)重程度。這些量表存在嚴(yán)重缺陷,導(dǎo)致研究普遍高估抗抑郁藥的有效性。漢密爾頓抑郁量表是一種常用的量表。這個量表有 17 個問題,每個問題都有幾個選項,每個選項會得到各自特定的分?jǐn)?shù);將所有得分求和,就能得出抑郁癥嚴(yán)重程度的總值,最高 52 分。 為了測試一種新的抗抑郁藥,一個試驗需要表明實驗組中受試者的評分,比對照組中受試者的評分降低更多。該量表是由英國精神病學(xué)家馬克斯·漢密爾頓(Max Hamilton)于 1960 年發(fā)明的,并從那時起沿用至今(下文中提到的抑郁癥嚴(yán)重程度評分均來自于此量表)。 — 漢密爾頓抑郁量表 24 項版(部分) “安慰劑效應(yīng)”指患者的病征改善僅僅源于他們接受了醫(yī)療服務(wù),而不是由于藥物的生化特性。它的原理在于:僅僅期望在接受醫(yī)療服務(wù)后自己會有所改善,本身就可以改善癥狀。有些疾病對安慰劑的反應(yīng)比其他疾病更敏感,抑郁癥便是所有疾病中對安慰劑效應(yīng)最敏感的之一。 由于臨床試驗旨在發(fā)現(xiàn)藥物實際的生化作用,所以試驗中會包括接受安慰劑的對照組(有時對照組接受市場競爭者的藥物),并且實驗組或?qū)φ战M的分配對于受試者來說是未知的(這有時被稱為“盲法”)。為了估計藥物的積極生化作用,臨床試驗要將實驗組和對照組的測量結(jié)果進(jìn)行比較。 當(dāng)受試者準(zhǔn)確猜測到自己處在哪個組,就發(fā)生了破盲(blind-breaking)。這可能是由于副作用的出現(xiàn)或缺失。例如,抗抑郁藥的兩個常見副作用是體重增加和性功能障礙。因此,如果一項新抗抑郁藥試驗中的受試者體重增加,并且難以達(dá)到性高潮,她可能會準(zhǔn)確地猜測到她屬于實驗組。然后,這種猜測可以使她期待自己的癥狀會改善;于是,僅通過安慰劑效應(yīng),她的癥狀便能得到改善。 安慰劑效應(yīng)的神奇力量 尚未有充分證據(jù)表明抗抑郁藥試驗中破盲有多頻繁,但一些專家認(rèn)為破盲是常見現(xiàn)象。(實際上,一個簡單的改進(jìn)就能讓研究者了解試驗中安慰劑效應(yīng)的程度:只需要求受試者在試驗結(jié)束時猜測他們所在的組別即可。這種改進(jìn)并不常見,但其實在任何試驗中都很容易做到。) 因為在抗抑郁藥的試驗中存在破盲,而抑郁癥本身就對安慰劑效應(yīng)非常敏感,一些著名研究者,如哈佛醫(yī)學(xué)院的歐文·克什(Irving Kirsch)和丹麥北歐科克倫中心的彼得·哥徹(Peter G?tzsche)就認(rèn)為,這些試驗中無論多小的癥狀改善都可能完全是安慰劑效應(yīng)的結(jié)果。 4 一旦研究者完成了一場抗抑郁藥試驗,他們就得想辦法將試驗中的數(shù)據(jù)轉(zhuǎn)化為有意義的證據(jù)。這樣做的最佳方法,是測量實驗組和對照組抑郁癥嚴(yán)重程度降低的分?jǐn)?shù);兩組之間的差異就是所謂的“效應(yīng)值”(effect size)。它能讓現(xiàn)實生活中的病人粗略預(yù)估自己的抑郁癥狀會因藥物改善多少。我會在下文中告訴你詳盡試驗得出的結(jié)果。不過,我們首先要明白,數(shù)據(jù)可能成為欺騙的武器。 研究人員有多種數(shù)據(jù)分析的方法,但其中一些方法得出的證據(jù)既不可靠,也毫無意義。一個例子來自 2018 年在《柳葉刀》(世界上最重要的醫(yī)學(xué)期刊之一)上發(fā)表的關(guān)于抗抑郁藥的薈萃分析。此文由牛津大學(xué)精神病學(xué)家安德瑞·齊普萊尼(Andrea Cipriani)及同事撰寫,其中包括許多復(fù)雜的分析。但其中一個簡單的統(tǒng)計數(shù)據(jù)引起了廣泛討論,那就是抗抑郁藥的“比值比”(odds ratio)。 在這類研究中,“受益”通常被定義為“抑郁癥嚴(yán)重程度下降超過一半”。比值比則是“實驗組受益者的比值除以對照組受益者的比值”。結(jié)果顯示的比值比約為 1.5。從表面上看,這是一個非常坦誠的結(jié)果。但事實上,它給我們的信息很少。 我們可以用類比來理解這一點。假設(shè)我們正在測試一種減肥藥。在實驗組中的每 100 名受試者中,3 名受試者減掉 1 公斤,97 名受試者增加 5 公斤;在對照組中的每 100 名受試者中,2 名減掉 4 公斤,98 名受試者體重沒有變化。這種藥物對減肥有效嗎?經(jīng)過計算,我們知道這次試驗中減肥的比值比為 1.5,然而這個數(shù)字并沒有告訴我們?nèi)藗兤骄黾踊驕p少的重量——實際上,這個數(shù)字完全掩蓋了藥物的真實效果。 雖然這是一個極端類比,但它能表明我們在解釋薈萃分析時必須謹(jǐn)慎。然而不幸的是,許多領(lǐng)先的精神病學(xué)家都擁護(hù)這項研究,新聞頭條則誤導(dǎo)性地聲稱“藥物確實有效”。從這些研究人員的辛勤工作到鋪天蓋地的新聞報道(民眾最經(jīng)常接觸到此類信息的途徑)這個曲折過程中,一個簡單的數(shù)字變成了謊言。 如果分析得當(dāng),最佳的證據(jù)表明抗抑郁藥沒有臨床益處。值得參照的薈萃分析,如上文所述,應(yīng)該嘗試從所有抗抑郁藥試驗中收集證據(jù)(包括尚未發(fā)表的抗抑郁藥試驗)。當(dāng)然,我們不可能知道薈萃分析是否包括所有未發(fā)表的證據(jù),因為發(fā)表偏差的特征就是欺騙,無論是無意還是有意的。然而,這些薈萃分析是通過尋找盡可能多的數(shù)據(jù),來規(guī)避發(fā)表偏差的重要嘗試。那么,這些分析到底發(fā)現(xiàn)了什么呢? 在囊括盡可能多數(shù)據(jù)的薈萃分析中,與接受安慰劑的受試者相比,接受抗抑郁藥的受試者抑郁嚴(yán)重程度下降約 2 分。2 分——請注意,如果受試者僅僅是停止了焦躁行為,抑郁評分就會下降 4 分??挂钟羲幍膿碜o(hù)者及批評者都早已知曉,并年復(fù)一年地重復(fù)了這些結(jié)果。破盲、安慰劑效應(yīng)和發(fā)表偏差都能輕松解釋這微不足道的 2 分。 上文提到:臨床指南認(rèn)為藥物必須將受試者抑郁嚴(yán)重程度評分降低 3 分以上才算有效。因此,抗抑郁藥并不達(dá)標(biāo)。一些精神科醫(yī)生認(rèn)為這個標(biāo)準(zhǔn)太低了——他們認(rèn)為,一種具有臨床意義的抗抑郁藥必須將抑郁評分降低至少 7 分(與安慰劑相比)。沒有藥物能做到這一點。 5 簡而言之,我們有充分的理由認(rèn)為抗抑郁藥對抑郁癥患者沒有臨床意義上的好處。相反,我們知道這些藥物有許多副作用,包括體重增加、性功能障礙、疲勞和失眠。一些研究表明,抗抑郁藥與暴力、自殺、童年和青少年攻擊行為以及女性精神暫時失常之間存在聯(lián)系。 早期理論認(rèn)為抑郁癥是由 5- 羥色胺(serotonin)濃度過低導(dǎo)致的。由于被稱為“選擇性 5- 羥色胺再攝取抑制劑”(SSRIs)的抗抑郁藥有助于提高 5- 羥色胺水平,人們普遍認(rèn)為用 SSRIs 治療抑郁癥有堅實的理論基礎(chǔ)。然而,現(xiàn)在大多數(shù)研究人員認(rèn)為這是一種過度簡化和誤導(dǎo)性的理論。 5- 羥色胺理論的主要“證據(jù)”之一是 SSRIs 可有效治療抑郁癥,其思路如下:前提一,SSRIs 調(diào)節(jié)病態(tài) 5- 羥色胺濃度;前提二,SSRIs 治療抑郁癥;結(jié)論:抑郁癥是由病態(tài)的 5- 羥色胺濃度導(dǎo)致的。請注意:即使這種推理具有說服力,也不能為 SSRIs 有效提供依據(jù),因為“SSRIs 能治療抑郁癥”正是推理的一個前提。我們不能循環(huán)論證。而且,上文也已經(jīng)質(zhì)疑了前提二。 似乎還有一種理論反對抗抑郁藥。一些批評者聲稱,許多患者被診斷出的“抑郁癥”并非真正的疾病,而是正常生活問題的“醫(yī)學(xué)化”——正常的痛楚、壓力、焦慮或僅僅是郊區(qū)生活的寂寥都被納入了醫(yī)學(xué)的管轄范圍。照這個說法,如果一個悲傷的病例被過度醫(yī)學(xué)化,用藥物治療它也是不恰當(dāng)?shù)摹?/p> 但是,我不認(rèn)為這種對抗抑郁藥的批評令人信服。這種批評隱含著關(guān)于“疾病”、“正常”的本質(zhì)和醫(yī)學(xué)管轄權(quán)的種種爭議性前提。我們也借助外在幫助來治療生活中的許多正常問題,例如用咖啡治療晨起嗜睡,用酒精治療羞怯,用藥物治療勃起功能障礙。簡而言之,抑郁的病理生理學(xué)以及抑郁的醫(yī)學(xué)化等方面的理論考量,并不能推導(dǎo)出關(guān)于抗抑郁藥有效性的結(jié)論。 但另一方面,我們應(yīng)該警惕那些將抑郁癥歸咎于某種化學(xué)物質(zhì)缺乏的簡單理論——正如大多數(shù)研究人員所認(rèn)為的一樣,抑郁癥與壞血?。ㄓ删S生素 C 缺乏導(dǎo)致)和 1 型糖尿?。ㄓ梢葝u素缺乏導(dǎo)致)不同。我們可以用維生素 C 治療壞血病,用胰島素治療 1 型糖尿病,但由于抑郁癥是一種復(fù)雜的疾病,僅通過調(diào)控化學(xué)物質(zhì)水平來成功治愈它是不可行的。 在本文中,我一直質(zhì)疑抗抑郁藥的試驗證據(jù)。但雖然這些試驗有諸多問題,它們還是我們研究抗抑郁藥有效性的最佳方式。然而除此之外,我們還可以考慮另一種方式:真實患者的經(jīng)驗。你,或你的朋友和親人,可能已服用抗抑郁藥——這可能使你相信這些藥對某些人有效。 關(guān)注病人對藥物的反饋是良好醫(yī)療的必要條件,但這種反饋通常不能指導(dǎo)我們進(jìn)行因果推斷。在確定抗抑郁藥是否有效時,第一人稱報告是不可靠的。這其中至少有三個原因:首先,抑郁癥癥狀的嚴(yán)重程度隨時間波動,人們傾向于在癥狀較嚴(yán)重時尋求治療。因此,在接受治療后癥狀可能會改善,不一定是因為治療有效,而可能僅僅是因為時間流逝,如同傷口逐漸愈合。 其次,抑郁癥對安慰劑反應(yīng)非常敏感。對照組中的大部分受試者,抑郁評分降低多達(dá) 10 到 15 分。安慰劑的效果是驚人的——例如,大的藥片比小的藥片對患者可以產(chǎn)生更大的影響。 再者,確認(rèn)偏差(confirmation bias)是指人們傾向于注意到那些能證實他們期望的證據(jù),而忽略降低他們的期望的證據(jù)。我們都有確認(rèn)偏差:服用抗抑郁藥后,人們往往更多注意到健康改善的跡象,而不是負(fù)面的跡象。 因此,如果你聽說有人受益于抗抑郁藥,這可能是由于疾病的嚴(yán)重程度在隨著時間波動,被安慰劑效應(yīng)混淆視聽,并且被確認(rèn)偏差夸大了效果。 這并不是在質(zhì)疑患者反饋的真實性。他們的親身經(jīng)歷是醫(yī)學(xué)中最真實、最重要的現(xiàn)象,我們必須聆聽。但是,當(dāng)我們遠(yuǎn)離臨床案例,坐在辦公桌前用數(shù)據(jù)、科學(xué)和清醒的反思聆聽時,我們聽到了什么?安慰劑,而不是百憂解。 翻譯:杜璇 審校:阿莫東森、有耳 編輯:小葵花 編輯: 黃建琴 |
|