試想這樣一個場景:在一個木工車間,工人阿爾和弗蘭克正在愉快地聊天,這時,阿爾把一塊巨大的膠合板插入巨型圓鋸的鋸齒刀片裡。突然間,你意識到阿爾在靠近鋸片時並沒有使用安全防護裝置。當他的拇指伸向一個十分鋒利的圓形尖齒鋼圈時,你的心跳也立刻加速了。
阿爾和弗蘭克只顧著聊天,絲毫沒有察覺到阿爾的手指已經快要碰到極速旋轉的鋸片這一即將到來的危險。你心跳加速,滿頭大汗,迫切地想要提醒阿爾,可他只是你觀看的影片中的一個角色。
這出自加拿大國家電影局製作的一部影片——《不該發生的悲劇》(It Didn’t Have to Happen),在短短的12分鐘內講述了三起車間事故,以警示木工在工作時務必使用機器的安全防護裝置。就像即將伸向鋸片的手一樣,他們每個人的命運都是未知數,悲劇發生後才知道有多危險:阿爾的拇指斷在了圓鋸裡,另一個木工也劃破了手指,一塊厚木板還飛進了一名旁觀者的上腹部。
這部警示木工的影片頗為生動。加州大學伯克利分校的心理學家理查德·拉扎勒斯(Richard Lazarus)在其長達10多年的重大研究中,把這些令人毛骨悚然的事故描述視作一種情緒應激源。[1]他慷慨地把該影片複製給丹尼爾,便於其在哈佛大學做研究使用。
丹尼爾讓60名志願者觀看了這部影片,其中一組的志願者是正在學習心理學課程的哈佛大學學生,他們沒有任何冥想經驗。另一組志願者是冥想老師,且至少有兩年的實踐經歷。每一組中都有一半的志願者需要在觀看影片前進行冥想。丹尼爾讓哈佛大學的學生在實驗室裡進行冥想,而那些被分配到對照組(均為隨機分配)的人只需坐下放鬆自己。
丹尼爾坐在隔壁的控制室裡進行觀察,他發現,隨著影片中車間事故的發生,觀眾先是心率加快,汗水增多,之後又會慢慢恢復正常。相比之前沒有做過冥想的新手,有冥想經驗的志願者往往能夠更快地從目睹這些悲慘事件的壓力中恢復過來。[2]至少看似如此。
這項研究足以讓丹尼爾獲得哈佛大學的博士學位,並在心理學領域的頂級期刊上發表論文。然而,在我們回顧並仔細審查他的研究後,還是能發現很多問題。什麼樣的研究設計最好,或者說,什麼樣的研究設計得出的結果最令人信服,審核科研基金和期刊論文的人員都有嚴格的標準。從這個角度來看,丹尼爾的研究,甚至是今天大部分的冥想研究,都是有缺陷的。
例如,丹尼爾親自教授志願者冥想,或者讓他們放鬆自己,而丹尼爾是知道這兩種方式的預期結果的——冥想會產生更大的幫助,而這很有可能會影響他對兩組的說話方式,進而促使冥想組取得好的結果,而僅僅放鬆自己的對照組效果會差一些。
此外,雖然有313篇期刊論文引用了丹尼爾的實驗結果,但其中沒有一個作者嘗試重做這項實驗來檢驗他們能否得到類似的結果。這些作者僅僅假設丹尼爾的研究結果足夠可靠,可以用作得出自己結論的依據。
丹尼爾的這種研究態度並不是他獨有的,在今天依然盛行。可複製性是科學方法的一個重點,這在業內是眾所周知的。對於某個給定的實驗,其他任何科學家都應該能夠重做該實驗,並得出相同的結果或得出自己無法重做的結果,但是幾乎沒有人嘗試這麼做。
科學界普遍存在的一個問題就是缺乏重複實驗的精神,尤其是在涉及人類行為研究的時候。[3]在對心理學中最常被引用的100項研究結果重新進行系統實驗後發現,僅有39%的原始研究得以證實,而且僅有很小一部分心理學的研究得以重新做過,這個領域傾向於獎勵原創研究而非複製品。另外,和其他所有科學一樣,心理學存在很嚴重的業內發表偏倚:只有在取得重大研究成果之後,科學家才發表自己的研究。若沒發現什麼成果,極少有人願意就此發表論文。然而,那些沒有多大成果的發現本身卻是很有意義的。
接下來闡釋的是“軟”“硬”測量之間的關鍵性差別。如果要求人們就自己的行為、感受等軟測量(比如一個人當時的心情)做出報告,一些心理因素會在很大程度上影響他們的回答,他(她)們想要讓自己看起來很不錯,或者想讓調查者滿意等。然而,這些偏差卻不太可能甚至根本不能影響心率、大腦活動等生理過程。由此很難衡量這些偏差。
以丹尼爾的研究為例,他的研究在某種程度上依賴人們評估自己反應的軟測量。他採用的是心理學家最常使用的焦慮測評,要求人們根據一些項目(比如“感到擔心”的程度從“一點兒也不”到“非常”,從“幾乎從不”到“幾乎總是”)來對自己進行評定。[4]總的來說,人們在第一次嘗試冥想之後,會感受到壓力變小。這是冥想研究多年以來一個非常普遍的發現。眾所周知,自我報告易受“預期需求”的影響,這些信號會暗示人們報告積極的結果。
就連冥想新手也報告稱他們覺得壓力減小,感到更加放鬆。冥想者的一些數據顯示,壓力管理做得更好的自我報告比類似大腦活動的硬測量要出現得早。這可能意味著,在覺察出硬測量的變化之前,冥想者就能感受到壓力減小了。
但是人的心臟不會說謊。丹尼爾的研究採用了心率和出汗變化等生理指標。人們通常無法有意識地控制這些指標,因此,與其他指標相比,尤其是與那些主觀性很強、容易受偏差影響的自我報告的指標相比,它們能更準確地反映出一個人的真實表現。
丹尼爾論文中採用的主要生理學指標是皮電反應(GSR),腦電活動的爆發表示汗水增多。皮電反應是人體應激喚醒的標誌。正如某些猜測所認為的,在人類早期的進化過程中,汗水可保護皮膚不易受傷,從而在近身搏鬥時保護自身。[5]
大腦的測量指標比心率等“外圍”生理學指標更加可靠,但當時我們無法使用這種偏差最小、最具說服力的方法。因為在20世紀70年代,功能性磁共振成像、單光子發射計算機斷層顯像(SPECT)等腦成像系統和腦電圖(EEG)的計算機精密分析還尚未發明。[6]人體中距離大腦較遠的一些反應指標如心率、呼吸率、出汗量等,在當時對丹尼爾而言已經是最好的選擇了。[7]由於這些生理反應是由很多複雜的因素綜合在一起導致的,因此解釋起來容易混亂。[8]
這項研究還有另一個缺陷:由於當時的記錄技術很落後,對這些數據進行數字化處理需要花費很長時間。丹尼爾通過用針頭在連續的紙捲上不斷掃描獲得的墨點記錄出汗率。他需要花費好幾個小時來仔細觀察那些混亂的墨跡,然後把墨跡轉換成數字以進行數據分析。這意味著在每次意外事故發生前後都要數出能夠反映受試者出汗程度的墨點數。
關鍵問題在於:存在4種不同的條件——有經驗的冥想者與冥想新手被告知冥想或僅僅安靜地坐著。事故發生時,這4類實驗對象從高度緊張的狀態到正常狀態的恢復速度不同是否有意義?丹尼爾的記錄結果表明,冥想會使恢復速度加快,經驗豐富的冥想者恢復速度最快。[9]
“丹尼爾的記錄結果”這一措辭說明了另一個潛在的問題:記錄是丹尼爾本人做的,做實驗所付出的全部努力都是為了支撐他本人提出的假設。在這種情況下,很容易產生實驗者偏差,即設計研究和分析實驗數據的人可能會促使實驗結果偏向其預期結果。
在近50年之後,丹尼爾的記憶已經有些模糊不清了。據他回憶,在冥想者中,皮電反應是不明確的,即該反應可能已經處於事故反應的高峰期,或者在高峰期之後。他是在高峰期進行記錄的,而不是在恢復一開始就進行記錄。這種偏差的最終結果導致我們認為冥想者看到該事故以後出汗更多,恢復速度也更快(但是,正如我們所看到的,這已經是迄今為止冥想研究所採用的最先進的模式了)。
研究顯示,偏差包括兩個層面——有意識的偏差和無意識的偏差,而後者更難避免。至今,丹尼爾也不敢保證他給這些墨跡記錄的打分是毫無偏差的。與此同時,丹尼爾分享了大多數從事冥想研究的科學家面臨的困境:他們本身都是冥想者,很容易產生這樣的偏差,儘管自己是無意識的。