大腦基於內在模型進行「推理」一事,說明大腦不是像鏡子一樣被動地接收外在刺激的存在,反而是主動介入外在刺激,不僅賦予其意義,並加以改編重新打造。在這個賦予意義的過程中所具有的基本邏輯結構,就是查爾斯.桑德斯.皮爾斯所說的「假設性推理」(hypothetical inference)或「溯因推理」(abduction)。
當我們看見有著紅色柔軟花瓣的一朵花時,在識別這是「玫瑰花」的過程中就需要溯因推理。在識別花是「花」或紅的顏色是「紅色」的過程中也需要溯因推理。溯因推理是根據既有的知識(由過去經驗給出的原則)和特定刺激,主動推理出「啊,這東西是紅色的!」。從機率上來說,這是一種「貝氏推論」(Bayesian inference)。貝氏推論是在欲推論事件的先驗機率基礎上,納入事件的新訊息來更新先驗機率,以此計算出該事件發生的後驗機率分布。
我們的所見所聞都是大腦不斷主動預測和推理的結果。神探福爾摩斯通過符號掌握犯罪現場的「線索」,並解釋其涵義推理出犯人的過程,是溯因推理;有人看到玫瑰花的型態和顏色,識別出這東西叫做玫瑰花的過程,也是溯因推理,或者更進一步解釋玫瑰花代表「熱烈的愛情」,這也是溯因推理。正如莫里斯.梅洛-龐蒂(Maurice Merleau-Ponty)所強調的,「知覺」是一種主動積極的行為,而非被動的接受。
現在,讓我們透過皮爾斯的論點來了解溯因推理的意義。皮爾斯繼承了亞里斯多德所主張的各種形式三段論法,並且在比較了演繹法、歸納法、溯因法三種典型論證型態之後,全力強調溯因法的重要性。7演繹法是一種依照「規則→案例→結果」順序進行的邏輯結構,下面是我們熟悉的例子。假設有一個規則規定「所有人都會死」,與此同時有一個案例是「以諾是人」,那麼導出來的結果就是「以諾會死」。後來,皮爾斯又透過著名的一袋豆子為例,比較了演繹法、歸納法和溯因法三種論證型態。
規則:這袋子裡所有的豆子都是白色的。
結果:這豆子是白色的。
案例:這豆子來自這個袋子。
結果:這豆子是白色的。
規則:這袋子裡所有的豆子都是白色的。
規則:這袋子裡所有的豆子都是白色的。
結果:這豆子是白色的。
案例:這豆子來自這個袋子。
在介紹一袋豆子的例子時,皮爾斯還沒有提出表示「溯因推理」之意的「abduction」這個單詞,而是稱之為「假設」(Hypothesis)。從皮爾斯的著述中可見,除了假設之外,他還使用了推理(inference)、假設性推理(hypothetical inference)、假定(presumption)等各種術語來表達溯因法。最後,他才終於提出以「abduction」來指稱這個第三種論證法。皮爾斯指出,「我認為這第三種論證形式與亞里斯多德在《分析學全書》第二卷第二十五章中以「apagögé」之名有過不完整描述的論證形式相同」。事實上,亞里斯多德所謂「apagögé」的論證法,早已經消失在人類數千年歷史的長河中。根據皮爾斯的說法,這完全是「愚蠢的阿帕利肯」造成的。
亞里斯多德死後,他的遺稿有200多年不見天日,而花費巨資買下亞里斯多德遺稿的人,正是提奧斯出身的富豪,也是書籍收藏家阿帕利肯(Apellicon)。他對這批備受蹂躪的文稿加以整補,是最早編輯亞里斯多德龐大著作的人。根據皮爾斯的說法,「愚蠢的阿帕利肯看到自己無法辨識的單字,就隨便用毫不相干的單字填補進去,以至於他人根本看不懂亞里斯多德關於apagögé的說明在講什麼」。
後來,亞里斯多德的著作被送到羅馬,交給了著名的逍遙派學者泰蘭尼(Tyrannion)。身為優秀文法家的泰蘭尼也批評「阿帕利肯的編輯太過荒謬」。總之,皮爾斯說:「或許我的猜測是錯誤的,但至少亞里斯多德顯然是用了『apagögé』這個名稱來說明『假設性推理』,我將這個詞翻譯成英文的『abduction』(溯因)」。
亞里斯多德的三段論法中最具代表性的就是演繹法、歸納法和溯因法,其中溯因法在世上並不為人所知,是皮爾斯將其重新挖掘出來,為亞里斯多德沉睡了兩千多年的第三種論證法命名為「溯因法」,重新闡明了其意義。
我在翻譯安伯托.艾可(Umberto Eco)和托馬斯.西比奧克(Thomas Sebeok)的《三的徵兆》(The Sign of Three)這本書時,曾經在「譯者導讀」中對假設性推理(溯因推理)有詳細的介紹(本書韓譯版於1994年出版,書名是《邏輯與推理的符號學》,現已絕版;2015年重新翻譯改版上市,書名為《與符號學家的相遇——夏洛克.福爾摩斯》)。
我考慮了很久才決定將皮爾斯哲學和符號學中的核心概念「abduction」翻譯成「假設性推理」或簡稱「假推法」。1994年當我第一次翻譯這本書時,皮爾斯哲學在韓國學界還不怎麼為人所知,也沒有通用的譯詞。我是在1991年以義大利政府獎學金到波隆那大學留學,上了安伯托.艾可的符號學課程時才初次接觸皮爾斯的符號學。「deduction」是演繹法,「induction」是歸納法,這兩個英文單詞都有明確的譯詞,但「abduction」該怎麼翻譯才好,我真的摸不著頭緒。那時不像現在網路檢索引擎這麼發達,要找資料非常困難。好不容易找到的幾本翻譯書籍,譯者們對「abduction」各有不同的翻譯。譬如在尤根.哈伯瑪斯(Jürgen Habermas)的《哈伯瑪斯:認識與旨趣》(Knowledge and Human Interests)這本書中翻譯成「發想法」;在安伯托.艾可的《符號學理論》和《符號學與語言哲學》中翻譯成「推理法」。然而,為什麼會這麼翻譯,譯者卻沒有多做說明。我也到圖書館查詢了厚重的英韓辭典,又想著不知道日文是怎麼翻譯的,又查閱了英日、法日辭典,還是一樣沒有找到合適的翻譯詞。為了翻譯一個「abduction」,我所傾注的時間和精力簡直相當於翻譯一本書。當時查到的幾個代表性說法如下:
• 形成假設:從結論出發形成足以說明難解想法的假設;這是由皮爾斯命名,與歸納、演繹並列的論證三分法之一。(Random House English Japanese Dictionary, 2nd edition, Shogakukan : New York, 1994)
• 用皮爾斯的術語來說,這是一種推理上的操作,可以提前減少說明某種現象的假設數量。(Dictionnaire Francais-Japanais Royal, Obunsha: Tokyo, 1985)
• apagögé:在三段論法中,大前提為真,但小前提可能(probable)為真。(《英韓大辭典》,時事英語社 / Random House,1991)
• 一、apagoge:間接還原法;亞里斯多德對大前提為真、小前提可能為真的三段論法的命名。二、假設設定(發想):皮爾斯的命名,因為他認為這是與演繹、歸納並列,同為科學探究的三個發展階段之一。(《英韓大辭典》,金星出版社,1992)
然而,我覺得包括「假設設定」或「推理上的操作」等在內,沒有任何一個詞彙可以貼切地說明「abduction」的概念。而皮爾斯在介紹「abduction」時最強調的兩個概念就是假設(hypothesis)和推理(inference),也使用過假設性推理(hypothetical inference)這樣的術語。我認為「假設性推理」實在是最精準表達皮爾斯「abduction」概念的術語。而且,由於皮爾斯自己也是用演繹法和歸納法做為比對來說明「abduction」的,所以我認為將「假設性推理」縮減為三個字,稱之為「假推法」也是妥當的。自從我在1994年第一個將「abduction」翻譯成「假推」或「假推法」(假設性推理)以來,「假推法」一詞在韓國已經廣泛應用在各種書籍和學術論文中。
現在,讓我們透過福爾摩斯的推理過程,更仔細地探討溯因法。有一天,福爾摩斯一看到上門來找自己的一位女士,馬上就猜到說:「妳是打字員(typist)吧!」。女士承認自己是打字員的同時,也讚嘆福爾摩斯如傳聞一般非常厲害。柯南.道爾(Arthur Conan Doyle)雖然在書中將福爾摩斯高超的推理能力歸功於他的「觀察力」,但實際上,與其說是觀察力,不如說該歸功於他卓越的溯因推理能力。
福爾摩斯已經知道「打字打多了袖子會磨得發亮」這個規則(Rule),而且觀察到「女士的衣袖磨得發亮」的「結果」(Result)。從這樣的規則和結果,福爾摩斯推理出「這位女士打字打得很多,她是打字員」的案例(Case)。以公式說明的話,如下:
規則:打字打多了袖子會磨得發亮。
結果:這位女士的袖子磨得發亮。
案例:這位女士打字打得很多(所以她是打字員)。
就像這樣,由規則和結果導出案例,就是假設性推理(溯因推理),我簡稱假推法。將上述情況應用在演繹法上的話,公式如下:
規則:打字打多了袖子會磨得發亮。
案例:這位女士打字打得很多(她是打字員)。
結果:所以這位女士的袖子磨得發亮。
演繹法的特徵是結果(女士的袖子磨得發亮)必然是由兩個前提(規則和案例)所導出的。演繹法是不可能出錯的邏輯,只要我們接受「規則」為真,再觀察其「案例」,我們就能100%確定,充滿自信地說出其結果。也就是說,只要承認打字打多了袖子會磨得發亮這個普遍性規則,再得知某個人經常在打字的具體案例後,很自然地就可以導出這個人袖子磨得發亮的結果。演繹法就是像這樣完全不可能導出錯誤結果的邏輯結構。然而,也因為如此,演繹法並不能為我們提供任何新的訊息或知識。
結果:這位女士的袖子磨得發亮。
規則:所以打字打多了(如果是打字員),袖子會磨得發亮。
歸納法是近代科學的基本邏輯結構,力求透過客觀的觀察找出案例和結果,歸納成不變的法則。從這一點來看,歸納法可以在某種程度上產生新的知識。但是,即使有再多的案例和結果,也無法100%保證可以制定出規則。例如,A打字打得很多袖子磨得發亮,B也是打字打得很多袖子磨得發亮,C也一樣,D也一樣……到N都一樣。即使如此,從這裡導出的結果卻隨時有可能被推翻。用波普(Karl Popper)的話來說,這就是「可否證性」(falsifiability)。因此,雖然歸納法比演繹法更有可能產生新的知識,但結果的確定性卻相對較低。
另外,從結果的確定性層面來看,溯因法是最糟糕也最不確定的論證法。即使接受「打字打多了袖子會磨得發亮」這個規則,也觀察到「這位女士的袖子磨得發亮」的結果,但我們卻無法肯定「這位女士打字打得很多(所以是打字員)」的結論,只能「猜測」是這麼回事而已。因為袖子磨得發亮的案例有可能不是因為這個人打字打得很多,而是因為有強迫症,習慣在哪裡磨袖子,也說不定是剛好借了打字員朋友的衣服穿。
因此,溯因法的正確性遠不如歸納法,更不用說和演繹法比較了。溯因法是最不確定也最危險的論證法。但是,溯因法有個非常大的優點,那就是具有可以馬上誕下新知識的「生產性」。根據皮爾斯的說法,所有科學發現的起點都是溯因法,所有新的科學知識都始於溯因法。因為我們在進行任何觀察或研究之前,都是先建立假設,而要建立這樣的假設所不可或缺的,就是溯因法,所以皮爾斯才會稱之為「假設性推理」。
就如安伯托.艾可所指出的,約翰尼斯.克卜勒(Johannes Kepler)發現行星沿著橢圓形軌道運行也是先建立「行星被觀察到的幾個位置可以連成圓滑漂亮的橢圓形狀」的假設,才推理出來的結果。實際上,行星被觀察到的點可以連成的圖形數量多到難以計數,就像造成袖子被磨得發亮的原因多到難以計數一樣。而令人驚訝的是,克卜勒是利用溯因法推測出行星沿著「橢圓形軌道」運行的。「橢圓」這個結論不是根據觀察所得到的必然結果,而是想像力的產物,科學發現往往來自於基於想像力的溯因法。
溯因法和演繹法、歸納法不同,不是只有邏輯學家或科學家會用得到。在日常生活中,我們很少會用到演繹法或歸納法,但是我們每天都會用到溯因法。譬如,我們看到某家餐廳前面大排長龍,就會猜測那家餐廳的食物很美味,這是因為我們將餐廳前大排長龍視為食物美味的象徵。還有,早上起來看到地面濕濕的,我們會想到昨晚大概下過雨。這是我們從「下雨地面會濕」的規則和「地面濕濕的」的觀察結果,回溯到「應該下過雨」的案例。
我們在日常生活中不會基於「下雨地面會濕」的規則,來演繹實際上下雨天地面是否真的會濕。也很少人會在每次下雨時一一確認地面會濕,以此歸納出「下雨地面會濕」的規則。但是,當我們看到餐廳前大排長龍,我們會很自然地反向推理出「啊,那家餐廳的食物很美味吧!」。根據皮爾斯的說法,溯因法是唯一可以讓我們以理性對待未來的途徑。當我們一看到陰沉沉的天空會很自然地想到要下雨了,這就是溯因,而不是演繹或歸納。如果靠演繹或歸納,是連那麼簡單的猜測也做不到的。
皮爾斯舉了一個自己的實際經驗為例,他說:「有一天我在土耳其地方上的港口城市正走路要去參觀一個地方,碰巧遇上一個騎著馬的人,旁邊有四名各自騎在馬上的護衛,在他的頭頂上撐起一頂華蓋。我推測,有資格受到如此貴族待遇的人,除了管轄當地的地方首長之外就沒有了,這就是溯因法。」皮爾斯又舉出另一個化石的例子。當魚類化石在遠離大海的內陸地方被發現時,我們會推測那片土地過去應該是沉在海底,這也是一種溯因法。
當然,溯因法有可能經常出錯,這是溯因法的缺點,也是它的魅力。某家餐廳門口之所以大排長龍,有可能不是因為這家餐廳是網紅名店,而是因為當天作活動,或者是因為要雇用兼職人員,應徵者大排長龍。地面潮濕有可能不是因為下雨,而是因為天氣太乾燥,灑水車經過時灑了水,或者是因為上水道水管破裂,水溢了出來。不過,大多數的情況我們都能導出正確的結論。
皮爾斯說,我們都有一種與生俱來的正確溯因能力,這就像小雞剛破殼而出就會啄食或雛鳥自己就能在天空飛翔一樣,是一種類似天生的本能。福爾摩斯「令人驚訝」的推理能力,其實沒那麼驚人,因為那就像鳥會在天空飛翔一樣,是非常自然的事。我們每一個人在日常生活中都像福爾摩斯一樣經常在溯因推理。
根據皮爾斯的說法,在我們看到一朵玫瑰花,識別出這是玫瑰花的過程中,也會用到溯因法。我們透過累積下來的經驗,已經知道了「玫瑰花長這種模樣」(規則),所以當我們看到「長這種模樣的物體」(結果)時,就會溯因推理出「這是玫瑰花」(事例)。某兩個人之所以在看到同樣的事物或現象時會有不同的感受或不同的理解,是因為他們根據不同的經驗,將相異的「規則」套用在特定的結果上。如果我們仔細探究自己經歷過的所有誤會根源,就會發現,這其實源於彼此根據不同的經驗制定出不同的溯因「規則」。
皮爾斯對於人類在所有知覺過程中一定會做出「溯因推理」的見解,為現代腦科學,尤其是人工智慧設計者提供了許多靈感。當我們透過感覺資料「識別」某個對象時,無可避免地會經歷一個「溯因推理」的過程。大腦中存在著某種假設模型(內在模型),這個模型會投射在透過知覺傳入的感覺資料上。內在模型就是「規則」,傳入的感覺資料就是「結果」,以此為基礎推理出來的內容就成為我們看到和聽到的「案例」。
意識不斷將我們所經歷的事情改編成敘事,其出發點向來是溯因推理的「規則」。換句話說,這個規則在貝氏推論中就成了事前機率。當我們試圖透過心理肌力訓練來改變習慣性的敘事方式和內容時,最需要注意的事情就是改變這個「規則」。這個「規則」會成為內在狀態的生成模型(generative model),這個生成模型會對來自各個感覺系統的各種感覺訊息,賦予它們意義。因此,改變「規則」其實就是改變「生成模型」。8換句話說,我們為什麼要透過內在溝通訓練來強化心理肌力,目的就是為了改變這個生成模型。與此相關的具體方法會在穩定杏仁核的內在溝通冥想內容中詳細介紹。
來瞧瞧16世紀義大利畫家阿爾欽博托(Giuseppe Arcimboldo)的畫作(【圖5-5】),首先會看到的是一籃蔬菜水果(上圖),但如果把圖片旋轉180度,就會突然看到一張人臉(下圖)。兩張圖片所提供的視覺資料完全相同,為什麼下圖中會看到人臉呢?這是因為我們的大腦中有一個總是想從某個對象上捕捉到人臉或表情的強大內在模型。為什麼我們會在顛倒的蔬菜水果籃中看到「人臉」呢?這=與其說是圖片本身造成的,不如說是我們內在的某種解釋框架所導致的。當然,這時的推理邏輯結構就是皮爾斯所說的溯因法。
物理學家兼生理學家亥姆霍茲(Hermann von Helmholtz)是第一個提出當大腦在識別物體時一定會經過一個推理過程的想法,他的創想比皮爾斯早了約150年。亥姆霍茲不僅對熱力學,也對與視知覺相關的大腦活動非常感興趣,甚至對此建立了一套理論。他將眼睛視物時無意識且自動形成的機制概論化,稱之為「無意識推論」(Unconscious Inference)。無意識推論往往會在我們看著或聽著什麼的時候發揮作用,前面我們提到過的各種錯視現象,都是無意識推論的代表性例子。
根據亥姆霍茲的看法,視知覺只遵循其自身的規律,不受意識的控制。譬如,我們的眼中,太陽看似從東邊升起、從西邊落下。即使我們明白這是地球自轉造成的,但這個知識卻對視知覺作用產生不了任何影響。我們的意識清楚地知道日出日落是地球自轉造成的現象,但也不會因此使得西邊落下的太陽突然像是靜止不動,變成看起來是地球在移動。
亥姆霍茲認為,在視知覺作用的過程中自動形成無意識推論一事,證明了感覺資料的處理不是由意識或心靈,而是由更下層的感覺神經系統負責的。我們所認知的「真實」,是由感覺系統提交給意識的,而在這個知覺過程中,意識無從介入,也發揮不了影響力。這種無意識推論也會作用在人際關係上,當我們與他人溝通時,我們會無意識地自動解讀對方的非語言線索,藉以掌握對方的意圖或情緒。
亥姆霍茲認為,這種無意識推論是立足於歸納法邏輯上。但皮爾斯卻反駁亥姆霍茲的觀點,強調知覺過程中的推理具有明顯不同的邏輯結構,並且質疑「知覺真的是無意識推論嗎?」。也就是說,皮爾斯承認知覺過程中存在「推理」,但強調這種推理的邏輯結構不是歸納法,而是溯因法。皮爾斯更進一步表示,他相信不僅是所有的知覺過程,甚至是對歷史事實的認識與個人的記憶都是按照溯因法運作的。譬如,他認為我們會記得「我昨天做了怎樣怎樣的事情」,這是從自己現在擁有的記憶碎片和感覺推理而來的。而對於經驗的記憶和對真實的認識,是透過生成模型自上而下(top-down)的處理方式完成的。這個觀點和接下來我們要探討的弗里斯頓的主動推理理論可謂一脈相通。
顯而易見的是,亥姆霍茲是第一個建立「大腦基本運作方式的核心為『無意識推論』系統」理論的人。然而這個理論出現得太早了,受到哲學家和心理學家認定「推理只有意識做得到」的刻板觀念橫加阻撓,他的創想被忽視了100多年,長期不見天日。但是亥姆霍茲將大腦的本質理解為「推理機器」的想法,1995年經由彼得.達揚(Peter Dayan)和傑佛瑞.辛頓(Geoffrey Hinton)所發表的〈亥姆霍茲機器〉論文,重新復活成為機器學習(machine learning)的基本演算法之一,對人工智慧的發展有很大的幫助。有趣的是,深度學習演算法的創造者傑佛瑞.辛頓也和亥姆霍茲一樣,是精通生理學、物理學和心理學的學者。
「亥姆霍茲機器」將人類知覺系統建模為統計推理引擎,由認知(cognitive)模型和生成(generative)模型組合而成。認知模型會根據來自外在的感覺資料,推理出觸發特定感覺的可能因素的機率分布;生成模型——這也是由學習而來的——則用來訓練這樣的認知模型。透過這個模型,亥姆霍茲機器顯示出,即使沒有一位為這些從外界輸入的感覺資料「貼上標籤的指導教授」,也可以推理出感覺資料發生原因的機率分布。
亥姆霍茲機器的非監督式學習演算法,是假設進行推理的神經系統是由多層(multilayer)機率神經網路所組成的。認知網路會形成一個對傳入的感覺訊息有所反應的網路,而這個連結網路的形態資訊會上傳到隱藏的上層神經網路。相反地,生成連結網路則根據來自高階的形態資訊,重新組成連結形態的訊息,再發送到低階神經網路去。
這種不斷將與感覺訊息相關的連結網路資訊上傳的自下而上(bottom-up)過程,辛頓稱之為「喚醒相位」(wake phase)。此時,主要是透過以人工連結網路為中心的人工神經元在運作,將提高生成連結網路的預測機率作為目的,進行重組和改變。另一方面,根據內在模型持續影響低階神經網路的自上而下過程,則稱為「睡眠相位」(sleep phase)。此時,主要透過以生成連結網路為中心的神經在運作,把提高認知連結網路的預測機率作為目的,進行重組和改變。喚醒相位是一種自下而上的適應過程(從感覺訊息建立內在模型後重組的過程),睡眠相位則是一種自上而下的適應過程(根據內在模型建立處理感覺訊息的模型後重組的過程)。亥姆霍茲是第一個提出上層生成模型會自上而下影響外來感覺訊息的想法,所以這種演算法才被稱為「亥姆霍茲機器」。