對精神疾病和酬賞系統的新理解

主動推理的觀點與精準精神醫學

在預測過程中被視為大腦核心操作方式的主動推理模型，不僅是大腦的一般運作方式，對於包括思覺失調症在內的各種精神疾病的肇因，也提供了非常重要的啟示。醫學界嘗試以主動推理模型為基礎來解釋精神疾病肇因和治療法，在某種程度上來看，也是理所當然的事情。精神醫學的傳統觀點是立足於「三明治模型」，也就是按照人類大腦依序處理知覺、認知、行為三種訊息的過程。現在，這個「陳舊」的模型已經快速地被新的預測模型取代，新的預測模型更具有結構主義和行為主義性質，並且考慮到遞歸（Recursion）的相互作用和動態的因果關係。

自從醫學界首次嘗試以弗里斯頓的主動推理模型為基礎，來解釋思覺失調症的幻覺和妄想以來，各種將精神疾病視為大腦推理功能障礙的觀點迅速傳播開來。一種認為精神疾病源於平衡先驗信念與新感覺訊息的系統出錯的看法，正廣泛傳播開來。健康的大腦在各種感覺訊息中會忽略掉無用或錯誤的訊息，只根據預測誤差修正先驗信念，將重點放在有用和重要的訊息上，以進行推理。根據主動推理模型來看的話，當這個系統出現異常時，表現出來的就是各種精神疾病。

預測誤差來自自下而上的外界感覺訊息，與自上而下的預測模型之間的「差異」。這種差異的相關資料，即預測誤差會傳到系統最上層，更新初始假設的先驗信念。作為推理機器的大腦透過自下而上的預測誤差與自上而下的預測相互作用，嘗試作出對環境和這個世界的最佳解釋。這時，預測誤差還談不上是具有解釋價值的訊息。而各種來自感覺器官傳送上來的各類型感覺訊息蜂擁而至，此時就會發生各種類型的預測誤差，大腦就必須決定要著重在那些訊息上，這裡面最重要的是「正確性」（precision）。就執行貝氏推論的大腦立場來看，預測誤差是高品質的訊息，比先驗信念更正確，也更值得信賴。因此，預測誤差會得到大腦更多重視，對知覺也產生更多影響。

從生理學的觀點來看，大腦會選擇合乎標準類型的預測誤差，這可以說是由與「注意力增益控制」（attentional gain control）相關的突觸增益控制機制所媒介的。「增益控制」的概念讓各種層面的觀點得以成立，不僅可以從最簡單的「古典突觸機制」的角度來看待，或者稍微複雜一點，也可以解釋為是基於同步增益控制功能的「活性-抑制的均衡模型」。換句話說，大腦的選擇可以看作是由抑制性中間神經元（interneuron）控制的快速同步神經細胞對預測誤差系統的動態選擇。這種看法將計算神經學的邏輯必要性與神經生物學的機制連結起來。這是一種結合心理病理學和病理生理學的看法。

從這個角度來看，自閉症是一種對無意義雜訊的感覺訊息降低權重值的系統出現異常的狀態。這種異常使得自閉症患者無法「增益控制」無意義且不必要的感覺訊息，因而出現過度敏感的反應。同樣地，無法正確處理與情緒相關的預測誤差時，就會引發憂鬱症或焦慮症。

弗里斯頓的主動推理和預測模型不只在腦科學家，也在精神醫學家之間愈來愈受到矚目，也讓各種從新的角度對精神疾病提出的清晰見解得以成立，而且在診斷和治療上開闢了新的途徑，弗里斯頓本人稱其為「精準精神醫學」（precision psychiatry）。18不過，這個詞具有雙重的意義。所謂精準醫學原本是指在診斷與治療上利用基因、環境、生活習慣等與個人特徵相關的大數據，因人而異地進行精準診斷和提供客製化治療的一種新型醫療系統。自2015年美國政府宣布啟動精準醫療計畫（precision medicine initiative）之後，人們對精準醫療的興趣日益濃厚。因此，精神醫學界呼籲引進精準精神醫學的聲音也越來越高。

弗里斯頓說，他「有一種想玩文字遊戲（wordplay）的衝動」，便稍微扭曲了「精準」的涵義。「精準醫療」原本意思是根據個人的各種訊息進行量身訂製的診斷和處方。但是弗里斯頓所說的「精準」精神醫學，則是將大腦對訊息處理的正確度與精準度問題視為精神疾病的核心關鍵。弗里斯頓強調，他所說的精準精神醫學與原本意思的精準醫療之間有密不可分的關係。

每個病人各自擁有不同的先驗信念和預測模式，弗里斯頓強調，唯有找出每個病人的這種預測模式，也就是說，唯有正確推測和診斷患者大腦是以何種錯誤的方式進行推理，才能成就真正意義上的「精準精神醫學」。不只要觀察基因或生活習慣的個別差異，還必須掌握在主動推理過程中個人的具體特徵，才能實現真正的「精準精神醫學」。

幻覺與妄想的新理解

作為原本專門治療思覺失調症的精神科醫生，弗里斯頓認為思覺失調症的主因在於主動推理過程的問題。從自由能原理的角度來看，焦慮症或憂鬱症等情緒障礙，以及自閉症、思覺失調症等精神疾病的根本原因，也在於主動推理過程的紊亂。這就是精神醫學界至今無法闡明包括思覺失調症在內的各種精神疾病的明確生物學機制的原因。

實證研究結果顯示，思覺失調症患者確實存在推理過程的障礙，也就是在感覺訊息和內在模型之間存在週期性推理障礙。自下而上的推理過程中，週期性障礙的發生與陽性症狀密切相關；而自上而下的推理過程中，週期性障礙的發生則與陰性症狀密切相關。

思覺失調症的症狀通常分為陰性症狀和陽性症狀兩種類型。陰性症狀存在於一般人身上，但思覺失調症患者身上沒有或明顯下降，表現出來的例子包括言語障礙、動機缺乏症、失樂症、先天性無痛症等。陽性症狀不會出現在一般人身上，只會存在於患者身上，典型的例子就是幻覺和妄想。

幻覺是患者看到或聽到實際上並不存在的事物，如果經常說自己聽到有人跟自己說話或說耳朵裡有竊聽器聽到了聲音，這是「幻聽」；而如果經常說自己看到別人看不見的東西，這是「幻視」。根據馬可夫覆蓋模型，在感覺狀態的主動推理過程中發生異常，無法修正預測誤差時，就會出現這種障礙。如果是一般人，感覺狀態會有一個對傳入的感覺訊息透過主動推理產生知覺碎片，再將這些知覺碎片對照新傳入的感覺資料，持續不斷修正預測誤差的過程。當這個「誤差-修正」的推理過程發生異常時，就會產生實際上不存在或被扭曲的知覺碎片，表現出來就是幻覺。換句話說，基於既有的先驗信念生成某種內容的生成模型，原本應該根據新傳入的感覺訊息不斷修正和更新，但這個修正預測誤差的推理系統卻呈現無法正常運作的狀態。

不是只有思覺失調症患者才會出現幻視或幻聽的情況，一般健康的人也會有幻覺的經驗，那就是作夢的時候。當一般人的大腦切換到快速動眼期睡眠時的運作方式，竟然與思覺失調症患者的大腦運作方式驚人地類似。我們在夢裡經歷的事情之所以不合邏輯、荒誕無稽，是因為睡覺時不同於清醒時，能夠控制主動推理誤差的感覺訊息無法傳達到大腦的緣故。作夢的時候，雙腿裹在棉被裡的感覺，就像被巨怪抓住了雙腿。當我們清醒的時候，棉被透過雙腿持續傳入的感覺會立即修正「被怪物攻擊」的預測誤差。但是睡覺的時候，感覺訊息的傳入被切斷，就無法修正預測誤差，因此大腦的推理系統就會延續荒誕的故事敘述。也就是說，因為無法啟動修正主動推理誤差的機制，所以作夢期間就會像知覺失調患者一樣經歷不合邏輯的幻覺。

閉眼冥想時也一樣，清醒時新的視覺訊息會透過眼睛不斷傳進來，大腦可以根據這些訊息修正預測誤差，正確「看到」什麼事物。但是在清醒狀態長時間閉著眼睛時，大腦的生成模型仍舊生成各種圖像，卻因為處於新視覺訊息的傳輸被切斷的情況下，因而無法修正這些圖像。也就是說，自上而下生成的圖像原本應該透過自下而上輸入的視覺訊息即時修正預測誤差，但由於閉著眼睛，新的視覺訊息無法輸入，導致大腦的生成模型隨意（這簡直就是充滿自由能的情況）生成的各式各樣圖像全都生動地「呈現」在眼前。

我們可以做個實驗，在閉眼的狀態下，不要打瞌睡，集中精神注視眼前會出現什麼東西。閉眼狀態下支撐30分鐘左右不要睡著，專注看著眼前的話，感覺狀態的生成模型就會活躍地運作，通常眼前會清楚地呈現人臉或動物的模樣，或者是明亮的光線或繽紛的色彩。即使我們睜著眼睛一直注視同一個地方，物體的型態也會慢慢地扭曲起來。當我們一直看著地板或窗框時，慢慢地地板和窗框會看起來就像在動似的，或者上面的圖案看起來不再是平面，而是立體呈現。這時，最重要的是不要轉動眼球，因為眼球一動，新類型的視覺訊息就會傳輸進來，預測誤差立刻會被修正。所以不要讓眼球轉來轉去，集中看著一個地方，看了一陣子之後你就會體驗到眼前物體變形的視覺經驗。

進行傳統冥想修行時，有時候我們眼前也會呈現一些物體，叫做「相」（nimitta），這被視為修行上升到一個更高境界的指標。對於「相」會在後面關於修行的部分再詳細介紹，這裡先要澄清的是，有什麼東西呈現在我們眼前的現象，與冥想修行的效果沒有太大的關係。只要閉上眼睛或長時間處在完全黑暗的地方，任何人都會看到各式各樣不同的圖像或光線。因此，冥想時即使眼前出現什麼，那也和冥想本身沒有任何關聯。這只是證明大腦與視覺中樞相關的主動推理系統和自上而下的生成模型在正常運作。

從上述現象是基於機率推理的生成模型結果這點來看，不僅是幻覺或相，想像、夢，甚至是一般的知覺，都具有相同的本質。夢和正常知覺之間唯一的區別就是，夢無法接收來自感覺訊息關於預測誤差的更新而已。閉眼冥想時出現的「相」也同樣因為傳入的視覺訊息受限才會出現，而思覺失調症患者的幻覺則是因為預測誤差更新過程中發生異常才出現的。大腦所看到或聽到的東西，無論是一般的知覺、幻覺或夢境，都屬於主動推理的結果，本質上是一樣的。《心經》用「色即是空，空即是色」和「受想行識，亦復如是」，對此作了另一番描述。

如果說幻覺是看見或聽見實際不存在的東西，那麼妄想就是相信虛幻的東西。堅持相信虛無縹緲事物的狀態，就是妄想，這種信念通常在正常人眼裡看來是無稽而荒誕的。即使有人舉出理性論證或無可反駁的證據，妄想症患者也絕對不會改變自己的信念。這類妄想和來自假消息、錯誤訊息、編造的故事、教條、錯覺、幻想的錯誤信念是不一樣的。

即使不是思覺失調症患者，也會出現幻覺或妄想。擁有荒誕「信念」的人，不代表他就是思覺失調症患者，譬如有人堅持自己被外星人綁架後放回來，或者有人堅信自己可以和逝者對話等等。雖然有假設認為，這類幻想性質的信念是由於睡眠和清醒之間的過渡出現問題引起的，但無論如何，他們並不是「病患」。擁有這種荒誕信念的人雖然乍看之下很像思覺失調症陽性症狀患者，但二者至少在兩方面有顯著的不同。

第一，這種信念不會讓他們感到不幸或痛苦，很多人反而會對這種「經驗」感到自豪或愉悅。他們會很驕傲且快樂地告訴周圍的人自己被外星人綁架的事情，或者炫耀自己可以和逝者對話的能力。

第二，這種信念不會對社會生活造成妨礙，擁有這種信念的人彼此會互相支持鼓勵，反而創造出更活躍的人際關係。通常思覺失調症患者會因為妄想而感到痛苦，在社會生活方面也會經歷嚴重的挫折，人際關係的斷絕或嚴重的衝突是妄想患者的典型特徵。但是，我認為第一個特徵應該說是第二個特徵的結果，因為有了支持和鼓勵，才會對自己的經驗感到自豪和樂此不疲。因此，特徵不是有兩種，應該說只有一種才對。

出現思覺失調症陽性症狀的患者和單純擁有妄想的普通人之間決定性的差別（即區分是否為精神疾病患者的決定性標準），不在於妄想症狀本身，而在於那種妄想會帶來什麼樣的結果。如果這種妄想不會使本人感到痛苦，在人際關係上也沒有什麼大問題，擁有類似妄想的人之間更因此組成同好會，甚至還得到了社會上的支持，那麼即使擁有再奇怪的妄想，也不是需要接受治療的病患。換句話說，周圍人的接受與否至關重要。

如果一個人的內在狀態所創造的敘事明顯脫離他人的一般性敘事時，這就是妄想。但是，決定敘事是不是妄想的標準，不在於那個敘事是否「荒誕」，而在於能否與他人「溝通」。換句話說，如果有人對我的故事深感共鳴，也大為支持的話，我就不再是奇怪的「病患」。只要有周圍人的支持，也就是能夠與他人溝通的話，即使是妄想也會化身為寶貴的經驗，本人會為此感到自豪，他人也會給予正面的肯定。

有一個代表性的例子可以顯示一個人的推理（敘事）對他人會產生多大的影響。有兩個人都陷入相同的妄想，這種現象稱為「共生性妄想症」（Folie à deux）。這是指一個心理健康的人將妄想症患者的妄想當成是自己的，兩人共享同一個妄想的現象，這種症狀通常會出現在與精神疾病患者近距離接觸的人身上。一旦患者的妄想得到治療或兩個人分開，共生性妄想症狀馬上就會消失。這可以說是顯示一個人的推理強烈影響其他人的代表性例子，而且妄想的共生性也有可能超越兩個人的關係，擴及到群體的層面上。

如果我們將妄想定義為不符合現實的信念或基於不實證據的堅定信念，那麼我們每個人大概都有不同程度的「妄想」。就像人類幾千年來一直對「太陽從東邊升起，從西邊落下」深信不疑，這種信念到底是不是妄想呢？人類長期以來透過一緊張或害怕心臟就會怦怦跳的經驗，深信心靈就在心臟，這種信念是不是妄想呢？相信人有靈魂或有來生的信念，又該怎麼評價？還有手相、紫微斗數或合八字，以及主要流行在韓國和日本的血型決定個性的荒誕信念呢？原子核和電子之間存在真空，原子內部除了很小的核和更小的電子之外，都是空的。但是人們深信由這樣的原子所組成的物體是堅硬不會改變的「實體」，這是不是一種妄想呢？根據日常生活中的經驗所作的「直覺判斷」，有多少可信度呢？還有基於「地球是平的」的「觀察結果」而來的信念呢？當我們張開雙腳站在地上向四面八方觀望時，根本無法感受地球是圓球形的經驗。站在遼闊草原上，地球看起來就是一望無際的平坦地面。如果把所有不符合實際的信念都當成妄想的話，那麼我們就必須說，整個人類數千年來一直處於妄想中。還有一個令人驚訝的消息，聽說有愈來愈多的人仍然頑固地相信地球不是圓形的，而是平的。

實際上，我們眼睛看到的東西與科學事實相符的情況非常罕見。地球看起來是平的，實際上是球形；太陽看起來在移動，實際上是地球在移動。遺傳上我們似乎公平繼承父母各一半的基因，但實際上我們從母親那裡繼承的基因更多。19 我們的身體看似固定不變的實體，實際上當下的我像河水一樣流動的存在，隨著我的每一次呼吸許多細胞死去，然後又有新細胞誕生。我看似獨一無二的實體，其實我擁有好幾個自我。我們以為自己看到的外界事物都是真實原貌，其實我們看到的圖像是透過投影內在模型預測的結果。

人類的感覺器官在理解宇宙祕密或實體方面效率非常低，我們透過感覺器官所獲得的知覺訊息，通常和客觀的、科學的實體有一段距離，因為這樣才有利於生存。無論是狩獵或農耕，想在地球上生存下去，日出日落的認知會比地球自轉的認知更有效率。只是，當人類為了提升效率而進化的知覺和推理過程中，預測誤差最小化的機制發生異常情況時，人類就會出現非正常知覺（幻覺）或非正常信念（妄想）。

歷史上一直存在、至今仍然存在的所有政治意識形態和宗教信仰，與妄想有什麼不同嗎？沒有什麼不同。人類有客觀區分妄想和幻覺的標準或方法嗎？完全沒有。從普遍真理的標準來看，人類的大腦只不過是為了生存而產生妄想和幻覺的精巧系統罷了。當許多人共同擁有相同的妄想和幻覺時，這些多數人都會被視為正常人。

政治或宗教信仰又是如何呢？回顧人類歷史，對科學真理的信念在過去和現在，都與政治信念和宗教信仰直接結合在一起。無論是政治信念或科學信念，無法加以區分的人都以為自己的妄想或幻覺是「真理」，這是大腦所執行的基本任務。當這種信念受到衝擊時，大腦會將對方視為具有威脅性的存在，並且認為對方是「瘋子」或「惡魔」，為了自身安全必須消滅對方。因此，對自己真理的堅定信念經常會引發暴力，這就是人類的歷史。

妄想總是以「真理」之名出現在我們面前，因此我們必須反省各自的堅定信念，並認清它們的本質都是妄想。我們也必須意識到，出現在我們生活中的所有實體和真理的本來面貌，其實是一個顛倒的虛幻夢境，這就是《心經》裡所說的「顛倒夢想」。

而且，我們必須警惕那些堅持主張某種事物是「真理」的人，這些準備為真理和正義犧牲自己的人，實際上也等於是在準備對他人施加暴力。民主的反面與其說是獨裁，不如說是暴力。民主化的真正意義是掃除所有政治過程中的暴力，為了實現這一點，我們每個人都必須了解並且虛心接受自己所執著的信念本質其實是一種妄想。

在安伯托．艾可的小說《玫瑰的名字》結尾，威廉修士交代弟子阿德索說：「要警惕那些準備為真理而死的人，因為他們照例會拉著其他許多人和他們一起死，通常會死在他們之前，有時還代替他們死。（……）那些深愛人類的人所背負的任務，就是促使人們嘲笑真理，讓真理變成一件可笑的事情。因為讓我們從對真理的狂熱中解脫，才是實現真正真理的唯一途徑。」

多巴胺和酬賞系統的新視角

自由能原理不僅在腦科學和精神健康醫學領域，而且在行為科學領域也帶來了重大的視角轉變，代表性的例子就是對酬賞和強化學習的新視野。傳統上，在心理學和教育學方面，一般認為應該適當地使用酬賞和懲罰來改變人或動物的行為，或對新事物的學習。所謂「增強理論」（reinforcement theory）的核心，就是如果對特定行為承諾獎勵或迴避懲罰的話，就會出現對該行為意願的「動機」，然後再透過重複相同的行為，使得學習或記憶得到進一步的加強。長期以來，腦科學和神經生物學的研究人員認為，多巴胺會在這個過程中對價值（酬賞）的預測進行編碼（encoding），基於這種信念也產生了大量的研究成果。

自由能原理提供了一個綜合性的理論觀點，認為知覺過程（輸入）和行動過程（輸出）是按照「自由能最小化」的同一原則運作的。因此，研究人員發現，長期以來被認為是大腦基本運作方式的「酬賞」或「價值（好的或有用的東西）」，實際上是不必要的概念。同時，作為酬賞反應而為人所知的多巴胺作用，也在重新評估中。

到目前為止，在傳統的酬賞反應實驗中，人們理所當然地認為多巴胺的分泌是因為大腦將特定刺激判斷為「酬賞」。但是，弗里斯頓主張，並非「因為特定刺激是一種酬賞」，大腦才啟動多巴胺迴路，而是因為大腦將特定刺激視為一種「嶄新而顯著」的經驗，並且對這種經驗的「主動推理是正確的」，所以才分泌多巴胺。換句話說，在過去許多酬賞反應實驗中，受試者所得到的刺激並不是「酬賞」，而是「嶄新而顯著的刺激」。多巴胺系統不應被視為「對酬賞的反應」系統，而應被視為「對新刺激推理結果的反應」系統。如果這種看法屬實，那麼我們在過去一百多年來一直對人類有著莫大的誤解，而且不僅在心理學方面，尤其在教育學或管理學方面的許多基本概念和理論都有必要大幅修正。

傳統的酬賞一定是以已知的價值和存在為前提，譬如我必須知道那塊餅乾很好吃，且我有可能吃到那塊餅乾，「餅乾」對我來說才足以發揮酬賞的作用。然而，如此一來，餅乾就無法成為「預測」的對象，不能給予大腦太多的刺激。那麼，到目前為止無數有關使用餅乾（或與之類似的「甜蜜」酬賞）效果的實驗結果是怎麼產生的呢？

大多數關於酬賞與懲罰的實驗研究主要是針對一個行動主體向另一個行動主體作出酬賞承諾的情況。在實驗條件下，只存在以酬賞的方式要求對方完成任務，或用在教師教導學生的情況。在這種情況下，由於酬賞的承諾是不確定的，因此需要活躍的主動推理，當這種推理結果正確時，多巴胺系統才會被啟動。相反地，受試者已知的確定酬賞不會引起任何推測，所以無法作為酬賞刺激大腦啟動多巴胺系統。對於被視為理所當然的刺激，大腦不會分泌多巴胺，因為已經預期自己一定會收到的禮物，再怎麼昂貴，也無法作為酬賞啟動多巴胺系統。唯有在預測之外，有可能引發預測誤差，或是意料之外的事情帶來新的刺激時，才能啟動多巴胺當成酬賞。多巴胺系統只有根據有驚奇可能性的新刺激才會分泌。驚喜派對不是因為「派對」，而是因為「驚喜」，才會讓多巴胺系統活躍起來，給人帶來愉快的感覺。

多巴胺對於感覺狀態和行為狀態的預測誤差，也只是在對準確性進行編碼罷了。多巴胺系統並不像目前所知道的那樣參與獎勵系統，還參與看似與它無關的肌肉運動。多巴胺只有一項基本功能，就是只限於「對預測誤差的準確性進行編碼」。因此當多巴胺系統對於感覺狀態或行為狀態的預測誤差出現異常時，就有可能引發像帕金森氏症之類的動作障礙，而且也有可能在加強學習上出現問題。

特定刺激會引發多巴胺反應，這就表示預測是正確的。這是關於本體感覺的預測，會透過主動推理使大腦做出行為反應。無論是酬賞、感覺或刺激，只要預測是正確的，就會觸發多巴胺訊號。這就是為什麼引人注目的顯著刺激即使不是酬賞刺激，也會引發多巴胺反應的原因。因此，不管是在人際關係或行為實驗情況下，想要改變一個人的行為，只要讓他身處新的環境，或給予新的先驗刺激即可。

從自由能原理的角度來看，酬賞和懲罰沒有任何差別，兩者都是驚奇。從神經生物學的角度來看，多巴胺不會編碼有價值的預測誤差（是好還是壞、是紅蘿蔔還是鞭子），只會針對「預測誤差值」（預測誤差本身的好壞，即預測的對錯）進行編碼，並相應調整感覺和行為狀態，使預測誤差更準確。

多巴胺不會因為你覺得自己會得到美味的零食或稱讚而分泌，換句話說，多巴胺系統的運作不是取決於預測值（好或壞），而是取決於大腦當下的預測（無論是關於感覺還是行為）是否準確。多巴胺的基本功能是對預測誤差進行編碼，並朝著最小化誤差的方向持續更新神經網路，觸發多巴胺反應的刺激只是在告訴我們預測是否準確而己。這就是為什麼只要是新穎的、引人注目的或顯著的刺激，無論是否有酬賞，都會觸發多巴胺反應的原因。

如果多巴胺迴路的功能的確不是對酬賞做出反應，而是對預測誤差的準確性進行編碼，那麼傳統對強化學習的解釋，或對任何基於酬賞的動機理論，都應該重新檢討。提供新的或未知的刺激，會比承諾甜蜜的酬賞或預告嚴厲的懲罰帶來更大的學習效果和徹底的行為改變。學校教育的獎懲制度和企業獎賞制度（獎金或獎懲制度等）也需要進行徹底的思維轉變。

自從弗里斯頓動搖了傳統對大腦酬賞系統的觀點以來，腦科學領域最近的幾項實證研究開始支持弗里斯頓的主張。一連串的研究結果顯示，將多巴胺的作用視為對一般預測誤差的編碼，而不是酬賞系統核心的看法，更為妥當。事實上，已經有研究結果指出，多巴胺迴路不是因為酬賞本身，而是在受到新的陌生刺激才會活躍起來，尤其會針對預測誤差進行編碼。研究也進一步證實，多巴胺迴路不僅會因為傳統的酬賞刺激而被活化，也會在無關酬賞的情況下因為一般感覺的預測誤差而活躍起來。

也有研究結果指出，被稱為多巴胺迴路的大腦酬賞系統，不僅對酬賞有反應，在探索未知新事物過程中也會活躍起來。對未知環境的反應會強化學習，而在更新對環境的信念和學習上，多巴胺發揮著重要的作用。換句話說，在調整預測和最小化預測誤差的過程中，多巴胺起到了關鍵作用。

這對於心理學、教育學、管理學等各個學術領域來說，是非常重要且意義深遠的發現。這表示多巴胺迴路的功能不只是一個對酬賞做出反應的酬賞系統，也是與更廣泛的預測誤差相關的系統。根據強化理論，多巴胺的作用被視為能加強學習、改變行為，但實際上多巴胺的分泌不是出於「酬賞」（刺激的價值），而是出於「預測誤差」（無關酬賞的一般性預測誤差）。

綜合這些研究結果可以證實，即使與酬賞無關的一般學習過程中，多巴胺迴路也扮演著非常重要的角色。尤其是多巴胺系統功能異常引起的精神疾病，其根本原因很有可能是推理過程中的紊亂所導致的內部模型扭曲和改變。因此，更深入探索多巴胺在預測誤差和推理過程中的作用，不僅在心理學、教育學和管理學領域，也會在精神健康醫學方面帶來巨大的進步。

從心理肌力訓練的角度來看，意識清楚的覺知狀態，就是把此刻發生的一切事情都當成生平初次遇見一般對待。當我們把某件事視為理所當然時，大腦就會忽略它的大部分訊息而不去處理。強化心理肌力是指透過加強特定的神經網路來養成新的習慣，為了有效率地完成這個過程，我們的大腦必須始終像初次遇到某些事情一樣地運作。唯有如此，多巴胺迴路才會被活化、新的心理習慣才會形成，而我們也才會感到快樂。

對多巴胺迴路的運作方式和對酬賞的新見解，在更深入地理解冥想效果上也具有重要意義。而維持把所有事物當成全新、顯著刺激的內在狀態，就是一種清醒的意識狀態 20。從自由能原理的角度來看，「覺知冥想」可以說是所有感覺狀態和內在狀態都積極沉浸在主動推理和預測調整中的狀態，所有接收到的刺激都被當成新的刺激，多巴胺迴路因此呈現持續運作的狀態。這就是為什麼覺知冥想和「數息觀」（Ānāpānasati）之類的呼吸冥想會帶給極致愉悅感和幸福感的原因。