跳到主要內容

how to measure metacognition

--- ---

如何測量後設認知(metacognition)

後設認知的定義

如同前次[[metacognition the definition]]所整理,後設認知([[metacognition]])指的是對於認知歷程的監控歷程,並在臨床領域中進一步的推廣到對於自身以及他人的認知歷程的覺察與評價,同時可以利用這個覺察與評價的結果進一步的調整自己的行為策略。

我們可以看到某些研究的領域中,後設認知著重在於對自身認知歷程的覺察與評價,而某些領域中,強調的是整體的行為能否有效地進行調控。

後設認知的測量方法

目前常見的後設認知測量方法有三種,一種是面談(interview)中由訪談者評分,一種是自陳式的量表,而第三種則是認知測驗以及相關的指標參數的計算。

在我所回顧的文獻當中,認知測驗相關的研究最多,但是也最雜。因為在不同的認知心理學次領域當中針對不同的主題(例如:記憶、學習、知覺…)都各自有不同的實驗派典。也就是說,針對不同的後設認知所要監控或是覺察評價的目標,有不同的作業。而在這些不同的作業當中有共通可以使用的測量方式。我最後再來討論這個。先從面談以及自陳式量表開始。

訪談以及自陳式量表

面談以及自陳式量表的後設認知測量方法系出同門,根據Metacognitive Multi-Function Model (MMFM),後設認知包含三方面的能力

  • Understanding one’s own mind
  • Understanding of others’ mind
  • Mastery(能夠利用對於個體心理表徵以及心理狀態執行有效策略來完成認知作業或是解決困難的能力)

metacognition assessment scale (MAS)

Semerari等人(2003)根據上述理論架構設計了一個訪談的評分表,三個能力各自有9 ~ 11題不等,每一題都是是非題,由訪談的治療師進行評分。不過當時Semerari等人只有報告了幾名case的資料,並沒有大規模施測的資料。

metacognition self-assessment scale

而根據同樣的理論架構,Pedone等人(2017)發展了[[Metacognition Self-Assessment Scale]],是18題的自陳式5點量表用來測量個體的上述三面向的能力。就其因素分析的結果,作者歸納出四個因素:

  • self-self-reflexivity (monitoring and integration)
  • differentiation and decentering
  • understanding of other’s mind (self-other)
  • regulation and control abilities (mastery)

Pedone等人雖然在一個大型計畫中發展這個量表而有6000多筆的受測者資料,但並沒有進行相關的信效度分析。

後續Faustino等人(2021)將其翻譯為葡萄牙語版本,並進行了194個樣本的信效度研究。結果發現葡萄牙語版的因素結構和原版的因素結構相似,並有良好的內部一致性性度( α=.88\alpha = .88)以及4週的再測信度。收歛效度良好,但沒有足夠的divergent validity。他們根據受測者自陳的結果將受測者分為一般組以及臨床診斷組(自陳有憂鬱、焦慮、注意力缺失…等相關症狀者),結果發現兩組人在understanding other’s mind上沒有顯著差異,其他的分向度以及總分都有差異。

short form Metacognitions questionnaire (MCQ-30)

MCQ-30並非根據上述的MMFM架構而來。但理背後的理論也是認知後設認知是一種自我調節能力(Self-Regulatory Executive Function,S-REF; Wells, 2000; Wells & Matthews, 1994, 1996),而且是針對擔憂(WORRY)所進行的調控。

MCQ原來為65題的自陳式量表(Cartwright-Hatton & Wells, 1997),但是題目太多,要寫太久,後來發展出短版測驗(Wells & Cartwright-Hatton, 2004)。短版測驗為30題的4點李克氏自陳量表,包含有三個因素:

  • cognitive confidence:對自我認知能力以及行為表現的信心
  • positive beliefs:認為擔憂能多對自己有正向的幫助
  • cognitive self-consciousness:對於意識內容或認知歷程的覺察傾向

根據他們(Wells & Cartwright-Hatton, 2004)的研究,MCQ-30有良好的內部一致性、再測信度以及收歛效度。

小結

雖然說後設認知在前述的測量方法中都被視為是能力,但是一個與內在歷程有關的能力要有外在評分者來進行評分(MAS)總是奇怪,而且也缺乏相關的效度研究。要以自陳式量表來測量一個人的後設認知能力本身也有一點矛盾。因為填答自陳式量表這件事情本身就需要後設認知能力,而一個後設認知能力不佳的人的作答結果是會被質疑的,若他自以為自己的後設認知能力良好,仍有可能給出高分的填答結果。要以這些方式來測量一個人的後設認知能力都不太妥當。

認知測驗

許多的認知測驗都可以被用來測量後設認知能力,它們通常是使用2AFC作業派典,強迫參與者在測驗中要做出選擇,接著對於自己的選擇做出信心的評分,然後再以選擇的對錯以及信心的高低之間的關係作為是後設認知能力高低的判斷標準。例如過去很常見到的後設記憶能力的測驗。在經過字詞的記憶過程之後,參與者一次看到一個詞出現,參與者要判斷該詞是否為記憶過的詞(只有是或否兩個選項),接著再對於自己的答案給予信心程度的評分1(例如1 ~ 5分)。而信心程度和判斷正確與否之間的相關即為後設認知能力(對於自己的認知歷程的掌握程度)。

而這個作業表現和信心程度判斷間的相關要怎麼計算就是一門大學問了。過去有幾個不同的計算方式被提出,最早的是Γ\Gamma,但是這個指標在過去的研究中得到的結果並不穩定。後來台大的鄭昭明老師也提出他的c指標,但相關的研究仍少。

有學者從信號偵測理論([[signal detection theory]])發展出metadmeta\, d'(Maniscalco & Lau, 2012)。這個方法同時考慮了個體本身作業表現的能力以及反應的偏誤(例如:總是容易給出過高的信心),是很有發展潛力的一個後設認知能力指標的計算方法。後續還有從貝氏模型來發展的計算算則以及迴歸模型的應用,metadmeta\, d'儼然已成為後設認知研究的新主流。

然而,metadmeta\, d'畢竟只是個計算指標的方式,後設認知的測量作業在認知心理學當中並沒有一個受過較完整的信效度驗證的測量工具,只有較常被使用作業。而這些作業通常被用來研究固定的主題,例如記憶的後設認知、知覺的後設認知…等。

結論

後設認知是一種對於自己的認知歷程的評價以及掌握的能力,若要測量這個能力要使用自陳式量表或是訪談我覺得都不是好的方法,前者會受到填答者本身的後設能力的影響,後者則可能會受到評分者本身的後設能力影響。使用認知測驗會是一個相較之下較好的作法。雖然在認知測驗當中受測者仍然要給出一個主觀的信心評分也會受到他本身的後設認知影響。然而認知測驗能夠得到一個客觀的行為表現作為一個相對的參照點。計算出來的後設認知指標就成為了一個對於自己能夠做到多好有多少掌握程度的指標,這是完全符合後設認知定義的做法。


  1. 如何評分也是一個值得研究的議題,要4點、5點甚至100點?又或者只要分信心高低即可?已有研究者發現在區辨作業中,作業的難度不同的情況底下,使用不同的評分方式,信心程度和作業表現的關係並不一定會達到顯著。另外也有研究者別出心裁,不用信心評分,而是給參與者錢,問他們願意賭多少在他們的答案上([[post decision wager PDW]]),作為另一種信心評分的方式,然而這種作法可能會受到loss aversion的偏誤影響。 ↩︎

留言

這個網誌中的熱門文章

尋找研究核心

尋找研究核心 找到自己的研究核心是關係到我未來有沒有飯吃的重要課題。過去我很少會細想它,反正船到橋頭自然直。不過該來的總是會來,時候到了,也該要面對了。 在我苦惱之前先來看看我的母系的老師們過去十多年的人生都幹了些什麼 原來老師你在這上面花了不少青春 系上的老師很多,我只選擇幾個比較感興趣的老師來瞭解一下。這些老師都做了十年以上的研究,幾乎都可以從他們身上看到在過去十年都將他們的青春投資在某些特定的主題上。 梁庚辰 老師一開始的研究題目主要與用動物模型來研究記憶歷有關,發表了數篇相關的文獻。可能從中發現了許多與海馬迴可能也和制約有關,後來梁老師的研究多了與fear conditioning相關的探討。但總結來看,梁老師的研究核心是圍繞著記憶,以及相關的神經機制(海馬迴)去延伸的。 徐永豐 老師的研究乍看之下好像五花八門,有精神病相關的生理機制,有投票行為,有反應時間,也有決策。不過仔細一看可以發現這些都是用數學模型去預測以及建構人的行為表現。所以雖然表面上看來徐老師的研究很多樣,都核心都是以數理模型建構人的行為。 葉素玲 老師的研究一開始與視知覺歷程有關,後來延伸到了無意識的處理歷程以及視覺和其他感官的跨感官處理,而近年來則是藍光對於知覺以及認知功能的影響。葉老師的研究議題感覺較為多元,但也都算是視覺知覺的延伸,有脈絡可尋。 連韻文 老師最早做思考,接下來是創意、工作記憶與執行控制能力,而近年來則與身心鍛練、意識狀態有關。與其他的老師相比,研究的主題較沒有限縮。但從較廣的角度來看,這些都是人類的高等認知功能。 謝伯讓 老師最早進行的是motion perception(應該叫運動知覺吧?),也算是知覺歷程的一環。不過後來開始進行神經科學,而且竟然有fMRI分析的方法學相關發表。進來謝老師也開始進行無意識歷程的研究,感覺和葉老師的發展有點類似。也許是知覺研究容易導引的方向。 那我的研究核心要是什麼呢? 過去十年,我的研究與思緒、意識內容的控制與覺察有關,不過是否要繼續投入似乎該要有其他的考量(例如:是否可以吃到飯) 從我自己的觀點來看,覺察應該是有未來發展性的,因為這個能力跟認知功能的使用以及心理健康都有關係,如果沒有覺察的話,很多行為改變都不太可能會發生。 不過我在 expertscape 找尋與awareness在台灣有沒有相關的研究者,出現...

glmmTMB vs. GLMMadaptive

--- title: glmmTMB vs. GLMMadaptive author: Ju tags: - blog - R/packages --- 記錄一下分析資料時使用 glmmTMB 以及 GLMMadaptive 的心得 glmmTMB GLMMadaptive 估計方法 Laplace approximation adaptive Gauss-Hermite quadrature 預測值 可以進行單純count part預測、zero part預測,以及兩部份模型加起來的期望值預測 沒辦法只進行count part預測,只能做zero part預測,以及兩部份模型加起來的期望值預測 估計方法的差異在本次zero-inflated model使用過程中有很大的使用經驗差異。 glmmTMB 比較常出現convergent problem,而 GLMMadaptive 幾乎沒有。根據 glmmTMB 的troubleshooting說明,會出現問題主要是和random effect有關,如果拿掉zero part random intercept就不會再跳出錯誤訊息了。而根據 GLMMadaptive 做的模型比較,有沒有zero part random intercept其實沒有顯著的差異。因此如果不強求一定要納入zero part random intercept,兩個packages的結果是一致的。不過如果一定要納入zero part random intercept,那就只能使用 GLMMadaptive 才不會有錯誤警告出現。 兩個套件的另一個差異是在進行預測(predict)時, glmmTMB 可以只根據count part的結果進行預測,而 GLMMadaptive 不行。會有這個需求是因為很常只有count part的預測變項有顯著的結果,但是zero part沒有顯著的預測變項,因此若只想要看count part的預測線時, GLMMadaptive 沒辦法給我這個結果 1 。 文獻上討論Laplace approximation和adaptive Gauss-Hermite quadrature哪一種估計方法比較準的有好幾篇,我大概看了一下他們的結論,其實不同研究的結果並不一...

認知彈性的定義與作業分析

認知彈性定義與作業分析 認知彈性的定義 認知彈性是執行控制功能的核心能力之一 [1] ,是一種高等的認知功能。關於認知彈性的定義在過去的研究中有些不同的看法。根據Ionescu [2] 的整理,認知彈性在過去的研究中可以分為四種定義 是一種可以在不同的作業間快速切換注意力的能力 是一種同時處理或是表徵多組訊息的能力 能夠以不同的角度(或方式)思考同一件事情的能力 對於環境變動能夠適應的認知歷程 這四種定義所指涉的認知彈性層次不太一樣。前兩種是一種認知能力,看來與認知資源或是注意力有高度關係,與認知資源或是注意力資源的使用的好壞或是效率有關。而第三種則是較高等的一種思考歷程,應該也包含了第2個定義的能力,要能夠同時知道同一個事物的不同面向的訊息,才有辦法從另一個角度來理解或是看待它。而第四種定義則是一種認知系統,其複雜程度比起前面的能力或是歷程更高,可能是多種不同的能力或是認知機制、歷程間的合作或是交互作用後的產物。 我認為第4個定義最符合我心中對於認知彈性的想像,能屈能伸,能隨著環境的變化而產生相對應的策略或是反應,比較像是一個「有彈性的人」。要能夠測量到這個能力,作業本身需要會變化,而且要能夠捕捉個體是否能隨著作業需求的改變而做出調整。 測量認知彈性的作業 有許多測量認知彈性的作業,不同的作業所測量到的認知彈性並不相同。 其中歷史最悠久,在臨床上被使用最多的應該是Wisconsin Card Sorting Task,而在認知實驗室當中被研究最多的大概是task switch、Stroop test,或者是Alternative uses task。而這些測驗之外,還有一些對於適用對象的修改版測驗,以下分別介紹。 Wisconsin Card Sorting Task (WCST) WCST是一個經典的神經心理衡鑑作業。受測者的作業目的就是一張一張地將卡片分類。他們可以根據卡片上圖案的不同的屬性來分類。施測者的心中有一套分類的規則,但是不會告訴受測者,受測者只能依據每一張分類之後施測者的回饋來猜測他心中的規則是什麼,以達到最高正確率的分類表現。 然而,規則是會變的,可能在幾次正確的分類之後,規則就改變了。受測者要能夠覺察到自己分類規則已經不適用了,需要換一個規則來分類試試。 最後完成測驗時所正確分類的卡片數量就是一個認知彈性的指標。 在這個測驗當中,作業的要求沒有...