跳到主要內容

how to measure metacognition

--- ---

如何測量後設認知(metacognition)

後設認知的定義

如同前次[[metacognition the definition]]所整理,後設認知([[metacognition]])指的是對於認知歷程的監控歷程,並在臨床領域中進一步的推廣到對於自身以及他人的認知歷程的覺察與評價,同時可以利用這個覺察與評價的結果進一步的調整自己的行為策略。

我們可以看到某些研究的領域中,後設認知著重在於對自身認知歷程的覺察與評價,而某些領域中,強調的是整體的行為能否有效地進行調控。

後設認知的測量方法

目前常見的後設認知測量方法有三種,一種是面談(interview)中由訪談者評分,一種是自陳式的量表,而第三種則是認知測驗以及相關的指標參數的計算。

在我所回顧的文獻當中,認知測驗相關的研究最多,但是也最雜。因為在不同的認知心理學次領域當中針對不同的主題(例如:記憶、學習、知覺…)都各自有不同的實驗派典。也就是說,針對不同的後設認知所要監控或是覺察評價的目標,有不同的作業。而在這些不同的作業當中有共通可以使用的測量方式。我最後再來討論這個。先從面談以及自陳式量表開始。

訪談以及自陳式量表

面談以及自陳式量表的後設認知測量方法系出同門,根據Metacognitive Multi-Function Model (MMFM),後設認知包含三方面的能力

  • Understanding one’s own mind
  • Understanding of others’ mind
  • Mastery(能夠利用對於個體心理表徵以及心理狀態執行有效策略來完成認知作業或是解決困難的能力)

metacognition assessment scale (MAS)

Semerari等人(2003)根據上述理論架構設計了一個訪談的評分表,三個能力各自有9 ~ 11題不等,每一題都是是非題,由訪談的治療師進行評分。不過當時Semerari等人只有報告了幾名case的資料,並沒有大規模施測的資料。

metacognition self-assessment scale

而根據同樣的理論架構,Pedone等人(2017)發展了[[Metacognition Self-Assessment Scale]],是18題的自陳式5點量表用來測量個體的上述三面向的能力。就其因素分析的結果,作者歸納出四個因素:

  • self-self-reflexivity (monitoring and integration)
  • differentiation and decentering
  • understanding of other’s mind (self-other)
  • regulation and control abilities (mastery)

Pedone等人雖然在一個大型計畫中發展這個量表而有6000多筆的受測者資料,但並沒有進行相關的信效度分析。

後續Faustino等人(2021)將其翻譯為葡萄牙語版本,並進行了194個樣本的信效度研究。結果發現葡萄牙語版的因素結構和原版的因素結構相似,並有良好的內部一致性性度( α=.88\alpha = .88)以及4週的再測信度。收歛效度良好,但沒有足夠的divergent validity。他們根據受測者自陳的結果將受測者分為一般組以及臨床診斷組(自陳有憂鬱、焦慮、注意力缺失…等相關症狀者),結果發現兩組人在understanding other’s mind上沒有顯著差異,其他的分向度以及總分都有差異。

short form Metacognitions questionnaire (MCQ-30)

MCQ-30並非根據上述的MMFM架構而來。但理背後的理論也是認知後設認知是一種自我調節能力(Self-Regulatory Executive Function,S-REF; Wells, 2000; Wells & Matthews, 1994, 1996),而且是針對擔憂(WORRY)所進行的調控。

MCQ原來為65題的自陳式量表(Cartwright-Hatton & Wells, 1997),但是題目太多,要寫太久,後來發展出短版測驗(Wells & Cartwright-Hatton, 2004)。短版測驗為30題的4點李克氏自陳量表,包含有三個因素:

  • cognitive confidence:對自我認知能力以及行為表現的信心
  • positive beliefs:認為擔憂能多對自己有正向的幫助
  • cognitive self-consciousness:對於意識內容或認知歷程的覺察傾向

根據他們(Wells & Cartwright-Hatton, 2004)的研究,MCQ-30有良好的內部一致性、再測信度以及收歛效度。

小結

雖然說後設認知在前述的測量方法中都被視為是能力,但是一個與內在歷程有關的能力要有外在評分者來進行評分(MAS)總是奇怪,而且也缺乏相關的效度研究。要以自陳式量表來測量一個人的後設認知能力本身也有一點矛盾。因為填答自陳式量表這件事情本身就需要後設認知能力,而一個後設認知能力不佳的人的作答結果是會被質疑的,若他自以為自己的後設認知能力良好,仍有可能給出高分的填答結果。要以這些方式來測量一個人的後設認知能力都不太妥當。

認知測驗

許多的認知測驗都可以被用來測量後設認知能力,它們通常是使用2AFC作業派典,強迫參與者在測驗中要做出選擇,接著對於自己的選擇做出信心的評分,然後再以選擇的對錯以及信心的高低之間的關係作為是後設認知能力高低的判斷標準。例如過去很常見到的後設記憶能力的測驗。在經過字詞的記憶過程之後,參與者一次看到一個詞出現,參與者要判斷該詞是否為記憶過的詞(只有是或否兩個選項),接著再對於自己的答案給予信心程度的評分1(例如1 ~ 5分)。而信心程度和判斷正確與否之間的相關即為後設認知能力(對於自己的認知歷程的掌握程度)。

而這個作業表現和信心程度判斷間的相關要怎麼計算就是一門大學問了。過去有幾個不同的計算方式被提出,最早的是Γ\Gamma,但是這個指標在過去的研究中得到的結果並不穩定。後來台大的鄭昭明老師也提出他的c指標,但相關的研究仍少。

有學者從信號偵測理論([[signal detection theory]])發展出metadmeta\, d'(Maniscalco & Lau, 2012)。這個方法同時考慮了個體本身作業表現的能力以及反應的偏誤(例如:總是容易給出過高的信心),是很有發展潛力的一個後設認知能力指標的計算方法。後續還有從貝氏模型來發展的計算算則以及迴歸模型的應用,metadmeta\, d'儼然已成為後設認知研究的新主流。

然而,metadmeta\, d'畢竟只是個計算指標的方式,後設認知的測量作業在認知心理學當中並沒有一個受過較完整的信效度驗證的測量工具,只有較常被使用作業。而這些作業通常被用來研究固定的主題,例如記憶的後設認知、知覺的後設認知…等。

結論

後設認知是一種對於自己的認知歷程的評價以及掌握的能力,若要測量這個能力要使用自陳式量表或是訪談我覺得都不是好的方法,前者會受到填答者本身的後設能力的影響,後者則可能會受到評分者本身的後設能力影響。使用認知測驗會是一個相較之下較好的作法。雖然在認知測驗當中受測者仍然要給出一個主觀的信心評分也會受到他本身的後設認知影響。然而認知測驗能夠得到一個客觀的行為表現作為一個相對的參照點。計算出來的後設認知指標就成為了一個對於自己能夠做到多好有多少掌握程度的指標,這是完全符合後設認知定義的做法。


  1. 如何評分也是一個值得研究的議題,要4點、5點甚至100點?又或者只要分信心高低即可?已有研究者發現在區辨作業中,作業的難度不同的情況底下,使用不同的評分方式,信心程度和作業表現的關係並不一定會達到顯著。另外也有研究者別出心裁,不用信心評分,而是給參與者錢,問他們願意賭多少在他們的答案上([[post decision wager PDW]]),作為另一種信心評分的方式,然而這種作法可能會受到loss aversion的偏誤影響。 ↩︎

留言

這個網誌中的熱門文章

聽完社會認知測驗後感想

先說結論 夭壽讚 今天聽團隊內另一個博士後研究員李士捷分享社會認知評估測驗 本來我只預期會聽到目前有什麼測驗,在測什麼能力或是特質 結果李博士前言後語不缺地完整介紹了社會認知能力的重要性以及目前的測驗所延伸的一些發現 這些測驗包含了情緒辨識測驗以及社會知識、弦外之音(言下之意)測驗 聽完很有啟發性,似乎看到了些模糊的影子 ​

2010年以後同理心相關研究

上一篇 整理了TSSCI中2010年以後同理心相關研究,接下來繼續整理scopus當中同理心相關的國際期刊研究。 scopus出來的結果眾多,我先限制範圍至psychology領域當中 這些文獻當中,一部份的研究是同理心量表的中文版信效度研究,包含了: Chinese-language Empathy Scale in Patient Care (ES-PC) Chinese version the interpersonal reactivity inventory Chinese version of the Jefferson Scale 部份文獻研究青少年以及人際關係、網路霸凌的行為,同理心在人際網絡當中可能扮演著保護因子,調節較負面的行為表現發生的情況。在這些研究中,同理心是以青少年復原力量表測量,同理心的定義由較良善的人際互動關係定義之。 其他研究同理心的測量大多以 interpersonal reactivity inventory (IRI)測量,另外也有Empathy Quotient (EQ) Empathizing/Systemizing Quotient (ESQ)來測量。 較讓我注意的是使用 multifaceted empathy test以及 reading the mind in the eyes task兩個認知測驗的研究,因為其他的研究皆是使用自陳式量表。在這兩個測驗當中參與者分別要從情境圖片當中判斷自己多能感受到相同的情緒,或是從眼部線索辨識圖片中人的情緒。 ​

認知彈性的定義與作業分析

認知彈性定義與作業分析 認知彈性的定義 認知彈性是執行控制功能的核心能力之一 [1] ,是一種高等的認知功能。關於認知彈性的定義在過去的研究中有些不同的看法。根據Ionescu [2] 的整理,認知彈性在過去的研究中可以分為四種定義 是一種可以在不同的作業間快速切換注意力的能力 是一種同時處理或是表徵多組訊息的能力 能夠以不同的角度(或方式)思考同一件事情的能力 對於環境變動能夠適應的認知歷程 這四種定義所指涉的認知彈性層次不太一樣。前兩種是一種認知能力,看來與認知資源或是注意力有高度關係,與認知資源或是注意力資源的使用的好壞或是效率有關。而第三種則是較高等的一種思考歷程,應該也包含了第2個定義的能力,要能夠同時知道同一個事物的不同面向的訊息,才有辦法從另一個角度來理解或是看待它。而第四種定義則是一種認知系統,其複雜程度比起前面的能力或是歷程更高,可能是多種不同的能力或是認知機制、歷程間的合作或是交互作用後的產物。 我認為第4個定義最符合我心中對於認知彈性的想像,能屈能伸,能隨著環境的變化而產生相對應的策略或是反應,比較像是一個「有彈性的人」。要能夠測量到這個能力,作業本身需要會變化,而且要能夠捕捉個體是否能隨著作業需求的改變而做出調整。 測量認知彈性的作業 有許多測量認知彈性的作業,不同的作業所測量到的認知彈性並不相同。 其中歷史最悠久,在臨床上被使用最多的應該是Wisconsin Card Sorting Task,而在認知實驗室當中被研究最多的大概是task switch、Stroop test,或者是Alternative uses task。而這些測驗之外,還有一些對於適用對象的修改版測驗,以下分別介紹。 Wisconsin Card Sorting Task (WCST) WCST是一個經典的神經心理衡鑑作業。受測者的作業目的就是一張一張地將卡片分類。他們可以根據卡片上圖案的不同的屬性來分類。施測者的心中有一套分類的規則,但是不會告訴受測者,受測者只能依據每一張分類之後施測者的回饋來猜測他心中的規則是什麼,以達到最高正確率的分類表現。 然而,規則是會變的,可能在幾次正確的分類之後,規則就改變了。受測者要能夠覺察到自己分類規則已經不適用了,需要換一個規則來分類試試。 最後完成測驗時所正確分類的卡片數量就是一個認知彈性的指標。 在這個測驗當中,作業的要求沒有...