跳到主要內容

how to measure metacognition

--- ---

如何測量後設認知(metacognition)

後設認知的定義

如同前次[[metacognition the definition]]所整理,後設認知([[metacognition]])指的是對於認知歷程的監控歷程,並在臨床領域中進一步的推廣到對於自身以及他人的認知歷程的覺察與評價,同時可以利用這個覺察與評價的結果進一步的調整自己的行為策略。

我們可以看到某些研究的領域中,後設認知著重在於對自身認知歷程的覺察與評價,而某些領域中,強調的是整體的行為能否有效地進行調控。

後設認知的測量方法

目前常見的後設認知測量方法有三種,一種是面談(interview)中由訪談者評分,一種是自陳式的量表,而第三種則是認知測驗以及相關的指標參數的計算。

在我所回顧的文獻當中,認知測驗相關的研究最多,但是也最雜。因為在不同的認知心理學次領域當中針對不同的主題(例如:記憶、學習、知覺…)都各自有不同的實驗派典。也就是說,針對不同的後設認知所要監控或是覺察評價的目標,有不同的作業。而在這些不同的作業當中有共通可以使用的測量方式。我最後再來討論這個。先從面談以及自陳式量表開始。

訪談以及自陳式量表

面談以及自陳式量表的後設認知測量方法系出同門,根據Metacognitive Multi-Function Model (MMFM),後設認知包含三方面的能力

  • Understanding one’s own mind
  • Understanding of others’ mind
  • Mastery(能夠利用對於個體心理表徵以及心理狀態執行有效策略來完成認知作業或是解決困難的能力)

metacognition assessment scale (MAS)

Semerari等人(2003)根據上述理論架構設計了一個訪談的評分表,三個能力各自有9 ~ 11題不等,每一題都是是非題,由訪談的治療師進行評分。不過當時Semerari等人只有報告了幾名case的資料,並沒有大規模施測的資料。

metacognition self-assessment scale

而根據同樣的理論架構,Pedone等人(2017)發展了[[Metacognition Self-Assessment Scale]],是18題的自陳式5點量表用來測量個體的上述三面向的能力。就其因素分析的結果,作者歸納出四個因素:

  • self-self-reflexivity (monitoring and integration)
  • differentiation and decentering
  • understanding of other’s mind (self-other)
  • regulation and control abilities (mastery)

Pedone等人雖然在一個大型計畫中發展這個量表而有6000多筆的受測者資料,但並沒有進行相關的信效度分析。

後續Faustino等人(2021)將其翻譯為葡萄牙語版本,並進行了194個樣本的信效度研究。結果發現葡萄牙語版的因素結構和原版的因素結構相似,並有良好的內部一致性性度( α=.88\alpha = .88)以及4週的再測信度。收歛效度良好,但沒有足夠的divergent validity。他們根據受測者自陳的結果將受測者分為一般組以及臨床診斷組(自陳有憂鬱、焦慮、注意力缺失…等相關症狀者),結果發現兩組人在understanding other’s mind上沒有顯著差異,其他的分向度以及總分都有差異。

short form Metacognitions questionnaire (MCQ-30)

MCQ-30並非根據上述的MMFM架構而來。但理背後的理論也是認知後設認知是一種自我調節能力(Self-Regulatory Executive Function,S-REF; Wells, 2000; Wells & Matthews, 1994, 1996),而且是針對擔憂(WORRY)所進行的調控。

MCQ原來為65題的自陳式量表(Cartwright-Hatton & Wells, 1997),但是題目太多,要寫太久,後來發展出短版測驗(Wells & Cartwright-Hatton, 2004)。短版測驗為30題的4點李克氏自陳量表,包含有三個因素:

  • cognitive confidence:對自我認知能力以及行為表現的信心
  • positive beliefs:認為擔憂能多對自己有正向的幫助
  • cognitive self-consciousness:對於意識內容或認知歷程的覺察傾向

根據他們(Wells & Cartwright-Hatton, 2004)的研究,MCQ-30有良好的內部一致性、再測信度以及收歛效度。

小結

雖然說後設認知在前述的測量方法中都被視為是能力,但是一個與內在歷程有關的能力要有外在評分者來進行評分(MAS)總是奇怪,而且也缺乏相關的效度研究。要以自陳式量表來測量一個人的後設認知能力本身也有一點矛盾。因為填答自陳式量表這件事情本身就需要後設認知能力,而一個後設認知能力不佳的人的作答結果是會被質疑的,若他自以為自己的後設認知能力良好,仍有可能給出高分的填答結果。要以這些方式來測量一個人的後設認知能力都不太妥當。

認知測驗

許多的認知測驗都可以被用來測量後設認知能力,它們通常是使用2AFC作業派典,強迫參與者在測驗中要做出選擇,接著對於自己的選擇做出信心的評分,然後再以選擇的對錯以及信心的高低之間的關係作為是後設認知能力高低的判斷標準。例如過去很常見到的後設記憶能力的測驗。在經過字詞的記憶過程之後,參與者一次看到一個詞出現,參與者要判斷該詞是否為記憶過的詞(只有是或否兩個選項),接著再對於自己的答案給予信心程度的評分1(例如1 ~ 5分)。而信心程度和判斷正確與否之間的相關即為後設認知能力(對於自己的認知歷程的掌握程度)。

而這個作業表現和信心程度判斷間的相關要怎麼計算就是一門大學問了。過去有幾個不同的計算方式被提出,最早的是Γ\Gamma,但是這個指標在過去的研究中得到的結果並不穩定。後來台大的鄭昭明老師也提出他的c指標,但相關的研究仍少。

有學者從信號偵測理論([[signal detection theory]])發展出metadmeta\, d'(Maniscalco & Lau, 2012)。這個方法同時考慮了個體本身作業表現的能力以及反應的偏誤(例如:總是容易給出過高的信心),是很有發展潛力的一個後設認知能力指標的計算方法。後續還有從貝氏模型來發展的計算算則以及迴歸模型的應用,metadmeta\, d'儼然已成為後設認知研究的新主流。

然而,metadmeta\, d'畢竟只是個計算指標的方式,後設認知的測量作業在認知心理學當中並沒有一個受過較完整的信效度驗證的測量工具,只有較常被使用作業。而這些作業通常被用來研究固定的主題,例如記憶的後設認知、知覺的後設認知…等。

結論

後設認知是一種對於自己的認知歷程的評價以及掌握的能力,若要測量這個能力要使用自陳式量表或是訪談我覺得都不是好的方法,前者會受到填答者本身的後設能力的影響,後者則可能會受到評分者本身的後設能力影響。使用認知測驗會是一個相較之下較好的作法。雖然在認知測驗當中受測者仍然要給出一個主觀的信心評分也會受到他本身的後設認知影響。然而認知測驗能夠得到一個客觀的行為表現作為一個相對的參照點。計算出來的後設認知指標就成為了一個對於自己能夠做到多好有多少掌握程度的指標,這是完全符合後設認知定義的做法。


  1. 如何評分也是一個值得研究的議題,要4點、5點甚至100點?又或者只要分信心高低即可?已有研究者發現在區辨作業中,作業的難度不同的情況底下,使用不同的評分方式,信心程度和作業表現的關係並不一定會達到顯著。另外也有研究者別出心裁,不用信心評分,而是給參與者錢,問他們願意賭多少在他們的答案上([[post decision wager PDW]]),作為另一種信心評分的方式,然而這種作法可能會受到loss aversion的偏誤影響。 ↩︎

留言

這個網誌中的熱門文章

wisconsin card sorting研究心得

wisconsin card sorting研究心得 [[Wisconsin Card Sorting Task]](WCST)是一個很常用的神經心理測驗,最早是被用來作為思考彈性的測驗,但後來被發現可以用來評估腦傷程度。現在許多研究也使用它來做為認知彈性的測量工具。也有研究發現在自閉症、思覺失調症患者上都有表現較一般人差的情況 1 ,而這兩種疾病的患者也都被認為有認知彈性缺乏的問題。 文獻中提到的缺點 雖然這個作業已經有長期使用的歷史,但是目前看來仍有些缺點。 首先是 測驗相當複雜,所測量到的能力可能有很多個 。作業表現的差可能的原因很多。有的研究者把這個作業當作是執行控制功能(executive function)的測驗工具,而不是單指認知彈性。但其實認知彈性有許多的 定義 ,所以這一點雖然可以算是缺點,但也可以算是優點,因為認知彈性可能就是一個多能力交互作用才可以得到的表現。 另外 測驗結果指標多元,但背後所對應的能力仍不確定 。文獻中不同的研究者曾提出不同的計分方式,最常見的是total error(所有分類錯誤的卡片數量)、categories completed(完成的組數)、perseverative errors(延續使用舊有規則造成的錯誤)、failure to maintain set(無法連續正確分類)。有可能不同的指標所指涉的是不同的認知能力,又或者有些指標所測量到的不只一種能力。這樣看來,將這個作業歸為執行控制功能測量工具可能較合適,因為執行控制功能本身也是一個複雜的概念,包含多種能力在其中。 WCST的 測驗規則變化是固定的,多次測量的結果可能會有練習效果或是穩定度的問題 ,但目前相關的研究結果並不一致。例如有研究發現1年後正常成人再測的練習效果很大 1 。但其他研究發現卻發現間隔9個月再測信度不錯,而且練習效果不大 2 。 WCST也有發展電腦化的測驗,但是電腦化測驗的心理計量特性研究發現,電腦化的版本和原先版本並不相同,不能夠共用常模 3 4 。 WCST心理計量驗證情況 我在scopus以及google scholar搜尋找尋相關的信效度研究 WCST有許多的版本,但多以128張卡片的研究為主,部份為64張卡片。前者為同樣的64張但進行兩次,需要花費較多的時間。此外也有修改版(去除掉同時可以符合2種以上規則分類的...

metacognition: definitions

metacognition definitions metacognition: the definitions [[metacognition]]中文翻作後設認知,是一個高階的認知功能。通常metacogition被稱為 thinking of thinking ,也就是對於思緒的思緒,是一種反思(reflection)的歷程。 在心理學的文獻當中是這樣子定義它的: cognition about cognition Awareness and understanding of one’s own thought processes the ability to reflect on and monitor cognitive processes the ability to monitor and introspect upon cognitive performance the psychological structures, knowledge, events and processes that are involved in the control, modification and interpretation of thinking itself the ability to recognize and reflect on mental states, both of oneself and others, as well as the ability to use mentalistic knowledge to tackle the difficulties of social life’ 在部份定義當中,後設認知是一種思考或是認知的 歷程 。 而在其他的定義當中後設認知被認為是一種 能力 ,能夠對於自己的認知歷程、認知行為表現的反思或是監控。從這裡開始,後設認知就可以有好壞高低之分,而且所反思或是監控的對象不只是內在的思緒或是認知歷程,還包含了認知歷程之後的認知表現了。 也有文獻將後設認知定義為各種涉及對於思考的控制、修改以及推論的心智架構、知識、以及心理活動和歷程。這種看法下後設認知是一個複雜的概念,裡面可以包含了許多不同的歷程或是知識、心智架構。 綜合來看,這些不同的定義至...

認知彈性測驗整理

Common cognitive flexibility measurements traditional clinical neuropsychological measures [[Wisconsin Card Sorting Task]] (WCST) [[Trail Making Test]] [[Dellis-Kaplan executive function system]] (D-KEFS) color-word task [[Intradimensional–Extradimensional Shift task]] experimental task-switch paradigms switch tasks switch cost為主要的依變項 近來開始有人注意到switch rate,指自由狀態下的改變傾向 [[CNS Vital Signs]]當中兩個分測驗的分數相減來計算。需要花比較多的時間來施測 [[graphophonological-semanticcognitive flexibility task]] (GSF task) [[general color-shape flexibility task]] Multiple classification task [[Flexible Item Selection Task]] [[Dimensional Change Card Sort]] (DCCS) [[Stroop test]] [[Day-night]] Stroop like test [[Optional shift task]] [[Alternative uses task]] 雖然定義上可能符合認知彈性的定義,但通常是在創造力的研究中使用 scales for flexibility [[cognitive flexibility inventory]] [[Cognitive Control and Flexibility Questionnaire]] ​