看到知乎上很多知友提问说感觉自己智商不够,说做了什么智力测试说自己智商不够,为什么,或者提问说什么智商能不能上什么大学等等。这确实是大家都很好奇的问题。恰好这个话题在我本科的时候上过课,后来给学生补习又讲到过这一章,所以就认真讲讲吧。从这儿开始不定期更这个系列【正儿八经的心理学】,我的写作习惯依照学术论文的格式,括号里的(人名,年份)代表的是这句话是引用自学术论文(谁写的,哪一年),我会在结尾附上参考文献列表。
首先说结论,智商这个概念是一个非常抽象的概念,几乎不能被以单一因子量化(就是说把智商当成一个因子G)。影响我们理解智力的最大的predictor是工作记忆,它不是先天决定的,而是后天可以被训练的一个认知功能。但是工作记忆并不能完全解释什么是智力。但是至少一点,瑞文智力测试真的仅供娱乐不要当真。
首先第一个问题我们要思考,什么叫智商(intelligence quotient; IQ)?
最白话地说,智商就是一个人聪不聪明。那什么叫聪明?记性好叫聪明吗?会找规律叫聪明吗?注意力集中叫聪明吗?都不是,至少单个或者这几个因素加起来都不能体现聪明。这就是为什么所谓智力测试是有问题的,因为无论它设置多少个维度,都不能够解释智力这个概念。我们先说答案,答案是,今天我们知道智商有很大一部分是由工作记忆(working memeory)决定的,通常工作记忆越强的人,处理问题的反应越快,在我们看来就越聪明。但是工作记忆并不能完全解释智商。那么什么是工作记忆?
工作记忆working memory
工作记忆不是我们理解的那种记忆或者记性。很多人以为它是短时记忆的一种,这种说法是不准确的。因为记忆其实不是我们理解的像数据一样的东西(这个以后会讲),而工作记忆的回路跟我们认为的记忆的回路关系不那么大。工作记忆的定义是同一时间大脑能hold住,调动并使用信息的能力,如果硬要对比的话,它很像电脑的内存(memory drive)或者缓存,它跟硬盘是不一样的(当然把记忆比作硬盘也是不准确的)。最直观的表现就是,假设我给你报一串电话号码,十一位数字,我只说一遍,立刻请你复述,你能复述多少出来。同时能调动的信息,无论是旧的已经知道的信息,还是刚刚察觉到的新信息,同时能调动这些信息来解决问题的能力,就是由工作记忆体现出来的。如果我们去coding很多智力测试,会发现它们测试的底层因素到头来还是工作记忆。接下来我来说说是怎么从五花八门的智力测试,走到工作记忆这一步的。
一些历史
在认知心理学研究的历史上,对智商这一概念的研究追溯到一百年前的1920年代,统计心理学家Charles Spearman提出了智商有两方面组成,一是general intelligence (G),二是specific ability (S) (Spearman, 1927)。这哥们还做了一件事是建立了最早的因子分析(factor analysis),用来评估量表里的维度的。这里的G就沿用下来一直用来代指智力这个概念了。那怎么研究这个G呢,这个就必须要简单说一下什么是因子分析。
因子分析,是指研究从变量群中提取共性因子的统计技术 (百度)。在一些其它的知乎文章和回答里有讲过(比如这一篇: 如何通俗地解释因子分析? – 知乎 https://www.zhihu.com/question/40981105 )通俗地说是一种量化的统计学算法来确认一堆答案是否指向同一个(或多个)方向。在一个问卷中,如果几个问题的答案指向同一个方向(比如说得分都是同一样高,或者同一样低),它会在因子分析里成一团,其Eigenvalue>1。所以这个操作可以知道,哪些问题能指向同一个因子(亚组)。为什么我一定要提因子分析,是因为现在我们能看到的很多智力测试(包括以后我们可以讲的人格测试),都是这样鼓捣出来的。
所以,就这个办法,接下来的美国的心理学家Louis Thurstone找了当时能想到的56种不同的能力,然后做因子测试,看有哪些因子在数据上能指向同一方向。他算出来能指向同一方向的有:空间能力,数理能力,语言流畅度,语言理解,记忆,洞察速度以及推理能力 (Thurstone, 1938)。这就走远了。因为有个问题,就是在数据上它耦合但是不代表它在实际逻辑上有关联。因子分析上最大的问题是,它是数字,数字的显著是有可能假阳性的。比如一个男的做体检发现身体里不知为何孕酮含量很高,于是医生给他下诊断说他怀孕了,这就是假阳性。只要你问了足够多的问题,它总能找到显著的相关性在里面。这在统计学上也叫一类错误(type one error)。只要你愿意无限细分,这个问题就有无限个维度。这是不可取的。这在统计学和实验方法学上叫做共线性(colinearity),是引起一类错误的原因之一(同样用这个方法做出来的人格心理学各种人格,在现代心理学上也基本上是认为不靠谱的)。所以我们才要去coding它去测的这些56种不同的能力到底是由哪个认知功能反映出来的。这样做了之后,最后会发现,所谓的空间能力,数理能力,语言流畅度,语言理解,记忆,洞察速度以及推理能力,多多少少都包含了工作记忆的影子。当然,在当时,工作记忆这个认知功能还没有被发现。如果我们把工作记忆作为单独的变量测出来加进去会发生什么呢?这就要从我们常见的智力测试来看了。
智力测试
最常见的智力测试,通过了因子分子发论文出来的,有韦克斯勒成人智力量表(韦氏智力WAIS)和斯坦福-比奈智力量表(S-B),以及国内喜闻乐见的非文字的瑞文智力测试(Raven’s Progressive Matrices)。我一个个说。
韦氏智力是一个分为十个章节,五个额外章节的量表,经过多次更新迭代,可以分为两个部分(是一直没改过的),一是语意类,二是表意类。在统计学上这份问卷是很好的。其内部连续性克伦巴赫系数(每个问题之间的连续指向性)有0.94-0.98 (Silva, 2008),因子分析出来包括四个亚组,语言理解,洞察力,工作记忆和反应速度。它迭代到第四代的时候已经是直接单独测了工作记忆了,初代是没有的。但是实际上,洞察力和反应的速度,它背后的认知功能还是有工作记忆的影子,在发现了(洞察了)信息之后,暂时把它hold住用于解决问题,这就是工作记忆。反应得快不快,也取决于hold住信息之后多快能把它调动起来,它还是工作记忆。这几个亚组因子之间是相关的,而不是独立的。
斯坦福-比奈也是十个章节,经历过多次迭代,也是语意类和表意类。现在的第五代在统计学上这份问卷的内部连续性克伦巴赫系数有0.99 (Bünger et al., 2021),因子分析有五个亚组,包括线性推理,定量推理,知识储备,视觉-空间感知和工作记忆。而有研究指出,其推理的部分,还是要依靠工作记忆去完成(Colom et al., 2008)。这几个亚组因子之间是相关的,而不是独立的。
瑞文智力测试,它是由五章,每章十二个图阵组成的,找规律填图形, 1938年的老古董 (Raven & Court, 1938)。它很特别是它基本上没有文字描述,而是靠图形来的,所以很有趣。基本上整个测试都是在测线性推理(Soulières et al., 2009),于是又回到了工作记忆上去。而它的问题是,这样非文字的题目,它的统计学分析就很奇怪了,因子分析能找出一个因子的(Arthur & Woehr, 1993),或者两个因子的(Dillon et al., 1981),就是说连数据上的可靠性都找不到。它真就只有线性推理,所以它能反映出来的人的聪慧程度是有限的。马上我会讲为什么。
简单说完这三个问卷,总结一下。韦氏智力和斯坦福-比奈智力这两个文字量表的统计学意义是过关的,但是实际上如果去coding它的亚组,多多少少有共线性,都指向工作记忆。而且有一个问题是,他们因为对文字理解有一个基础要求,所以如果接受测试的人语言能力不好,那么它的得分就肯定不理想。但是语言能力不是智力的指南,比如自闭症的孩子虽然语言能力很差,但是他们很聪明 (Grondhuis et al., 2018)。这说明所谓智力测试,并不能涵盖所有人群。而瑞文智力测试就没有语言沟通障碍,自闭症患者的得分就明显高很多 (Kunda et al., 2009)。所以在国内很多医院里喜欢直接拿瑞文智力测试给孩子做,就是说万一家长以为孩子成绩不好是自闭症,那么瑞文智力测试很好地能规避这些共病,向家长展示这个孩子是很聪明的。但是,我们必须注意一点,瑞文智力测试只很浅显地体现了工作记忆。工作记忆真的是所有吗?
猩猩的工作记忆
嗯,猩猩的工作记忆比没有经过训练的人强,但是猩猩不可能比人聪明。请观看这个视频:
(【黑猩猩–记忆大师】 https://www.bilibili.com/video/BV1a7411J7rh?share_source=copy_web&vd_source=1f70fd88c57a118099f5b1707337c444)
这个视频记录下来了当时这个实验的名场面,就是训练猩猩去背连续数字的顺序,本质上就是前文提到的背电话号码,只是此处是以猩猩能理解的方式进行的。这个实验是 (Inoue & Matsuzawa, 2007)。这是工作记忆,猩猩只看一遍就能hold住十位数字的顺序,比人类厉害多了。但是,猩猩比人类智商高吗?显而易见,不可能。只是猩猩的工作记忆很好。换句话说,你信不信我们找只猩猩来做瑞文智力测试,一旦猩猩明白找到规律的正确答案能获得奖励(帕夫洛夫狂喜),猩猩做瑞文测试得分比各位都高。这涉及到一个进化的问题,就是很明显人类进化的时候牺牲了很多工作记忆的空间以更复杂的认知功能取代了它,比如语言,比如长期记忆。这可以理解为,我们为了上最好的CPU,液态金属和散热,四根内存条只插了俩,而猩猩插了四根内存条,用的却是古早的CPU连矽脂都没涂。
第二个证据是有注意力缺陷(ADHD)的病人(就是俗称多动症的)他们如果慢慢做,是可以做完整个问卷的(both瑞文或者韦氏)。而且研究发现很多测出来韦氏智力120以上的ADHD患者其实有很重的工作记忆障碍(Brown et al. 2009)。所以,工作记忆不是智力的全部,它是智力很重要的一个predictor。这也就是为什么在我看来,瑞文智力测试不要当真完全是娱乐的原因之一(这不是医疗建议,因为没有哪个医生会把瑞文智力测试的结果当成诊断标准,如果有,请投诉)。但是这个猩猩实验让很多研究人类智商的学者不安逸了,因为人在经过训练之后,其实也可以做到背数字背得好。所以他们让人类经过训练之后,也这样做了一次,确实比猩猩更厉害了(Cook & Wilson, 2010)。所以智力是可以训练的?
后天还是先天
对,如果工作记忆是智力的predictor,那么智力确实是可以训练的,因为工作记忆是可以被训练的。它是后天的而不是先天的。先天只会有一个因素,就是这个人是不是有学习障碍。世界上只有两种人,医学定义上的“白痴”和正常人,而人与人之间没有先天的智力差异,而是后天的教育和训练导致的认知功能强弱。医学定义上的“白痴”指这个可怜的患者有学习障碍,TA的脑子是有问题的,是没办法记住东西的,是有病变的,比如唐氏综合征(二十一三体)导致的脑容量萎缩。当然提一句,这跟老年痴呆和阿兹海默症这些没关系,完全不是一个话题。如果没有这种病变,那么就不存在笨人,只是缺乏训练。这个训练人类工作记忆的实验就是最好的证明(Cook & Wilson, 2010),而现在我们在实验室里有五花八门的可以训练工作记忆的方法。这就是另一个非常复杂的话题了。
总结
智力不是一个简单的单一因素的概念,其中最接近的因素是工作记忆。但是工作记忆并不能完全解释什么是智力,它只是智力很大的一个predictor。而工作记忆是可以被后天训练的。现在正儿八经学术上用的智力测试多多少少都有工作记忆的共线性和以及很重的语言的理解(信息交流)的权重,而这样的测试问卷,有很大的一类错误的可能。而瑞文智力测试真的完全不用相信它,猩猩的得分会比你高。
参考文献列表(APA)
Arthur JR, W., & Woehr, D. J. (1993). A confirmatory factor analytic study examining the dimensionality of the Raven's Advanced Progressive Matrices.Educational and Psychological Measurement,53(2), 471-478.
Brown, T. E., Reichel, P. C., & Quinlan, D. M. (2009). Executive function impairments in high IQ adults with ADHD. Journal of Attention Disorders, 13(2), 161-167.
Bünger, A., Grieder, S., Schweizer, F., & Grob, A. (2021). The comparability of intelligence test results: Group-and individual-level comparisons of seven intelligence tests. Journal of School Psychology, 88, 101-117.
Colom, R., Abad, F. J., Quiroga, M. Á., Shih, P. C., & Flores-Mendoza, C. (2008). Working memory and intelligence are highly related constructs, but why? Intelligence, 36(6), 584-606.
Cook, P., & Wilson, M. (2010). Do young chimpanzees have extraordinary working memory? Psychonomic bulletin & review, 17(4), 599-600.
Dillon, R. F., Pohlmann, J. T., & Lohman, D. F. (1981). A factor analysis of Raven's Advanced Progressive Matrices freed of difficulty factors.Educational and Psychological Measurement,41(4), 1295-1302.
Grondhuis, S. N., Lecavalier, L., Arnold, L. E., Handen, B. L., Scahill, L., McDougle, C. J., & Aman, M. G. (2018). Differences in verbal and nonverbal IQ test scores in children with autism spectrum disorder. Research in Autism Spectrum Disorders, 49, 47-55.
Inoue, S., & Matsuzawa, T. (2007). Working memory of numerals in chimpanzees. Current Biology, 17(23), R1004-R1005.
Kunda, M., McGreggor, K., & Goel, A. (2009). Addressing the Raven’s Progressive Matrices test of “general” intelligence. 2009 AAAI Fall Symposium Series,
Raven, J. C., & Court, J. (1938). Raven's progressive matrices. Western Psychological Services Los Angeles, CA.
Silva, M. A. (2008). Development of the WAIS-III: A brief overview, history, and description. Graduate Journal of Counseling Psychology, 1(1), 11.
Soulières, I., Dawson, M., Samson, F., Barbeau, E. B., Sahyoun, C. P., Strangman, G. E., Zeffiro, T. A., & Mottron, L. (2009). Enhanced visual processing contributes to matrix reasoning in autism. Human brain mapping, 30(12), 4082-4107.
Spearman, C. E. (1927). The abilities of man (Vol. 6). Macmillan New York.
Thurstone, L. L. (1938). Primary mental abilities. Psychometric monographs.
上一篇
下一篇