认知心理学(Cognitive Psychology)是心理学的一个核心分支,研究人类心智如何获取、处理、存储和利用信息。它兴起于20世纪50年代中叶,作为对行为主义"黑箱"模型的批判,被称为心理学领域的"认知革命"。认知心理学将心智比作一个信息加工系统,包括感知、注意、记忆、语言、问题解决、推理和决策等一系列高级心理过程。
认知心理学的诞生深受多个学科的影响:计算机科学提供了"信息加工"的概念隐喻,语言学(特别是乔姆斯基的理论)挑战了行为主义对语言的解释,神经科学则逐步揭示了心智的生物学基础。1967年,乌尔里克·奈瑟尔(Ulric Neisser)出版了《认知心理学》一书,标志着该学科的正式确立。
认知心理学中最早、最具影响力的框架是由阿特金森和谢夫林(Atkinson & Shiffrin, 1968)提出的三阶段信息加工模型。该模型将人类记忆系统分为三个主要存储结构:
┌─────────────────────────────┐
环境输入 │ │
──────────► 感官记忆(SM) │
视觉、听觉 │ 容量大,保持<1秒 │
触觉等 │ 注意筛选 │
└───────────┬─────────────────┘
│ 注意(选择性过滤)
▼
┌─────────────────────────────┐
│ 短时记忆(STM)/ 工作记忆 │
│ 容量:7±2个组块 │
│ 保持:约15-30秒(无复述) │
│ 编码方式:以听觉为主 │
└───────────┬─────────────────┘
│ 复述/编码
▼
┌─────────────────────────────┐
│ 长时记忆(LTM) │
│ 容量:理论上无限 │
│ 保持:数分钟到终生 │
│ 编码方式:以语义为主 │
└─────────────────────────────┘
具体举例:当你在人群中听到有人喊你的名字——声音进入感官记忆(保留约1秒),你的注意将其筛选到短时记忆中(你意识到有人在叫你),然后你将其编码到长时记忆中("哦,是老张在叫我")。
巴德利(Baddeley, 1974, 2000)提出了工作记忆模型,取代了简单的短时记忆概念,将"工作台"分为四个组件:
| 组件 | 功能 | 容量 | 编码 | 实例 |
|---|---|---|---|---|
| 中央执行系统 | 注意力控制、任务切换、信息协调 | 有限 | 无特定编码 | 一边开车一边思考路线 |
| 语音回路 | 存储和复述语言信息 | 约2秒音韵缓冲 | 听觉 | 默记电话号码 |
| 视空画板 | 存储和操作视觉/空间信息 | 约3-4个物体 | 视觉/空间 | 在脑中旋转一个三维图形 |
| 情境缓冲区(2000年新增) | 整合多模态信息、连接工作记忆与长时记忆 | 约4个组块 | 多模态 | 在脑中"看到"一个生日场景 |
工作记忆容量的实际测量:经典的"数字广度任务"中,实验者依次念出数字串(如"7-3-9-1-5"),要求被试用五秒内按顺序复述。普通人平均可复述7±2位数字。但通过"组块化"策略,将"1945-2001-911"编码为三个有意义的年份组块,容量显著提高。
注意(Attention)是认知系统的资源分配机制,具有三种核心功能:
鸡尾酒会效应(Cherry, 1953)是选择性注意的经典现象:在嘈杂的宴会中,你可以聚焦于一人的对话而忽略周围噪音;但当有人提到你的名字时,你的注意会不自觉地被吸引过去。
这一现象催生了两个重要理论:
布罗德本特(Broadbent, 1958)的早期选择模型:
输入A ──► 感官缓冲 ──► 过滤器 ──► 知觉处理 ──► 输出
(基于物理特征筛选)
特雷斯曼(Treisman, 1964)的衰减理论:
输入A ──► 感官缓冲 ──► 衰减器 ──► 词典单元 ──► 输出
(未注意通道的信号被减弱但未完全阻断)
两种理论的关键差异在于过滤器位置:布罗德本特认为过滤器在知觉处理之前(基于物理特征),而特雷斯曼认为未注意的信息只是被减弱而非完全阻断(所以你的名字仍能从"衰减"的背景中被识别)。
以下为经典选择性注意实验的典型数据(Schneider & Shiffrin, 1977):
| 实验条件 | 刺激呈现时间 | 准确率 | 反应时 |
|---|---|---|---|
| 一致映射(目标/干扰固定) | 120ms | 95% | 450ms |
| 一致映射(过度练习后) | 40ms | 90% | 400ms |
| 可变映射(目标/干扰随机) | 120ms | 65% | 600ms |
| 可变映射(过度练习后) | 120ms | 68% | 580ms |
这一实验说明:当目标与干扰项的关系稳定(一致映射)时,经过大量练习可以实现"自动加工"(不消耗注意资源);而当关系随机变化(可变映射)时,即使经过练习也需要"控制加工"(消耗注意资源)。
卡尼曼(Kahneman, 1973)提出了注意的容量模型,认为注意是一种有限的资源:
┌──────────────────────┐
│ 可用的注意容量 │
│ (取决于唤醒水平) │
└──────────┬───────────┘
│ 分配策略
▼
┌──────────────────────┐
│ 当前任务的需求 │
│ Task A: 占用60% │
│ Task B: 占用50% │
│ (超过100%则性能下降)│
└──────────────────────┘
举例:新手开车需要占用几乎100%的注意容量(因为未形成自动加工),此时听到收音机播报的复杂信息也无法处理。而熟练司机开车仅占用约30-40%的容量,可以同时听新闻甚至打电话(虽然仍不安全)。
最简单的模式识别理论认为,大脑中存储了无数"模板",新输入的模式与模板逐一匹配。但该理论有三个主要问题:
视觉特征——休伯和威塞尔(Hubel & Wiesel, 1962)在猫的视觉皮层中发现:
字母识别的特征列表(自下而上的识别流程):
以识别字母 "R" 为例:
输入 ──► 特征提取 ──► 特征比较 ──► 决策
│
▼
特征集合:
├── 一条竖线 │
├── 一条斜线 \
├── 一条半圆曲线
└── 在竖线与半圆交汇处 ┘
│
▼
与候选匹配:
P: 竖线+半圆 ✓ 但无斜线 ✗
R: 竖线+半圆+斜线 ✓✓✓
K: 竖线+两条斜线 ✓ 但半圆 ✗
└──► 决策为 "R"(置信度: 92%)
Rosch(1973)的原型理论提出我们存储的不是精确模板,而是某一类别的"最佳代表":
| 类别 | 原型示例 | 成员(典型→边缘) |
|---|---|---|
| 鸟类 | 知更鸟 | 知更鸟→麻雀→鹦鹉→企鹅→鸵鸟→(蝙蝠不是鸟) |
| 家具 | 椅子 | 椅子→桌子→沙发→书架→台灯→(地毯不是家具) |
| 水果 | 苹果 | 苹果→橙子→香蕉→草莓→椰子→(橄榄不是水果) |
原型理论的一个重要预测是典型性效应:人们判断"知更鸟是鸟"比"企鹅是鸟"更快。实际实验数据:判断"知更鸟是鸟"的平均反应时约1100ms,而"企鹅是鸟"约1400ms。
┌─────────────────┐
│ 记忆 │
└────────┬────────┘
│
┌────────────────────────┼────────────────────┐
▼ ▼ ▼
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ 感官记忆 │ │ 短时记忆/ │ │ 长时记忆 │
│ <1秒 │ │ 工作记忆 │ │ 数分‒终生 │
│ 大容量 │ │ 7±2组块 │ │ 理论无限 │
└─────────────────┘ └─────────────────┘ └────────┬────────┘
│
┌──────────────┼──────────────┐
▼ ▼ ▼
┌────────────┐ ┌────────────┐ ┌────────────┐
│ 外显记忆 │ │ 内隐记忆 │ │ │
│ (有意识) │ │ (无意识) │ │ │
└──────┬─────┘ └──────┬─────┘ │ │
│ │ │ │
┌─────────────┼──────┐ │ │ │
▼ ▼ │ │ │ │
┌────────────┐ ┌──────────┐ │ │ │ │
│ 情景记忆 │ │ 语义记忆 │ │ │ │ │
│(个人经历) │ │(事实知识)│ │ │ │ │
└────────────┘ └──────────┘ │ │ │ │
│ │ │ │
▼ ▼ │ │
┌────────────┐ │ │
│ 程序性记忆 │ │ │
│(技能/习惯)│ │ │
└────────────┘ │ │
│ │
▼ ▼
┌────────────┐ ┌────────────┐
│ 启动效应 │ │ 条件反射 │
└────────────┘ └────────────┘
赫尔曼·艾宾浩斯(Ebbinghaus, 1885)用无意义音节(如"ZOK"、"MEF")作为材料,对自己进行了长达两年的记忆实验,发现了记忆保持随时间衰减的规律:
| 时间间隔 | 保持率(%) | 遗忘率(%) |
|---|---|---|
| 20分钟 | 58.2 | 41.8 |
| 1小时 | 44.2 | 55.8 |
| 9小时 | 35.8 | 64.2 |
| 1天 | 33.7 | 66.3 |
| 2天 | 27.8 | 72.2 |
| 6天 | 25.4 | 74.6 |
| 31天 | 21.1 | 78.9 |
艾宾浩斯遗忘曲线可以用以下公式近似拟合:
其中 为保持率, 为时间, 为记忆强度参数。例如,当 天时, 天时 ,这与实际数据(33.7%)大致吻合(不同材料类型参数不同)。
间隔效应(Spacing Effect):如果同样的学习时间被分散到多个时间点而非一次性集中学习(集中学习 vs. 间隔学习),长期记忆效果显著更好。实验数据如下(Cepeda et al., 2006):
| 学习模式 | 总学习时间 | 延迟1周后测试 | 延迟1月后测试 |
|---|---|---|---|
| 集中学习(1次4小时) | 4h | 38% | 22% |
| 间隔1天(2次×2小时) | 4h | 52% | 38% |
| 间隔3天(4次×1小时) | 4h | 68% | 52% |
| 间隔7天(4次×1小时) | 4h | 74% | 58% |
| 效应名称 | 描述 | 实验例证 |
|---|---|---|
| 近因效应 | 最后呈现的项目更容易回忆 | 词表回忆中倒数几个词准确率最高(~80%) |
| 首因效应 | 最先呈现的项目也较易回忆 | 词表第一个词准确率约60%,高于中间词的30% |
| 生成效应 | 自己生成的内容比被动阅读记得更牢 | 完成"热—冷" vs. 阅读"热—冷":生成组回忆率高出45% |
| 测试效应 | 测试本身能增强记忆 | 同样学习时间,有测试组比仅阅读组1周后多记住50% |
| 系列位置效应 | 中间项目最难回忆 | 15个词中第7-9个词的回忆率仅20-25% |
| 编码特异性 | 回忆时线索与编码时匹配效果好 | 陆地上学习水下回忆:得分低;水下学习水下回忆:得分高40% |
| 情绪增强 | 情绪性事件比中性事件记得更牢 | 毕业典礼、婚礼细节多年后仍清晰(杏仁核参与) |
知识在长时记忆中的表征方式主要有三种:
语义网络模型(Collins & Quillian, 1969):
┌───────────┐
│ 动物 │
│ 会呼吸、会动│
└─────┬─────┘
│ 是
┌────────────┼────────────┐
▼ ▼ ▼
┌───────────┐ ┌───────────┐ ┌───────────┐
│ 鸟 │ │ 鱼 │ │ 哺乳动物 │
│ 有翅膀 │ │ 在水中生活 │ │ 有毛皮 │
│ 会飞 │ │ 有鳞片 │ │ 哺乳 │
└─────┬─────┘ └───────┬───┘ └──────┬────┘
│ 是 │ 是 │ 是
▼ ▼ ▼
┌───────────┐ ┌───────────┐ ┌───────────┐
│ 金丝雀 │ │ 鲨鱼 │ │ 狗 │
│ 能唱歌 │ │ 会攻击 │ │ 会吠叫 │
│ 黄色 │ │ 灰色 │ │ 忠诚 │
└───────────┘ └───────────┘ └───────────┘
这一模型预测了认知经济性原则:属性存储在最高水平的节点上(如"动物"存储"会呼吸"),而不是在每个子节点重复存储。这产生了"典型性效应"——判断"金丝雀能唱歌"比"金丝雀会呼吸"快,因为"能唱歌"是金丝雀节点的特有属性,而"会呼吸"需要沿链接向上推理到"动物"节点。
实际实验数据(Collins & Quillian):
| 判断任务 | 平均反应时 |
|---|---|
| "金丝雀是金丝雀"(同一级) | 850ms |
| "金丝雀是鸟"(跨一级) | 990ms |
| "金丝雀是动物"(跨两级) | 1150ms |
谢泼德和梅茨勒(Shepard & Metzler, 1971)的经典心理旋转实验为心理意象提供了有力证据:
实验者向被试展示两个三维图形的图片,要求判断它们是否相同(只是旋转了角度)。结果发现:
| 旋转角度 | 平均反应时间 |
|---|---|
| 0°(相同角度) | 1100ms |
| 40° | 1300ms |
| 80° | 1550ms |
| 120° | 1850ms |
| 160° | 2150ms |
| 180° | 2600ms |
反应时间与旋转角度呈线性关系(),斜率约为每60°需要1秒。这一"心理上的"旋转与实际物理旋转具有相同的模拟特性,说明心理意象并非命题符号的附加现象,而是一种独特的表征方式。
图式(Schema):组织化的知识结构,引导信息的编码和提取。
脚本(Script):对常见事件序列的图式化知识。以"餐馆脚本"(Schank & Abelson, 1977)为例:
场景:餐馆
角色:顾客、服务员、厨师、收银员
┌──────────────────────────────────────────────────┐
│ 进入 离开 │
│ ▼ ▲ │
│ ┌────┐ 找座 ┌────┐ 点餐 ┌────┐ 付款 ┌────┐ │
│ │门口│ ──► │桌位│ ──► │点菜│ ──► │收银│ │
│ └────┘ └────┘ └────┘ └────┘ │
│ │ │
│ ▼ │
│ ┌────┐ │
│ │ 用餐 │
│ └──┬─┘ │
│ │ 上菜 │
│ ▼ │
│ ┌────┐ │
│ │ 厨房 │
│ └────┘ │
└──────────────────────────────────────────────────┘
如果没有脚本,每次去餐馆都需要重新理解整个流程。脚本让我们能够自动完成日常任务,但当脚本被违反时(如在西餐厅中先付款后用餐),我们会感到困惑——这正是脚本存在的证据。
高层:话语理解(理解说话者的意图)
▲
中层:句法分析(确定句子结构)
▲
低层:词汇加工(识别单词)
▲
基础:语音/字形加工(识别音素/字母)
心理词典是一个庞大的存储系统,成年人的心理词典大约包含50,000-100,000个词。词汇提取的速度令人惊讶:在大约150-200ms内,我们就能从心理词典中定位并识别出一个口语词。
词汇歧义消解的经典实验(Swinney, 1979)使用"跨通道启动"范式:
实验材料:"The man found a bug in the room."("bug"有"虫子"和"窃听器"两种意思)
实验者让被试听到句子时,在关键位置呈现视觉单词:
| 测试条件 | 启动词 | 测试位置 | 反应时 |
|---|---|---|---|
| 相关(虫子义) | ANT(蚂蚁) | 立即(0ms) | 540ms |
| 相关(窃听器义) | SPY(间谍) | 立即(0ms) | 550ms |
| 无关 | SEW(缝纫) | 立即(0ms) | 680ms |
| 相关(虫子义) | ANT | 延迟(750ms后) | 660ms |
| 相关(窃听器义) | SPY | 延迟(750ms后) | 550ms |
| 无关 | SEW | 延迟(750ms后) | 670ms |
这说明:歧义词在早期阶段(0ms)会激活所有可能的含义(ANT和SPY都被启动),但在上下文澄清后(750ms),只有与语境一致的含义(SPY)保持活跃。
花园路径句的经典例子:"The horse raced past the barn fell."
这句话乍看起来好像是"The horse raced past the barn"(跑过谷仓的马),直到最后的"fell"才意识到句子结构需要重分析,正确的解读是"The horse (that was) raced past the barn fell"(被赶着跑过谷仓的马摔倒了)。
花园路径理论(Frazier, 1987)提出了两种句法分析策略:
这两种策略解释了为什么某些句子结构容易产生"误解—修正"的认知过程。
根据纽厄尔和西蒙(Newell & Simon, 1972)的问题空间理论,问题解决包括三个状态:
初始状态 ──► 应用算子 ──► 中间状态 ──► 应用算子 ──► 目标状态
问题解决的策略:
├── 算法:保证能找到答案(如穷举搜索)
└── 启发式:高效但不保证正确
├── 手段-目的分析(将目标分解为子目标)
├── 逆向搜索(从目标反向推导)
├── 类比推理(借鉴过去类似问题的解法)
└── 爬山法(每一步选择最接近目标的动作)
邓克尔(Dunker, 1945)的经典问题展示了"功能固着"——人们倾向于只按常规方式认识事物的功能。
问题:给你一盒图钉、一根蜡烛和一盒火柴,如何将蜡烛固定在墙上并让烛油不滴到地上?
大多数人的初始方案(功能固着):
正确方案(克服功能固着):
关键问题在于人们将图钉盒仅视为"装图钉的容器"而非"一个小托盘"。心理学实验显示,如果图钉盒是空的(问题呈现时图钉和盒子分开),解决问题的人从40%提高到约80%。
沃森(Wason, 1966)的经典逻辑推理任务:
题目:桌上有四张卡片,每张卡片一面是字母,一面是数字。它们显示:
[E] [K] [4] [7]
规则:"如果一张卡片的一面是元音字母,那么它的另一面是偶数。"
问题:要验证这个规则是否正确,你最少需要翻看哪些卡片?
正确答案是翻看 [E](检查是否背后是偶数)和 [7](检查背后是否不是元音字母),而非 [4](偶数不违反规则)。然而在实际测试中,只有约**10%**的人回答正确。常见错误是翻转 [E] 和 [4](54%),或者只翻 [E](33%)。
但当规则换成具体社会情境时(如"如果一个人在酒吧喝酒,那么他必须年满21岁"),正确率迅速上升到约73%,这说明人类的推理强烈依赖具体情境和内容知识。
| 卡片版本 | 正确率 | 典型错误 |
|---|---|---|
| 抽象版(元音/偶数) | 10% | 翻[4]而不是[7] |
| 具体版(年龄/喝酒) | 73% | 少翻或漏翻 |
| 具体版(仿制/进入) | 70% | - |
这个差异解释了人类推理的进化适应性——我们善于发现规则违反者(社会契约场景),但在纯抽象逻辑推理中表现不佳。
卡尼曼和特沃斯基(Kahneman & Tversky, 1970s-1980s)的研究揭示人们在实际决策中并不遵循经典经济学的"理性人"假设,而是使用一系列认知捷径(启发式),这些启发式在某些情况下导致系统性偏差。
琳达问题(Linda Problem, Tversky & Kahneman, 1983):
"琳达,31岁,单身,坦诚直率,非常聪明。她主修哲学。作为学生,她非常关注歧视和社会公正问题,也曾参加反核示威。"
请对以下陈述的可能性排序:
A. 琳达是银行出纳员
B. 琳达是银行出纳员并且活跃于女权运动
结果:约85%的被试认为B比A更可能。
逻辑错误:A包含B(B=A∩女权主义者),所以B的概率不可能大于A。但人们认为B"更典型"——这就是合取谬误。
人们根据记忆中信息的"容易获取程度"来判断事件的频率或概率。
| 问题 | 实际数据 | 典型估计 | 偏差方向 |
|---|---|---|---|
| 死于龙卷风 vs 哮喘的概率 | 哮喘:20000人/年 龙卷风:60人/年 | 认为龙卷风更致命 | 媒体高曝光事件被高估 |
| 英语中字母K在首字母 vs 第三字母的单词更多? | 第三字母约为首的3倍 | 认为首字母更多 | 首字母更容易想起 |
亚洲疾病问题(Tversky & Kahneman, 1981):
假设一种罕见的疾病可能夺走600人的生命。你觉得以下哪个方案更好?
正面框架(收益):
负面框架(损失):
实验结果:
| 框架 | 选择A/C(确定项) | 选择B/D(风险项) |
|---|---|---|
| 正面框架(收益) | 72%(选A) | 28% |
| 负面框架(损失) | 22% | 78%(选D) |
A与C在数学上完全等价,B与D也完全等价。但人们在收益框架中倾向于确定选项(规避风险),在损失框架中倾向于冒险选项(寻求风险)。这就是前景理论的核心发现。
前景理论用以下数学模型描述人们如何感受收益和损失:
其中典型参数值(Kahneman & Tversky, 1992):
举例:如果某人现在拥有100元,他有两种选择:
这两者在数学上等价,但人们通常选择肯定收益(风险规避)。
沃森的2-4-6任务(Wason, 1960):
实验者说:"我正在遵循一个规则生成三数组。这个三数组'2-4-6'符合我的规则。请提出一些其他三数组,我会告诉你它们是否符合规则,然后请你说出规则是什么。"
大多数人的策略:提出验证假设的三数组(如"8-10-12"、"20-22-24"),得到"符合"的反馈后,自信地说出规则"以2递增的偶数序列"。
正确答案:规则是"三个递增的数"(2-4-6符合,1-2-3也符合,但10-9-8不符合)。
只有约20%的被试能提出证伪假设的三数组(如"1-2-9"、"3-1-2")。大多数人寻找确认证据而忽略潜在的证伪信息——这就是确认偏差。
认知心理学采用多种实验范式来研究不同的认知过程:
| 研究领域 | 经典范式 | 测量指标 | 理论解释 |
|---|---|---|---|
| 注意 | 双耳分听、斯特鲁普任务 | 反应时、正确率 | 注意过滤器位置 |
| 记忆 | 自由回忆、再认、线索回忆 | 回忆量、再认率 | 记忆系统分类 |
| 语言 | 词汇判断、语义启动 | 反应时、启动量 | 心理词典组织 |
| 推理 | 选择任务、三段论 | 正确率、错误模式 | 心理模型、启发式 |
| 心理意象 | 心理旋转、心理扫描 | 反应时与角度的线性关系 | 类比表征 |
| 问题解决 | 河内塔、蜡烛问题 | 步骤数、时间、错误类型 | 问题空间、功能固着 |
斯特鲁普(Stroop, 1935)任务是最经典的认知心理学实验之一:
实验材料:用不同颜色的墨水书写的颜色词
实验条件:
任务:说出墨水的颜色
典型结果:
| 条件 | 平均反应时 | 干扰效应 |
|---|---|---|
| 一致(红墨水+"红") | 520ms | 无(甚至促进) |
| 中性(红墨水+XXXX) | 540ms | 基线 |
| 不一致(红墨水+"蓝") | 680ms | +140ms |
不一致条件下的额外140ms被称为斯特鲁普干扰效应,表明语义加工(阅读"蓝"字)是自动化的,即使任务要求忽略语义,我们仍然无法阻止语义信息的加工。
认知心理学从诞生至今已走过半个多世纪,从最初的"信息加工"范式到当前与神经科学、人工智能的交叉融合,它持续深化着我们对人类心智的理解。关键洞见包括:
今天,认知心理学与认知神经科学、计算认知科学、人工智能的边界日益模糊,多学科的交叉正在推动我们对心智的理解迈向新的深度。