认知心理学(Cognitive Psychology)是心理学的重要分支,研究人类心智活动的内在过程,包括感知、注意、记忆、语言、思维、推理、决策、问题解决等高级认知功能。与行为主义只关注可观察的行为不同,认知心理学认为内部心理过程可以通过科学方法加以研究,这一信念被称为认知革命的核心立场。
20世纪上半叶,行为主义(Behaviorism)主导心理学领域,强调只研究可观察的刺激-反应(S-R)关系,将心智视为不可研究的"黑箱"。然而,到1950年代,行为主义难以解释以下现象:
1956年被公认为认知革命元年。这一年,乔治·米勒(George Miller)发表"神奇数字7±2"的论文,指出短时记忆的容量限制;布鲁纳(Jerome Bruner)和西蒙(Herbert Simon)等学者在MIT召开的"信息论研讨会"上,共同奠定了认知科学的基础。
| 阶段 | 时期 | 核心观点 | 代表人物 |
|---|---|---|---|
| 第一代:信息加工论 | 1950s-1970s | 将心智类比为计算机,认知是对信息的序列加工 | 纽厄尔、西蒙、阿特金森、谢夫林 |
| 第二代:联结主义 | 1980s-1990s | 认知是神经网络中并行分布式加工的结果 | 鲁梅尔哈特、麦克莱兰、辛顿 |
| 第三代:具身认知 | 2000s至今 | 认知受身体、环境和情境的嵌入影响 | 瓦雷拉、汤普森、巴尔斯 |
具体例子:以"识别一张猫的照片"为例,信息加工论认为这是一个"视网膜→特征检测→模式匹配→记忆调取"的串行过程;联结主义则认为大量神经元的并行激活产生了"猫"的概念;具身认知强调你过去的养猫经历(身体经验)被激活,共同参与了识别过程。
1956 ── 认知革命元年(米勒7±2、乔姆斯基句法、西蒙AI研讨会)
1960 ── 米勒和布鲁纳建立哈佛认知研究中心
1967 ── 奈瑟尔出版《认知心理学》,标志学科正式诞生
1974 ── 巴德利提出工作记忆模型
1980 ── 特雷斯曼提出注意的衰减模型
1986 ── 鲁梅尔哈特和麦克莱兰提出PDP(并行分布式加工)模型
1990 ── fMRI开始用于认知研究,认知神经科学兴起
2000 ── 镜像神经元发现,连接认知与社会认知
2010s ── 深度学习模型与认知心理学交叉融合
人类通过视觉、听觉、触觉、嗅觉和味觉五种通道接收外界信息。以视觉系统为例,信息处理遵循如下层级:
外界光线 → 视网膜感光细胞(视杆/视锥)
→ 双极细胞 → 神经节细胞
→ 外侧膝状体(LGN)
→ 初级视皮层(V1)
→ 高级视皮层(V2-V5, IT等)
→ 物体识别 / 空间定位
关键发现:Hubel和Wiesel(1962)对猫的视觉皮层进行电生理记录,发现V1区的神经元对特定方向的边缘(如垂直、水平线)有选择性反应,称为方向选择性细胞。这一发现获得了1981年诺贝尔生理学或医学奖。
人的信息处理能力是有限的。Daniel Kahneman(1973)在其《注意与努力》一书中提出了注意的容量模型(Capacity Model),认为注意是一种有限的认知资源。
**斯特鲁普效应(Stroop Effect,1935)**是注意研究中最经典的实验范例:
实验设计:向被试呈现用不同颜色书写的颜色词,任务是命名文字的印刷颜色而非文字本身。
| 刺激类型 | 示例 | 命名时间 | 解释 |
|---|---|---|---|
| 一致条件 | 红色墨水写的"红" | 最快(~500ms) | 词义和颜色一致,自动加工辅助 |
| 不一致条件 | 蓝色墨水写的"红" | 最慢(~800ms) | 词义干扰,需抑制自动阅读 |
| 中性条件 | 蓝色墨水写的"XXX" | 居中(~600ms) | 无词义干扰 |
这一效应表明:自动化加工(阅读)会干扰控制性加工(颜色判断),反映注意的选择与抑制机制。
记忆是认知心理学的核心研究领域。Atkinson和Shiffrin(1968)提出的多存储模型(Multi-Store Model)是最经典的理论框架:
┌─────────────────┐
│ 复述(Rehearsal) │
│ ↓ │
外部输入 → 感觉记忆 → 短时记忆 → 长时记忆
↓ ↓ ↓
<1秒 15-30秒 无限期
大容量 7±2个组块 无限容量
Sperling(1960)的部分报告法实验首次揭示了感觉记忆的存在:
结论:视觉感觉记忆(图像记忆,Iconic Memory)容量接近全部12个字母,但消退极快(约250ms)。听觉感觉记忆(回声记忆,Echoic Memory)持续约2-4秒。
Baddeley和Hitch(1974)将"短时记忆"概念扩展为工作记忆(Working Memory),提出包含三个子系统的模型:
┌─────────────────────┐
│ 中央执行系统 │
│ (Central Executive) │
│ - 注意控制 │
│ - 任务切换 │
│ - 抑制干扰 │
└──┬──────────────┬───┘
│ │
┌──────────▼──┐ ┌──────▼──────────┐
│ 语音回路 │ │ 视空间画板 │
│(Phonological │ │(Visuospatial │
│ Loop) │ │ Sketchpad) │
│ - 语音存储 │ │ - 视觉存储 │
│ - 发音复述 │ │ - 空间处理 │
└─────────────┘ └─────────────────┘
例:计算"37 × 24"的心算过程
如果同时要求记住一个电话号码(增加语音回路负荷),心算速度会显著下降,这是双任务干扰的证据。
┌─────────────────────────────────────┐
│ 长时记忆 │
│ (Long-term Memory) │
└──────────┬──────────────────────────┘
│
┌────────────┴────────────┐
│ │
┌─────▼─────┐ ┌───────▼─────────┐
│ 外显记忆 │ │ 内隐记忆 │
│ (Explicit) │ │ (Implicit) │
└──┬──┬──────┘ └───┬─────────────┘
│ │ │
┌────▼ ▼────────┐ ┌──────▼──────┐
│情景 语义 │ │ 程序性记忆 │
│记忆 记忆 │ │(Procedural) │
│(个人 (事实 │ │ - 骑自行车 │
│经历) 知识) │ │ - 打字 │
└──────────────┘ └─────────────┘
经典案例:健忘症患者H.M.(1926-2008)因治疗癫痫切除了内侧颞叶(包括海马体),结果:
这证明了外显记忆(依赖海马)和内隐记忆(依赖基底节等)是分离的记忆系统。
语言理解涉及从低到高多个层级:
语音感知 → 词汇识别 → 句法分析 → 语义整合 → 语用理解
↓ ↓ ↓ ↓ ↓
声学信号 → 音素识别 → 词语提取 → 结构构建 → 意图推断
沃森·特雷人工语言学习实验(Saffran等,1996)展示了婴儿如何从连续语音流中学习"单词边界":
三论推理(Wason Selection Task,1966)是推理研究中最著名的范式之一:
规则:"如果卡片的一面是元音字母,则另一面是偶数数字"
呈现四张卡片:[A] [K] [2] [7]
任务:至少要翻开哪些卡片才能验证规则?
| 卡片 | 选择逻辑 | 典型回答 |
|---|---|---|
| A(元音) | 必须翻,验证后件(看是否为偶数) | ✅ 46%选择 |
| K(辅音) | 无需翻,规则对此没有约束 | ❌ 少数人误选 |
| 2(偶数) | 无需翻,规则是"如果P则Q",Q成立不保证P成立 | ❌ 多数人误选 |
| 7(奇数) | 必须翻,验证逆否命题(非Q则非P) | ✅ 仅4%选择 |
大多数人只能答对A这张卡片,但在具体情境中(如"如果喝酒则必须已满18岁"检查身份证)正确率可提升至70%+。这揭示了抽象推理和具体推理使用的心理机制不同,被称为内容效应(Content Effect)。
| 方法 | 原理 | 典型指标 | 应用领域 |
|---|---|---|---|
| 反应时测量 | 心理过程耗时反映加工复杂性 | 反应时(ms) | 词汇识别、注意分配 |
| 错误率分析 | 困难任务易出错 | 正确率(%) | 推理、决策 |
| 启动效应 | 先前刺激影响后续加工 | 启动量(ms差值) | 语义记忆、内隐认知 |
| 双任务干扰 | 资源有限性导致任务竞争 | 干扰程度(%) | 注意、工作记忆 |
| 眼动追踪 | 注视反映注意焦点 | 注视时间、扫视路径 | 阅读、场景感知 |
| 技术 | 原理 | 时间分辨率 | 空间分辨率 | 安全性 |
|---|---|---|---|---|
| fMRI | 血氧水平依赖(BOLD)信号 | ~2s | 1-3mm | 无创 |
| EEG/ERP | 头皮电位变化 | ~1ms | ~10mm | 无创 |
| MEG | 脑磁信号 | ~1ms | 2-5mm | 无创 |
| PET | 放射性示踪剂代谢 | ~10s | 3-5mm | 微创 |
| TMS | 磁脉冲暂时干扰脑区 | 即时 | 5-10mm | 微创 |
案例:面孔加工的"梭状回面孔区"(FFA)
Kanwisher等(1997)使用fMRI研究发现,大脑梭状回(Fusiform Gyrus)的一个特定区域对面孔的反应强度显著高于对其他物体的反应:
| 刺激类型 | FFA激活水平(BOLD变化%) | 解释 |
|---|---|---|
| 人脸照片 | +2.5% | 最强反应(特异性) |
| 动物身体 | +0.3% | 微弱反应 |
| 房屋建筑 | +0.1% | 基本无反应 |
| 物体剪影 | +0.1% | 基本无反应 |
| 拼凑面孔 | +1.8% | 仍产生较强反应 |
FFA的核心激活量为对面孔**构型(configural)**加工的特异化,这解释了为什么人类擅长认脸但对颠倒面孔(倒置效应)识别困难。
以计算-表征为核心理念,将心智操作比拟为计算机的程序执行:
输入 → 编码 → 存储 → 提取 → 输出
(感知) (注意)(记忆)(回忆)(行为)
Newell & Simon的"物理符号系统假设"(1976):智能系统(无论人类还是计算机)的核心是操作符号的能力。这一假设为AI和认知心理学的交叉奠定基础。
与传统信息加工理论不同,联结主义模型采用分布式表征和并行加工:
| 对比维度 | 信息加工理论 | 联结主义 |
|---|---|---|
| 加工方式 | 串行、符号 | 并行、亚符号 |
| 知识存储 | 符号列表 | 连接权重分布 |
| 学习机制 | 规则编写 | 反向传播/Hebbian |
| 对损伤容忍 | 脆弱(单点故障) | 鲁棒(逐渐降级) |
| 原型的表示 | 抽象模板 | 统计原型(模式完成) |
具体例子:认识"狗"这个概念
与传统认知观点(认知=大脑中的符号计算)不同,具身认知强调:
┌──────────────────┐
│ 认知心理学 │
│(Cognitive Psych) │
└────────┬─────────┘
│
┌──────────────────┼─────────────────────┐
│ │ │
▼ ▼ ▼
┌──────────┐ ┌──────────────┐ ┌────────────────┐
│ 认知神经 │ │ 认知科学 │ │ 人工智能/机器 │
│ 科学 │ │(Cognitive │ │ 学习 │
│(Cognitive │ │ Science) │ │(AI/ML) │
│ Neurosci)│ └──────────────┘ └────────────────┘
└──────────┘ │ │
│ │
▼ ▼
┌──────────────┐ ┌────────────────┐
│ 心理语言学 │ │ 人机交互 │
│(Psycho- │ │(Human-Computer │
│ linguistics) │ │ Interaction) │
└──────────────┘ └────────────────┘
认知心理学与AI之间存在双向影响:
| 方向 | 从认知心理学→AI | 从AI→认知心理学 |
|---|---|---|
| 注意力机制 | 人类注意的衰减模型启发Transformer注意力 | Transformer架构挑战传统注意理论 |
| 记忆模型 | 工作记忆模型指导LSTM网络 | 深度学习表征验证记忆的分布式假说 |
| 语言处理 | 句法分析树影响NLP架构 | GPT等大语言模型引发新的认知讨论 |
| 视觉识别 | 视皮层层级结构启发CNN | DNN识别模式挑战传统特征检测理论 |
2024年MIT的研究使用Transformer模型模拟人类阅读时的眼动模式,发现模型在注意力分配上与人脑的fMRI数据有高度一致性(相关系数r=0.78),表明注意力机制可能是大脑和深度学习系统的通用原理。
| 任务类型 | 典型容量 | 实验范式 | 关键发现 |
|---|---|---|---|
| 数字广度 | 7±2 | 正序/倒序复述 | 受组块策略影响显著 |
| 空间工作记忆 | ~3-4个位置 | Corsi积木敲击 | 空间容量低于语言容量 |
| 客体工作记忆 | ~3-4个物体 | 变化探测范式 | 颜色+位置=容量下降 |
| 执行功能 | ~2个规则 | 任务切换实验 | 切换成本约200-400ms |
| 阶段 | 年龄 | 关键能力 | 经典实验 |
|---|---|---|---|
| 感知运动期 | 0-2岁 | 客体永久性 | 遮脸游戏 |
| 前运算期 | 2-7岁 | 符号功能,中心化 | 守恒实验(水量) |
| 具体运算期 | 7-11岁 | 守恒、分类、排序 | 数字守恒实验 |
| 形式运算期 | 11岁+ | 抽象推理、假设-演绎 | 钟摆问题 |