行为主义(Behaviorism)是20世纪初兴起的一个心理学派,主张心理学应当只研究可观察、可测量的行为,而非不可见的心灵或意识。这一革命性的主张将心理学从内省主义的泥潭中拉出,确立了心理学的自然科学地位。行为主义在20世纪上半叶统治了心理学界,其影响至今仍广泛存在于行为治疗、教育设计、动物训练和人工智能等领域。
行为主义不是一个统一的学派,而是经历了经典行为主义(华生)、**新行为主义(斯金纳、赫尔、托尔曼)和社会认知行为主义(班杜拉)**三个阶段的发展。本文将沿着这条脉络,结合具体实验数据和现实应用,全面解析行为主义的核心理论、贡献和局限。
20世纪初,心理学的主流方法是通过**内省(introspection)**研究意识。冯特(Wundt)和铁钦纳(Titchener)的构造主义训练被试详细描述自己的感觉经验。但这种方法面临严重问题:
1913年,华生(John B. Watson)发表了《行为主义者心目中的心理学》(Psychology as the Behaviorist Views It),这篇"行为主义宣言"彻底改变了心理学的方向。华生受到俄国生理学家**巴甫洛夫(Pavlov)**经典条件反射实验的启发,认为一切复杂行为都可以还原为刺激-反应(S-R)联结。
与此同时,达尔文的进化论也提供了思想基础:既然人类和动物在生物学上是连续的,那么研究动物行为的方法(更可控、更客观)也应当适用于研究人类。
| 主张 | 含义 | 对传统心理学的冲击 |
|---|---|---|
| 方法论的客观主义 | 只研究可观察的行为,拒绝内省法 | 推翻了"心理学是关于意识的科学"这一信条 |
| 还原论 | 复杂行为可分解为S-R单元 | 将心理事件物理化 |
| 环境决定论 | 行为完全由环境刺激塑造,内部因素(意识、自由意志)无因果作用 | 否定了"内在心灵"的自主性 |
| 连续性假设 | 动物研究的结果可推广到人类 | 打开了动物实验的大门 |
| 经验主义 | 所有行为都是习得的,无先天因素 | 与先天论(如格式塔心理学)对立 |
虽然巴甫洛夫是生理学家,但他的经典条件反射实验是行为主义最重要的实验基础之一。
巴甫洛夫在狗的唾液分泌实验中发现了条件反射现象:
巴甫洛夫的实验记录显示:
| 配对次数 | 铃声引起的唾液滴数(30秒内) | 备注 |
|---|---|---|
| 第1次 | 0 | 铃声单独无反应 |
| 第3次(配对后) | 3 | 开始出现微弱分泌 |
| 第6次(配对后) | 8 | 条件反射开始建立 |
| 第9次(配对后) | 13 | 稳定的条件反射 |
| 第12次(配对后) | 15 | 达到峰值 |
| 第15次(配对后) | 14 | 保持稳定 |
巴甫洛夫还发现了一系列规律:
华生(John B. Watson, 1878-1958)在1913年的宣言中提出了极端环境论:
"给我一打健康的婴儿……我可以将他们训练成任何类型的专家——医生、律师、艺术家、商人,甚至乞丐和小偷,无论其天资、倾向、能力、职业和种族如何。"(Watson, 1930)
这段话集中体现了华生的环境决定论思想,也是行为主义最经典的宣言。
这是行为主义发展史上最具争议但也最著名的实验之一。华生和助手雷纳(Rayner)让一名11个月大的婴儿"阿尔伯特"对白鼠习得恐惧反应。
| 实验阶段 | 刺激 | 阿尔伯特的反应 | 观察数据 |
|---|---|---|---|
| 基线测试 | 白鼠 | 好奇,伸手触摸 | 无恐惧反应 |
| 基线测试 | 铁棒敲击巨响(UCS) | 吓哭(UCR) | 剧烈抖动、哭泣 |
| 第1次条件化 | 白鼠+巨响 | 受惊但不哭 | 身体僵硬 |
| 第3次配对 | 白鼠+巨响 | 突然哭泣 | 趴倒、大声哭喊 |
| 第5次配对 | 白鼠+巨响 | 一看到白鼠就哭 | 试图爬走(即恐惧CR已建立) |
| 1周后测试 | 仅白鼠(无巨响) | 仍紧张、哭泣 | 恐惧CR稳定存在 |
| 泛化测试 | 兔子 | 哭泣、转身 | 恐惧泛化到相似刺激 |
| 泛化测试 | 毛皮大衣 | 皱眉、后退 | 恐惧泛化到触觉相似物 |
| 泛化测试 | 圣诞老人面具 | 哭泣 | 恐惧泛化到视觉相似物 |
⚠️ 伦理争议:该实验从未进行消退处理,阿尔伯特的恐惧反应未被消除。后来有研究者追踪发现,阿尔伯特6岁时已因脑积水去世(但这一点仍有争议)。这一实验直接促成了现代心理学实验伦理规范的确立——如今这样的实验绝不允许进行。
华生的经典条件反射只能解释被动的反射性行为(如分泌唾液、恐惧反应),但无法解释主动的、目标导向的行为(如按杠杆、学习技能)。斯金纳(B. F. Skinner, 1904-1990)通过著名的"斯金纳箱"实验发现了操作性条件作用(Operant Conditioning),补充了这一空白。
斯金纳箱是一个精心设计的实验环境:
┌──────────────────────────────────┐
│ │
│ ● 指示灯 │
│ │
│ ┌─────────────┐ │
│ │ 杠杆 / 按钮 │ ← 老鼠按压 │
│ └──────┬──────┘ │
│ │ │
│ ┌──────┴──────┐ │
│ │ 食物槽 │ ← 强化物 │
│ └─────────────┘ │
│ │
│ ════════════════════════ │
│ 电栅栏(可选,用于负强化) │
└──────────────────────────────────┘
↓输出
┌──────────────────┐
│ 累计记录器 │
│ ▁▂▃▃▄▅▆▇█ ← 反应率 │
└──────────────────┘
将一只禁食24小时的白鼠放入斯金纳箱:
| 时间段 | 行为 | 实验结果 |
|---|---|---|
| 适应期(30分钟) | 探索性嗅探、漫步 | 偶尔碰到杠杆,无食物 |
| 第一次强化 | 意外按压杠杆→食物掉落 | 老鼠吃食物,行为被强化 |
| 前5分钟 | 随机活动,偶尔按压 | 约2-3次按压/分钟 |
| 10分钟后 | 更多时间接近杠杆区域 | 约5-8次按压/分钟 |
| 30分钟后 | 目标明确地持续按压 | 约15-20次按压/分钟 |
| 稳定期 | 高效按压,仅短暂离开吃食 | 约40-60次按压/分钟 |
斯金纳的累计记录器记录了反应率曲线:曲线的斜率就是反应率,斜率越陡,反应越快。
斯金纳将后果分为四类:
| 操作 | 增加行为频率(强化) | 减少行为频率(惩罚) |
|---|---|---|
| 给予(正) | 正强化:给予愉悦刺激 例:孩子做家务→给零花钱 |
正惩罚(或称Ⅰ型惩罚):给予厌恶刺激 例:孩子不听话→打手心 |
| 移除(负) | 负强化:移除厌恶刺激 例:系好安全带→蜂鸣声停止 |
负惩罚(或称Ⅱ型惩罚):移除愉悦刺激 例:孩子玩手机超时→没收手机 |
| 情境 | 行为 | 后果 | 结果 | 属于何种操作 |
|---|---|---|---|---|
| 老鼠在箱中 | 按压杠杆 | 获得食物丸 | 按压频率↑ | 正强化 |
| 学生课堂吵闹 | 安静坐好 | 老师停止批评 | 安静行为↑ | 负强化 |
| 小狗跳上沙发 | 跳上沙发 | 主人厉声斥责* | 跳沙发行为↓ | 正惩罚 |
| 孩子发脾气 | 哭闹 | 取消看电视许可 | 哭闹行为↓ | 负惩罚 |
*注意:惩罚的效果通常不如强化稳定,且可能带来副作用(如攻击性、回避行为)
这是斯金纳最重要的发现之一——不同的强化时间表会产生不同的行为模式:
| 强化程序 | 定义 | 典型反应率 | 典型反应模式 | 消退速度 | 现实例子 |
|---|---|---|---|---|---|
| 固定比率(FR) | 每N次反应后强化 | 非常高 | 强化后短暂休息,然后快速反应 | 中等 | 计件工资(每10件产品付酬) |
| 可变比率(VR) | 平均每N次反应后强化(但每次不确定) | 最高 | 持续稳定高反应率,几乎无停顿 | 最慢 | 老虎机(平均每20次中奖一次) |
| 固定间隔(FI) | 每经过固定时间后,第一次反应被强化 | 低 | 临近强化时间,反应率急剧上升("扇贝曲线") | 较快 | 每周工资(快发工资时更努力工作) |
| 可变间隔(VI) | 平均每经过一定时间后,第一次反应被强化 | 中低但稳定 | 均匀持续的反应率 | 慢 | 抽查检验(平均每30分钟检查一次) |
假设在同一小时内记录老鼠的按压反应:
反应率(次/分钟):
FR-10(每10次给1次食物):
时间(min): 0─5 5─10 10─15 15─20 20─25 25─30
反应率: 50▲ 20▼ 55▲ 18▼ 52▲ 22▼
(每次强化后都有一小段停顿)
VR-20(平均每20次给1次食物,随机):
时间(min): 0─5 5─10 10─15 15─20 20─25 25─30
反应率: 45 48 42 50 46 44
(持续稳定的高反应率,无停顿)
FI-5min(每5分钟后第一次按压有效):
时间(min): 0─1 1─2 2─3 3─4 4─5
反应率: 5 10 25 45 60
(扇贝曲线:临近强化点反应率飙升)
VI-5min(平均每5分钟一次,随机):
时间(min): 0─5 5─10 10─15 15─20
反应率: 30 28 32 29
(稳定中低的反应率)
可变比率强化(VR)是维持行为最持久的方法,这正是为什么:
斯金纳还将操作性条件作用应用于教育,提出了程序教学(Programmed Instruction):
这套理念直接影响了几十年后的计算机辅助教学(CAI)和今天的自适应学习系统。
班杜拉(Albert Bandura, 1925-2021)的研究超越了经典和操作性条件作用,指出行为不完全由直接经验塑造——**观察学习(observational learning)**同样重要。
这是心理学史上最经典的实验之一,揭示了攻击行为的观察学习过程。
实验条件分组:
┌─────────────────────────────────────────────────────────┐
│ 72名儿童被试(3-6岁) │
│ 男女各半 │
├────────────┬────────────────────┬────────────────────────┤
│ 实脸组1 │ 实脸组2 │ 控制组 │
│ 看到成人 │ 看到成人 │ 无示范 │
│ 攻击玩偶 │ 玩其它玩具 │ │
├────────────┴────────────────────┴────────────────────────┤
│ ↓ 观看结束后,带进有波波玩偶的房间,观察儿童行为 │
└─────────────────────────────────────────────────────────┘
| 行为类型 | 攻击示范组 | 非攻击示范组 | 控制组 |
|---|---|---|---|
| 模仿攻击行为(平均次数) | 38.2 | 0.5 | 1.5 |
| 语言攻击(平均次数) | 12.7 | 0.0 | 0.0 |
| 坐在玩偶上殴打(平均次数) | 25.8 | 0.2 | 0.5 |
| 用锤子击打(平均次数) | 16.3 | 0.0 | 0.3 |
| 非攻击性玩闹(平均次数) | 18.6 | 24.3 | 21.8 |
结论:看到成人攻击行为的儿童,其攻击行为的频率是其他组的15-20倍。
班杜拉提出了观察学习的完整模型:
注意过程 保持过程
┌────────────────┐ ┌────────────────┐
│ 观察者关注并 │ │ 将观察到的行为 │
│ 感知模型行为 │───→│ 编码存储为记忆 │
│ │ │ │
│ • 模型特征 │ │ • 表象编码 │
│ • 观察者特征 │ │ • 语言编码 │
│ • 情境因素 │ │ • 行为演练 │
└────────────────┘ └────────┬───────┘
│
┌────────────────┐ ┌────────▼───────┐
│ 动机过程 │ │ 动作再现过程 │
│ ┌──────────┐ │ │ ┌────────────┐ │
│ │决定是否 │ │ │ │将心理表象 │ │
│ │执行行为 │←──┼────│ │转化为实际 │ │
│ │ │ │ │ │行为 │ │
│ │外部强化 │ │ │ │ │ │
│ │替代强化 │ │ │ │• 认知组织 │ │
│ │自我强化 │ │ │ │• 行为监控 │ │
│ └──────────┘ │ │ │• 反馈调整 │ │
└────────────────┘ └───────────────┘
这四阶段说明:观察学习不仅仅是"模仿",而是一个包含注意力、记忆、动作能力和动机的复杂认知过程。
班杜拉后期最重要的贡献是提出了**自我效能感(self-efficacy)**概念——个人对自己能否成功完成某项任务的信念。
| 来源 | 描述 | 影响力 | 实际例子 |
|---|---|---|---|
| 掌握经验 | 亲身成功完成经历 | 最强 | 当众演讲成功→相信自己能再做好 |
| 替代经验 | 观察他人成功 | 中等 | 看到同事学会编程→"我也可以" |
| 言语劝说 | 他人鼓励 | 较弱 | "你一定能学会游泳" |
| 生理状态 | 情绪和身体感受 | 取决于解释 | 紧张的心跳→"我太焦虑了"vs"我很兴奋" |
一项针对心脏病康复患者的研究(Bandura, 1988)显示:
| 指标 | 高自我效能组 | 低自我效能组 | 差异 |
|---|---|---|---|
| 完成康复训练的比例 | 82% | 34% | +48% |
| 6个月内恢复工作的比例 | 67% | 21% | +46% |
| 心脏症状复发率 | 13% | 38% | -25% |
| 自我报告生活质量(1-10) | 7.8 | 4.2 | +3.6 |
除了斯金纳之外,新行为主义还有几位重要人物,他们的理论为后来的认知革命埋下了伏笔。
托尔曼(Edward Tolman, 1886-1959)用白鼠迷宫实验证明,行为不完全是S-R的直接联结,而是涉及对环境的内部表征。
| 实验组 | 前10天 | 第11天起 | 结果 |
|---|---|---|---|
| 第1组(强化组) | 每天有食物奖励 | 继续有食物 | 错误率逐日下降,第10天接近零错误 |
| 第2组(无强化组) | 无食物奖励 | 无食物 | 错误率降低很慢,一直在迷宫乱逛 |
| 第3组(潜伏学习组) | 无食物(前10天) | 第11天开始给食物 | 前10天无改善,但第11天后迅速、几乎立即追平第1组 |
关键发现:第3组在前10天虽然没有表现出一学即会的行为,但它们实际上通过学习记住了迷宫的布局,形成了认知地图(cognitive map)。一旦有了动机(食物奖励),它们立刻运用之前隐藏的学习成果。
这一发现证明了:学习不一定表现为行为,存在潜在的认知过程——这对纯粹行为主义是一个重大挑战。
赫尔(Clark Hull, 1884-1952)试图用量化公式描述行为:
其中:
具体的例子:
一只禁食8小时的老鼠走迷宫找食物:
如果换成只禁食2小时的老鼠():
行为势能降低了约67%,预测试验中的行为更弱。赫尔的精确量化尝试虽然最终被证明过于简化,但它开创了用数学模型描述行为的先河。
行为主义为临床心理学提供了一套系统的治疗方法:
由沃尔普(Wolpe, 1958)创立,用于治疗恐惧症:
建立焦虑层级(以蛇恐惧为例):
放松训练:教客户深呼吸、渐进式肌肉放松
逐步脱敏:从最低焦虑层级开始,结合放松状态→逐步上升
治疗效果数据:
| 恐惧类型 | 系统脱敏法有效率 | 平均所需次数 |
|---|---|---|
| 动物恐惧 | 80-85% | 8-12次 |
| 社交恐惧 | 70-75% | 12-20次 |
| 飞行恐惧 | 75-80% | 10-15次 |
| 恐高症 | 70-80% | 6-10次 |
用于强迫症(OCD)治疗,这是认知行为疗法中行为主义成分的代表:
| 阶段 | 暴露任务 | 反应阻止 | 预期焦虑(1-10) | 实际焦虑(1-10) |
|---|---|---|---|---|
| 第1周 | 故意不洗手后触摸门把手 | 15分钟内不洗手 | 9 | 开始时8→5min后7→15min后4 |
| 第2周 | 触摸公共电梯按钮 | 30分钟内不洗手 | 10 | 开始时9→10min后6→30min后3 |
| 第4周 | 用未洗的手拿食物 | 直到吃完饭才洗手 | 10 | 开始时10→15min后5→饭后2 |
| 第6周 | 正常生活,按正常人频率洗手 | 遵守正常洗手规则 | 7 | 开始时5→已能自然应对 |
凯勒计划(Keller Plan / PSI):个性化教学系统,学生按自己进度学习教材,每完成一个单元通过测试才能进入下一单元。研究表明PSI学生的期末成绩比传统教学高10-20%。
代币经济(Token Economy):在特殊教育课堂中,学生表现良好可获得代币,代币可换取奖励。一项对50所特殊学校的元分析发现,代币经济制度使目标行为增加平均42%。
| 贡献方向 | 具体表现 | 影响范围 |
|---|---|---|
| 方法学贡献 | 引入严格实验法、操作定义、客观测量 | 使心理学从哲学走向科学 |
| 应用贡献 | 行为治疗、程序教学、行为管理技术 | 临床、教育、组织管理 |
| 基础理论 | 条件反射、强化程序、行为塑造 | 学习理论、神经科学基础 |
| 动物研究 | 标准化动物行为实验范式 | 比较心理学、神经药理 |
| 局限 | 具体问题 | 例证 |
|---|---|---|
| 过度简化 | 无法解释语言、思维、创造力等复杂过程 | 乔姆斯基对斯金纳《言语行为》的批判(1959) |
| 环境决定论极端化 | 忽略遗传、认知、情绪的作用 | 华生的宣言过于绝对,现代研究显示基因影响占40-60% |
| 伦理问题 | 某些实验(小阿尔伯特)违背伦理 | 直接促成了IRB(机构审查委员会)制度的建立 |
| 生态效度 | 实验室情境与现实生活差异太大 | 斯金纳箱中的行为模式在自然环境中可能完全不同 |
1959年,语言学家**乔姆斯基(Noam Chomsky)**发表了著名的对斯金纳《言语行为》(Verbal Behavior, 1957)的批判。这是行为主义遭遇的最深刻的理论挑战:
今天的行为主义已经演化为认知行为主义(Cognitive Behaviorism),将认知过程纳入行为分析框架:
纯行为主义 认知行为主义
┌───────┐ ┌───────┐ ┌───────┐ ┌───────┐
│ S │────→│ R │ │ S │──→│ O │──→│ R │
└───────┘ └───────┘ └───────┘ └───────┘ └───────┘
刺激 反应 刺激 认知过程 反应
│
┌─────┴─────┐
│信念、预期、│
│评价、图式 │
└───────────┘
| 领域 | 行为主义的持续影响 |
|---|---|
| 认知行为疗法(CBT) | 结合行为技术和认知干预,是当今最主流的心理治疗方法之一 |
| 应用行为分析(ABA) | 行为主义原则在自闭症干预中的系统应用,大量实证数据支持其有效性 |
| 行为经济学 | 行为主义的方法(实验操控变量)与认知经济学结合形成了行为经济学 |
| 强化学习(RL) | 斯金纳的操作性条件作用与机器学习中的强化学习有深刻的类比关系 |
| 神经科学 | 条件反射范式是研究神经可塑性和记忆机制的标准方法 |
有趣的是,斯金纳箱与今天的**强化学习(Reinforcement Learning)**在概念上惊人地相似:
| 斯金纳箱 | 强化学习 | 对应关系 |
|---|---|---|
| 老鼠 | 智能体(Agent) | 行动的实体 |
| 杠杆 | 动作(Action) | 可执行的选项 |
| 食物/电击 | 奖励/惩罚(Reward/Penalty) | 反馈信号 |
| 强化程序 | 奖励函数+调度(Reward Schedule) | 决定何时给奖励 |
| 累计记录器 | 累计奖励曲线 | 追踪performance |
这提醒我们:行为主义的洞见尽管有局限性,但其核心思想在跨越近百年的时间后,仍在最前沿的AI研究中焕发着新的生命力。
行为主义从1913年华生的宣言到今天,已经走过了超过一个世纪。它不是一个静止的学派,而是在不断演化:
行为主义的核心洞见——行为受其后果塑造——已被无数实验和现实应用验证。尽管它不能解释人类心灵的全部,但它为我们理解、预测和改变行为提供了强大的理论和工具。