过拟合与泛化

模型	多项式次数	训练误差	测试误差	表现
欠拟合	1（线性）	高	高	无法捕捉曲线趋势
合适	2（二次）	低	低	正好捕捉真实规律
过拟合	10（十次）	几乎为零	非常高	完美穿过每个点，但振荡剧烈

$\lambda$	训练准确率	验证准确率	判断
$10^{-6}$	99.8%	88.2%	过拟合
$10^{-4}$	97.3%	92.1%	轻度过拟合
$10^{-2}$	93.5%	93.2%	✅ 最佳
$10^{0}$	85.1%	84.8%	欠拟合
$10^{2}$	52.3%	52.1%	严重欠拟合

Epoch	训练损失	验证损失	动作
50	0.032	0.089	继续
100	0.008	0.072	继续
150	0.002	0.068	最佳，保存
155	0.001	0.069	上升
160	0.0008	0.071	上升
165	0.0006	0.073	上升（耐心 10 到期）→ 停止

¶ 过拟合与泛化