岭回归(Ridge Regression)是一种正则化的线性回归方法,通过 L2 正则化防止过拟合,是量化交易中最常用的简单模型之一。
标准线性回归:
βmini=1∑n(yi−xiTβ)2
岭回归(L2 正则化):
βmini=1∑n(yi−xiTβ)2+λ∥β∥22
其中:
- β:回归系数
- λ≥0:正则化强度(超参数)
- ∥β∥22=∑j=1pβj2:L2 范数
β^ridge=(XTX+λI)−1XTy
与标准 OLS 解对比:
β^OLS=(XTX)−1XTy
岭回归通过添加 λI 改善矩阵条件数,解决多重共线性问题。
等价于:
βmini=1∑n(yi−xiTβ)2s.t.∥β∥22≤t
- 损失函数:椭圆(等高线)
- 约束区域:圆形(L2 球)
- 解:椭圆与圆的切点
随着 λ 增大:
| λ |
效果 |
| λ=0 |
标准 OLS,无正则化 |
| λ→∞ |
所有系数趋于 0 |
| 最优 λ |
偏差-方差权衡最优 |
常用方法:
- 交叉验证(Cross-Validation)
- 留一法(Leave-One-Out)
- GCV(Generalized Cross-Validation)
ri=β0+β1MKTi+β2HMLi+β3SMBi+ϵi
岭回归防止因子间多重共线性导致的系数不稳定。
配对交易中的价差回归:
Spreadt=α+β⋅Pricet(A)−Pricet(B)+ϵt
rt+1=β0+j=1∑pβjfj,t+ϵt+1
其中 fj,t 是第 j 个因子在时刻 t 的值。
- 简单:闭式解,计算高效
- 稳定:正则化防止过拟合
- 可解释:系数直接反映因子重要性
- 快速:适合高频实时计算
- 线性假设:无法捕捉非线性关系
- 特征选择:不能自动筛选特征(所有特征保留)
- 结构性缺陷:只能看见大特征值方向(macro beta)
- ** regime shift 敏感**:系数不稳定
| 特性 |
Ridge (L2) |
Lasso (L1) |
| 正则化 |
λ∥β∥22 |
λ∥β∥1 |
| 解的形状 |
圆形约束 |
菱形约束 |
| 特征选择 |
否(所有系数非零) |
是(部分系数为零) |
| 多重共线性 |
处理良好 |
处理一般 |
| 计算 |
闭式解 |
需要迭代优化 |
| 量化适用性 |
高(因子共存) |
中(特征筛选) |
"去,给老子整一个 ridge regression,只要做一件事:long apple,short tesla,然后根据历史 volatility 简单做个 vol-scale。"
这个 lazy QR 用 10 行 Python 的 ridge regression 上线,刚好赶上 tech sector 暴涨,躺赚 5%。
为什么能赢?
不是因为 ridge regression 正确,而是因为:
- 足够简单,简单到连犯错都显得平庸且安全
- 刚好赶上市场 beta 方向
- 黑天鹅亏了可以说"这是 systemic risk"
创建于:2026-06-11
*来源:栀染《量化交易的深度学习困境》