人工智能正深刻重塑金融行业,从风险控制、量化交易到智能投顾、反欺诈与信用评估,AI 技术在金融领域的应用已从实验阶段进入规模化落地阶段。本文系统梳理 AI 金融的核心技术栈、经典应用场景、实践案例及未来趋势。
金融行业天然具有数据密集、规则明确、决策高频的特点,这使得它成为人工智能技术落地的理想场景。AI 金融(AI in Finance)是人工智能与金融服务的交叉领域,涵盖从零售银行的信用评分到对冲基金的算法交易,从保险公司的理赔审核到监管科技(RegTech)的合规监控等广泛场景。
根据 McKinsey Global Institute 的测算,AI 技术可为全球金融服务业每年创造约1万亿美元的价值,主要来自收入增长(个性化产品推荐、精准营销)和成本节约(自动化流程、风险降低)。BCG 的报告也指出,到 2027 年,AI 在金融领域的渗透率将超过 80%。
| 维度 |
传统方法 |
AI 驱动方法 |
提升幅度 |
| 风控精度 |
线性回归 + 规则引擎 |
GBDT/DNN + 图神经网络 |
AUC 提升 10-30% |
| 交易频率 |
人工决策(分钟级) |
算法交易(微秒级) |
速度提升 10^6 倍 |
| 反欺诈覆盖 |
关键词规则 + 黑白名单 |
序列模型 + 异常检测 |
召回率提升 50-200% |
| 信用评估维度 |
20-50 个变量 |
1000+ 特征 + 非结构化数据 |
坏账率降低 20-40% |
| 客服成本 |
人工坐席 |
NLP 对话机器人 |
成本降低 60-80% |
金融 AI 的数据来源极为丰富,可分为以下层级:
- 结构化数据:交易流水、资产负债表、K线数据、用户信息表——最传统也最可靠的数据源,通常存储在 OLAP 数据库(如 ClickHouse、Doris)或时序数据库(如 InfluxDB、TDengine)中。
- 半结构化数据:财报 PDF、监管文件 XML、SWIFT 报文——需要解析和特征提取。
- 非结构化数据:新闻文章、社交媒体帖子、电话录音、视频监控——NLP 和 CV 技术的核心战场。
- 另类数据(Alternative Data):卫星图像(港口集装箱数量、停车场车流量)、信用卡 POS 数据、网页爬虫(商品价格监控)、天气数据——近年来量化基金和风控模型的重要创新方向。
金融场景的特征工程有其独特方法论:
- 时序特征:滚动统计量(过去 n 天的均值、标准差、峰度)、滞后特征、差分特征、技术指标(MACD、RSI、布林带)
- 交叉特征:离散变量的笛卡尔积、数值特征的分箱交叉、FM(Factorization Machine)自动交叉
- 图特征:转账网络的中心度、社区检测、PageRank——用于识别洗钱团伙和欺诈群体
- 文本特征:财报情绪的 BERT 嵌入、新闻主题分类、监管文件的关键词密度
- 行为特征:点击流序列、页面停留时间、设备指纹——反欺诈的重要手段
金融 AI 的模型选择遵循"场景适配"原则,常见模型家族包括:
- 树模型(XGBoost/LightGBM/CatBoost):信用评分、反欺诈规则挖掘——可解释性强,训练效率高,仍然是生产环境的主力
- 深度学习(Transformer/GRU/LSTM):时序预测、NLP 分析、图异常检测——适合复杂模式识别
- 强化学习(DQN/PPO/SAC):量化交易策略优化、做市商决策——探索最优策略
- 生成模型(GAN/VAE/扩散模型):合成数据、场景模拟、反欺诈对抗训练
金融 AI 的部署具有极高的稳定性与合规要求:
- 模型版本管理:MLflow、Weights & Biases,需要满足模型审计要求
- 特征存储:Feast、Tecton,确保离线训练和在线推理特征一致性
- 模型监控:数据漂移检测(PSI、KS)、概念漂移检测、性能衰减告警
- 合规沙箱:模型解释报告(SHAP/LIME)、公平性审计(Demographic Parity、Equal Opportunity)
- 推理加速:TensorRT、ONNX Runtime、vLLM——对低延迟场景至关重要
风险管理是 AI 在金融领域最成熟、最广泛的应用方向。根据 Basel 框架,金融风险可分为信用风险、市场风险、操作风险和流动性风险四大类。
信用风险评估(Credit Risk Assessment)是银行贷款和信用卡审批的核心。传统方法使用逻辑回归(Logistic Regression)基于申请人的收入、负债、信用历史等变量进行评分。AI 方法在此基础上大幅扩展了变量维度和模型能力:
模型演进路径:
- 评分卡时代:基于 Logistic Regression 和 WOE(Weight of Evidence)编码的评分卡模型,优点是可解释性强,缺点是特征表达能力有限
- 树模型时代:XGBoost/LightGBM 成为主流,能够自动处理缺失值、特征交互和非线性关系
- 深度学习时代:使用 TabNet、NODE(Neural Oblivious Decision Ensembles)等深度表格模型,结合序列信息(还款行为序列)和文本信息(财报描述)
- 图网络时代:使用 GNN(Graph Neural Networks)构建用户关系图,将担保关系、转账网络、社交关系纳入模型
信用风险建模的经典损失函数包括二分类交叉熵和 Focal Loss(处理类别不平衡):
LCE=−N1i=1∑N[yilog(pi)+(1−yi)log(1−pi)]
LFocal=−N1i=1∑Nα(1−pi)γyilog(pi)
其中 γ 控制难易样本权重,α 平衡正负样本比例。
前沿进展:
- Pre-trained Financial Models:像 BloombergGPT、FinBERT 等预训练金融语言模型可直接从财报文本中提取信用信号
- Causal Credit Models:使用因果推断(Causal Inference)代替纯相关分析,识别真正的违约驱动因素
- 生存分析:使用 Cox 比例风险模型或 DeepSurv 建模违约时间,而不仅仅是违约概率
市场风险指因市场价格(利率、汇率、股票价格、大宗商品价格)不利变动导致损失的风险。AI 在该领域的应用主要包括:
- 波动率预测:使用 GARCH 类模型和 LSTM 组合模型预测金融资产的波动率
- VaR 与 CVaR 计算:传统方法使用历史模拟或参数法,AI 方法使用蒙特卡洛模拟加速或分位数回归神经网络
- 压力测试:使用生成模型(GAN/Variational Autoencoder)生成极端市场情景,补充历史压力测试的不足
- 极端风险预警:使用极值理论(Extreme Value Theory, EVT)结合深度特征提取,预测尾部风险事件
波动率预测的典型模型可表示为:
σt2=ω+αεt−12+βσt−12+fLSTM(Xt)
其中 ω,α,β 是 GARCH 参数,fLSTM 是 LSTM 网络提取的额外特征。
操作风险(Operational Risk)指因内部流程、人员、系统或外部事件导致的损失风险。AI 应用包括:
- 异常交易检测:使用 Isolation Forest、Autoencoder 重构误差检测异常交易行为
- 流程自动化:RPA + NLP 自动化合规检查、对账流程
- 模型风险管理:AI 模型本身成为风险源(模型失效、偏差、过拟合),需要进行持续的模型验证
量化交易(Quantitative Trading)是 AI 在金融领域最具"技术感"的应用场景,也是头部对冲基金的核心竞争力所在。
| 策略类型 |
持仓周期 |
信号来源 |
代表机构 |
| 高频交易(HFT) |
微秒~秒 |
订单簿微观结构 |
Virtu Financial, Citadel Securities |
| 统计套利 |
秒~天 |
价差回归 |
Renaissance Technologies, Two Sigma |
| 趋势跟踪 |
天~月 |
动量因子 |
AQR Capital Management, Man AHL |
| 事件驱动 |
事件前后 |
公司公告、新闻 |
Bridgewater Associates |
| 宏观策略 |
周~月 |
经济数据 |
Renaissance (Medallion Fund) |
Alpha 因子是量化交易的核心——即能够预测资产未来收益的可交易信号。AI 在因子挖掘中的应用分为三个层次:
1. 传统因子(结构化因子工程)
- 动量因子:过去 n 天的收益、标准化动量、残差动量
- 反转因子:短期反转(1-5天)、中期反转(20-60天)
- 波动率因子:已实现波动率、已实现偏度、已实现峰度
- 流动性因子:Amihud 非流动性指标、换手率
- 质量因子:ROE、毛利率、资产负债率
- 价值因子:PE、PB、PS、企业价值/EBITDA
2. 机器学习因子(自动特征学习)
- 使用 AutoEncoder 对原始数据降维后提取非线性因子
- 使用 Attention 机制对多资产时序信息加权聚合
- 使用 GAN 生成合成因子并测试其预测能力
3. 另类数据因子
- NLP 因子:从财报电话会议录音中提取管理层语气
- 图像因子:从卫星图像中估计零售店客流量、油田产量
- 时序因子:从信用卡消费数据推断公司收入
限价订单簿(Limit Order Book, LOB)是高频交易的核心数据,记录所有未成交的买卖订单。LOB 数据具有高度不规则的时空结构,AI 模型常用于预测未来价格方向或最优买卖价差。
LOB 的时序建模可以表示为:
P(yt+τ∣LOBt)=fθ(LOBt−T:t)
其中 LOBt−T:t 是过去 T 个时间步的订单簿状态(包含价格层级、挂单量、成交量等信息),yt+τ 是未来 τ 时刻的价格方向(上涨/下跌),fθ 通常使用 CNN、LSTM 或 Transformer 架构。
强化学习(Reinforcement Learning, RL)为交易策略优化提供了端到端的框架。交易被建模为马尔可夫决策过程(MDP):
- 状态 St:当前持仓、市场特征、因子值
- 动作 At:买卖数量、订单类型
- 奖励 Rt:PnL(利润与亏损)、夏普比率、最大回撤惩罚
- 策略 πθ(a∣s):深度神经网络参数化的交易策略
经典的 PPO(Proximal Policy Optimization)算法在交易中表现稳定:
LCLIP(θ)=Et[min(rt(θ)A^t,clip(rt(θ),1−ϵ,1+ϵ)A^t)]
其中 rt(θ)=πθold(at∣st)πθ(at∣st) 是新旧策略的比率,A^t 是优势函数估计,ϵ 是裁剪阈值。
实践挑战:
- 样本效率低:真实交易数据有限,模拟环境与真实市场存在差距(Sim-to-Real Gap)
- 信用约束:RL 策略可能产生极端风险行为,需要风险约束正则化
- 市场冲击:大额订单会影响市场价格,不能将价格视为独立于动作的
金融欺诈给全球金融系统造成的年损失超过 1 万亿美元。AI 反欺诈系统需要解决的问题维度包括:
- 交易欺诈:信用卡盗刷、账户盗用(Account Takeover)、合成身份欺诈
- 信贷欺诈:虚假申请、资料造假、团伙骗贷
- 支付欺诈:洗钱、非法资金转移、跨境多层交易
- 保险欺诈:虚假理赔、事故伪造、医疗骗保
- 网络欺诈:钓鱼网站、短信诈骗、社交工程
实时决策引擎
在线反欺诈系统需要在毫秒级完成特征计算和模型推理,典型的系统架构包括:
- 特征平台:实时特征计算(Flink)、离线特征存储(Hive/Redis)
- 决策引擎:规则引擎(Drools)+ 机器学习模型(XGBoost/DNN)串联
- 图计算:实时图更新(Neo4j/TigerGraph),用于团伙欺诈识别
- 设备指纹:收集设备标识、IP、GPS、行为特征用于身份校验
图神经网络反欺诈(GNN Anti-Fraud)
欺诈行为往往呈现出群体性特征。GNN 通过建模用户-设备-交易的多关系图实现群体检测。消息传递机制可以表示为:
hv(k+1)=σ(W(k)⋅AGGREGATE({hv(k)}∪{hu(k):u∈N(v)}))
其中 hv(k) 是节点 v 在第 k 层的表示,N(v) 是邻居节点集合。常用的聚合函数包括 Mean、Sum、Max 和 Attention(GAT)。
序列模型反欺诈
交易行为天然是时序的,使用 LSTM 或 Transformer 对用户交易序列建模可以捕获行为异常:
P(fraud∣x1,x2,...,xT)=fLSTM(x1,x2,...,xT)
其中 xt 是第 t 笔交易的特征(金额、商户类别、地理位置、时间等)。
对抗训练
欺诈者会主动调整行为规避检测,形成一个持续的对抗博弈。常见对抗方法包括:
- 对抗样本训练:在训练数据中加入对抗性噪声,增强模型鲁棒性
- 生成对抗网络(GAN):使用 GAN 生成可能的欺诈模式,训练判别器更好地识别未知欺诈
- 在线学习:模型在线更新,适应欺诈模式的快速变化
除传统分类指标外,反欺诈系统有特殊的业务指标:
- 捕获率(Capture Rate):正确识别的欺诈交易占总欺诈的比例
- 误杀率(False Positive Rate):被误判为欺诈的正常交易比例——每提升1%可能影响数千用户
- 响应时间:从交易发生到决策返回的延迟——银行要求通常 < 100ms
- 审查效率:人工审查团队需要审查的可疑交易量 / 实际欺诈交易量,理想值是越低越好
智能投顾(Robo-Advisor)利用 AI 技术提供自动化的投资顾问服务,包括投资组合构建、再平衡、税务优化等。
经典的马科维茨均值-方差模型(Modern Portfolio Theory, MPT)是组合优化的理论基础:
wmin21wTΣw−γμTw
s.t.i=1∑nwi=1,wi≥0
其中 w 是资产权重向量,Σ 是协方差矩阵,μ 是预期收益向量,γ 是风险厌恶系数。
AI 对 MPT 的改进:
- 协方差矩阵估计:使用收缩估计(Shrinkage)、随机矩阵理论(RMT)或深度因子模型替代样本协方差矩阵,解决高维噪声问题
- 预期收益预测:使用机器学习模型预测预期收益,代替简单的历史均值
- 尾部风险优化:使用 CVaR(Conditional Value at Risk)代替方差作为风险度量
- 黑-利特曼模型(Black-Litterman):结合先验均衡收益和市场观点,生成稳态组合权重
- 深度组合优化:使用端到端深度网络直接优化投资组合的夏普比率
使用协同过滤、深度学习推荐系统等技术,根据客户的风险偏好、投资期限、收入水平等进行个性化产品推荐:
- 聚类分析:使用 K-Means 或高斯混合模型对客户进行细分
- 动态风险偏好:使用上下文 Bandit 算法在线学习客户的风险偏好变化
- NLP 需求理解:通过对话式 AI 理解客户的财务目标和风险承受能力
信用评估(Credit Scoring)是消费金融、小微企业贷款等业务的核心环节。AI 技术将信用评估从传统的 5C 原则(Character、Capacity、Capital、Collateral、Conditions)扩展到全维度智能评估。
传统评分卡:
- 使用 WOE(Weight of Evidence)编码+逻辑回归
- 优点是监管认可、可解释性强
- 缺点是特征工程依赖人工、交互项有限
XGBoost 评分模型:
- 自动特征选择和非线性建模
- 通过 SHAP 值提供全局和局部解释
- 对缺失值、异常值鲁棒
深度信用模型:
- 使用 TabNet、NODE 等深度表格模型进一步提升 AUC
- 结合序列行为数据(还款历史、消费模式)
- 结合文本数据(申请资料 OCR、社交网络文本)
对于缺乏传统信用记录的"薄档案"人群(年轻用户、新移民、农村居民),替代数据(Alternative Data)评分成为重要的信用评估手段:
- 电信数据:话费缴纳记录、通话时长趋势
- 水电燃气:公用事业缴费准时率
- 数字足迹:电商交易记录、支付平台行为
- 教育/就业:学历验证、就业稳定性
- 社交网络:社交图结构特征(在隐私合规前提下)
信用评估受到严格监管,模型可解释性是核心要求之一:
全局解释方法:
- SHAP 特征重要性:衡量每个特征对模型输出的平均贡献
- Partial Dependence Plot(PDP):展示单一特征对预测值的边际效应
- Accumulated Local Effects(ALE):解决 PDP 在高相关特征下的偏差问题
局部解释方法:
- LIME:在预测点附近拟合线性替代模型
- SHAP 局部解释:对每个预测给出特征贡献分解
- 决策树替代模型:用可解释的浅层决策树近似复杂模型的决策边界
自然语言处理在金融领域有广泛而深入的应用。
从新闻、社交媒体、财报中提取金融情感信号,用于交易决策和风险管理:
- 词典方法:Loughran-McDonald 金融情感词典(相比通用情感词典,金融文本有特殊的词汇情感倾向)
- FinBERT:在金融文本上微调的 BERT 模型,在金融情感分析任务上显著优于通用模型
- Earnings Call 分析:从财报电话会议文本中分析管理层语气和回避问题的模式——这是重要的 Alpha 信号
从非结构化金融文本中提取结构化信息:
- 实体识别(NER):识别公司名称、人名、金额、日期、股票代码
- 关系抽取:从新闻中提取"公司A 收购 公司B"、"CEO 辞职"等结构化事件
- 数字抽取:从财报叙述中提取关键财务数字及其上下文
金融机构每天处理海量文档(贷款申请、保险合同、监管报告),AI 驱动的智能文档处理(IDP)可大幅提升效率:
- OCR + LayoutLM:识别扫描件中的文本和表格结构
- 文档分类:自动将上传的文档分类为工资单、银行流水、身份证等
- 关键字段提取:从文档中提取金额、日期、签字等信息
- 文档对比:检测不同版本文档之间的差异
监管科技使用 AI 技术帮助金融机构更高效地满足监管合规要求。
- 交易监控:使用图神经网络检测可疑的资金流转模式
- 客户尽职调查(CDD):使用 NLP 自动提取客户背景信息
- 制裁名单匹配:使用模糊匹配和实体嵌入提高匹配召回率
- 可疑行为报告(SAR):使用 AI 辅助生成格式化的可疑交易报告
- 员工行为监控:使用 NLP 分析内部聊天记录、邮件,检测内幕交易风险
- 市场操纵检测:使用无监督学习检测"拉高出货"、"洗售交易"等操纵行为
- 合规文档智能检:使用检索增强生成(RAG)技术,自动比对业务操作与最新监管要求
金融监管机构对 AI 模型提出越来越严格的要求:
- EU AI Act:将信用评分模型归类为高风险 AI 系统,要求建立风险管理、文档记录、人类监督机制
- GDPR:用户有权获得"自动化决策"的解释,这对深度信用模型提出了可解释性挑战
- 中国监管:央行发布《金融科技发展规划》,对金融机构的 AI 应用提出数据治理、模型验证、算法审计等要求
| 挑战 |
描述 |
解决方案 |
| 数据孤岛 |
银行内部不同部门的数据不互通 |
联邦学习(Federated Learning)、数据中台 |
| 数据隐私 |
金融数据涉及用户隐私,不能随意共享 |
差分隐私(Differential Privacy)、安全多方计算(MPC) |
| 标签稀疏 |
违约样本占比极低(<1%) |
过采样(SMOTE)、Focal Loss、Anomaly Detection |
| 数据漂移 |
经济环境变化导致数据分布变化 |
在线学习、模型监控告警、定期重训练 |
| 时序泄露 |
用未来信息预测过去 |
严格的时间序列交叉验证、时间切分 |
| 挑战 |
描述 |
解决方案 |
| 过拟合 |
金融数据信噪比低,易出现伪发现 |
正则化、交叉验证、回测过拟合概率(PBO) |
| 可解释性 |
监管部门要求理解模型决策理由 |
SHAP、LIME、XAI 技术栈 |
| 公平性 |
模型可能存在种族、性别、地域歧视 |
公平性审计、对抗去偏 |
| 因果性 |
相关不等于因果,经济政策变化会改变关系 |
因果推断、Do-Calculus、工具变量 |
| 鲁棒性 |
对抗样本可能操纵模型决策 |
对抗训练、输入验证 |
- 延迟要求:在线反欺诈要求毫秒级响应,需要使用模型量化、知识蒸馏等加速技术
- 灾备与冗余:金融系统通常要求 99.99%+ 的可用性,需要多活部署和熔断机制
- 回滚能力:新模型上线后如出现性能衰减,需能快速切换到旧模型
- A/B 测试:新策略上线前需经过充分的 A/B 测试,通常需要数月的回测+影子验证期
2023 年以来,大语言模型(LLM)在金融领域的应用成为最受关注的方向:
- 金融 Copilot:面向银行客户经理、保险代理人、基金经理的对话式辅助工具
- 智能研报生成:自动生成公司研究报告、行业分析报告
- 代码辅助:辅助量化研究员编写回测代码、因子计算代码
- 知识图谱问答:基于企业知识图谱的财务问答系统
- 合同审查:使用 LLM 辅助审查贷款合同、保险条款中的风险点
金融数据敏感,跨机构数据合作面临严格的隐私合规要求。联邦学习允许在不共享原始数据的情况下训练联合模型:
- 纵向联邦学习:不同机构持有同一用户的不同维度特征(银行有交易数据,电商有消费数据)
- 横向联邦学习:不同机构持有不同用户的相同特征维度(多家银行合作训练反欺诈模型)
- 安全聚合:使用同态加密(HE)或安全多方计算(SMPC)保护梯度传输过程
虽然量子计算仍处于早期阶段,但其在金融领域的潜在应用已引起广泛关注:
- 蒙特卡洛加速:量子振幅估计可实现二次加速,对风险定价具有重要意义
- 组合优化:量子退火可用于解决大规模投资组合优化问题
- 密码学影响:量子计算对现有金融密码体系的威胁(Shor 算法)推动了后量子密码标准的研究
随着 ESG(环境、社会和治理)投资的兴起,AI 技术被用于量化评估企业的 ESG 表现:
- 碳排放估计:从卫星图像估计企业碳排量
- 供应链 ESG:使用 NLP 分析供应商的 ESG 报告
- 漂绿检测:检测企业的"漂绿"行为——使用 NLP 识别宣传与实际ESG表现之间的差距
摩根大通使用深度强化学习(DRL)开发了 LOXM 交易执行算法,目标是"以最小市场冲击完成大额订单"。该系统在 2020 年开始部署后,将大额订单的市场冲击成本降低了约 12%。其核心是使用 PPO 算法训练策略网络,将历史 T+1 数据作为状态空间的一部分进行离线训练。
蚂蚁集团的 AlphaRisk 风控系统使用图神经网络(GNN)+ 流计算(Flink)实现毫秒级反欺诈决策。该系统在全球最大的支付平台上实时运行,日均处理数亿笔交易。核心技术创新包括:
- 实时图更新:交易关系图每秒更新数万次
- 动态阈值:使用贝叶斯在线变化点检测(BOCPD)自适应调整风控阈值
- 模型级联:先使用轻量级规则过滤,再使用 GNN 模型深挖团伙欺诈
Renaissance Technologies 的 Medallion Fund 是历史上最成功的对冲基金,年均回报率约 66%(1988-2018,扣除管理费前)。其核心方法论包括:
- 使用隐马尔可夫模型(HMM)和深度学习发现短暂的市场非有效性
- 严格的统计显著性检验(使用 Random Matrix Theory 控制多重比较谬误)
- 极高的换手率(日均换手率超过 100%),通过大量小机会累积收益
- 团队以数学、物理学、计算机科学背景为主,而非金融背景
ZestFinance(现为 Zest AI)使用机器学习替代信用评分模型,通过分析数十万个特征(包括用户的数字行为、支付习惯等),为缺乏传统信用记录的用户提供信用评分。其模型将 AUC 从传统评分卡的 0.70 提升至 0.88,同时将坏账率降低 20% 以上。
| 场景 |
推荐框架 |
部署方案 |
关键指标 |
| 信用评分 |
XGBoost/LightGBM + SHAP |
批处理/在线推理 |
AUC、KS、坏账率 |
| 反欺诈 |
GNN(PyG/DGL)+ 流计算 |
实时 API + 规则串联 |
捕获率、误杀率、响应时间 |
| 量化交易 |
PyTorch + RLlib |
本地/云 GPU + FPGA |
夏普比率、最大回撤、信息比 |
| 智能投顾 |
PyTorch + CVXPY(优化) |
定时任务 + 在线 API |
年化收益、波动率、CAGR |
| NLP 金融 |
HuggingFace Transformers |
GPU 推理集群 |
F1(实体识别)、准确率(分类) |
| 时间序列 |
Prophet + PyTorch Forecasting |
批处理 + 模型监控 |
MAE、MAPE、QLIKE |
| 图分析 |
Neo4j + GDS |
图数据库 + 批处理 |
精度、召回、模块度 |
- 书籍:《Advances in Financial Machine Learning》by Marcos López de Prado、《Machine Learning for Asset Managers》by Marcos López de Prado、《Hands-On Machine Learning for Algorithmic Trading》by Stefan Jansen
- 论文:"Deep Learning for Finance: A Survey" (2020)、"Financial Sentiment Analysis: An Investigation into Common Mistakes and Silver Bullets" (2020)
- 开源项目:Qlib(微软量化平台)、FinRL(金融强化学习)、Alphalens(因子分析)、pyfolio(投资组合分析)
- 数据源:Yahoo Finance、Quandl、Kaggle 金融数据集、Wind/Choice(中国市场)
- Kaggle 竞赛:Home Credit Default Risk、JPMorgan Chase Fraud Detection、Optiver Realized Volatility Prediction
本文为 AI 知识体系 的一部分,内容持续更新中。