BERT | Hugo Knowledge Base

¶ BERT：深度双向 Transformer 的语言理解预训练

¶ 概述

¶ 研究背景与动机

¶ 模型架构

¶ 输入表示

¶ 预训练方法

¶ 微调方法

¶ 实验与结果

¶ 消融实验与分析

¶ 模型变体与后续发展

¶ 实践指南

¶ 局限性与批评

¶ 总结与展望