TruthfulQA

¶ TruthfulQA：衡量语言模型真实性的基准测试

¶ 一、概述

¶ 二、问题设计与数据构成

¶ 三、评估方法与指标

¶ 四、核心发现：逆缩放现象

¶ 五、Prompt 的影响

¶ 六、当前最新进展与 Leaderboard

¶ 七、评价与局限

¶ 八、如何在自己的项目中使用 TruthfulQA

¶ 九、TruthfulQA 与相关基准对比

¶ 十、总结与展望