AI 知识体系

主题	路径	说明
[[LLM 大语言模型]]	tech/ai/llm	Transformer、Token、Prompt、主流模型对比
[[MCP 模型上下文协议]]	tech/ai/mcp	为什么需要 MCP、架构设计、与 Function Calling 的区别
[[Skill 技能系统]]	tech/ai/skill	Skill 的定义、组成、编写规范、实际案例
[[Vibe Coding 工具概念对比]]	tech/ai/vibe-coding-concepts	Skill/Command/Rule/Workflow 在 Cursor/Claude/Copilot 等工具中的异同

框架	特点	适用场景
LangChain	生态最丰富，组件化设计	快速原型、复杂流程
LlamaIndex	专注 RAG 和数据连接	知识库问答、文档处理
AutoGen	多 Agent 协作	复杂任务分解、团队模拟
CrewAI	角色扮演驱动	业务流程自动化
OpenClaw	运行时 + Skill 体系	个人/企业 Agent 部署

维度	GPT-5	Claude 4	Gemini 2.5	Kimi k2.6	GLM-5	DeepSeek-V4
提供商	OpenAI	Anthropic	Google	Moonshot	Zhipu	DeepSeek
上下文长度	128K	200K+	1M	200K	128K	128K
多模态	文本/图像/音频	文本/图像	文本/图像/音频/视频	文本/图像	文本/图像	文本
代码能力	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
中文能力	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
推理能力	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
安全性	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
API 成本	高	高	中	低	低	极低
开源	❌	❌	部分	❌	部分	✅

方式	优点	缺点	适用场景
云端 API	即开即用、免运维、最新模型	数据外泄风险、持续成本	大多数应用
私有化部署	数据安全、可控性强	硬件投入大、运维复杂	金融、医疗、政务
边缘部署	低延迟、离线可用	模型规模受限	移动端、IoT
混合部署	平衡安全与成本	架构复杂	敏感+通用任务混合

维度	指标	评估方法
准确性	Exact Match、F1、BLEU、ROUGE	标准测试集
事实性	幻觉率、知识召回率	领域知识库测试
安全性	有害输出率、越狱成功率	Red Teaming
性能	TTFT（首 token 时间）、TPOT（每 token 时间）	压测
成本	每千 token 成本、端到端成本	成本追踪

时间线	趋势	影响
2025	MCP 生态成熟	工具调用标准化，Agent 开发门槛大幅降低
2025-2026	多模态普及	图像/音频/视频成为标准输入，交互方式革新
2026-2027	推理成本持续下降	更多应用经济可行，AI 渗透加速
2027+	世界模型探索	从语言模型到物理世界理解的跨越

术语	英文全称	含义
LLM	Large Language Model	大语言模型，基于 Transformer 的通用语言模型
MCP	Model Context Protocol	模型上下文协议，标准化模型与外部工具交互
RAG	Retrieval-Augmented Generation	检索增强生成，结合外部知识库减少幻觉
Agent	Agent	能自主规划、调用工具、执行多步骤任务的智能体
Prompt	Prompt	给模型的输入指令，包含任务描述和上下文
Token	Token	模型处理文本的最小单位，通常 1 汉字 ≈ 1–2 tokens
Embedding	Embedding	将文本/数据映射到高维向量空间的密集表示
Fine-tuning	Fine-tuning	在预训练模型基础上用特定领域数据继续训练
RLHF	Reinforcement Learning from Human Feedback	基于人类反馈的强化学习，用于模型对齐
DPO	Direct Preference Optimization	直接偏好优化，简化 RLHF 的替代方案
KV Cache	Key-Value Cache	存储注意力计算中的键值对，加速自回归生成
Quantization	Quantization	量化，将模型权重从高精度（FP32）转为低精度（INT8/INT4）
Hallucination	Hallucination	幻觉，模型生成看似合理但实际错误的内容
Temperature	Temperature	采样温度，控制输出随机性（0=确定性，1=创造性）
Top-p / Top-k	Nucleus Sampling / Top-k Sampling	限制采样范围的解码策略
System Prompt	System Prompt	系统级指令，设定模型的全局行为和角色
Few-shot	Few-shot Learning	通过少量示例引导模型学习新任务
CoT	Chain-of-Thought	思维链，引导模型逐步推理的提示技术
Function Calling	Function Calling	模型调用外部函数的机制
A2A	Agent-to-Agent Protocol	智能体间通信协议

模型	提供商	上下文	特点	适用场景
GPT-5	OpenAI	128K	通用能力最强，多模态	通用任务、创意写作
Claude 4	Anthropic	200K+	长上下文、安全性高	代码审查、长文档分析
Gemini 2.5	Google	1M	原生多模态，Google 生态	视频分析、搜索增强
Kimi k2.6	Moonshot	200K	中文优化，长文本处理	中文内容、文献阅读
GLM-5	Zhipu	128K	中文理解强，开源生态	中文应用、私有化部署
DeepSeek-V4	DeepSeek	128K	推理能力强，性价比高	代码生成、数学推理

沪ICP备15048960号-1

¶ AI 知识体系

¶ 目录

¶ 一、AI 技术栈全景概览

¶ 1.1 四层架构模型

¶ 1.2 各层核心职责详解

¶ 二、AI 核心概念深度解析

¶ 2.1 大语言模型（LLM）原理

¶ Transformer 架构

¶ 模型训练三阶段

¶ Token 与分词

¶ 2.2 Prompt 工程

¶ 核心原则

¶ 高级技巧

¶ 2.3 RAG（检索增强生成）

¶ RAG 架构

¶ 核心组件

¶ 2.4 Agent 架构

¶ 核心组件

¶ 主流 Agent 框架

¶ ReAct vs Plan-and-Execute

¶ 三、模型对比与选型指南

¶ 3.1 主流模型深度对比

¶ 3.2 选型决策树

¶ 3.3 部署方式对比

¶ 四、AI 工程化实践

¶ 4.1 模型服务化

¶ 4.2 评估与监控

¶ 4.3 安全与合规

¶ 五、AI 发展趋势与前沿

¶ 5.1 当前热点方向

¶ 5.2 技术演进预判

¶ 六、快速参考

¶ 6.1 常见术语表

¶ 6.2 模型对比速查表

¶ 6.3 学习路径建议

¶ 七、相关资源