下游应用
把模型能力转化为行业范式重构。从动机到工程实践,再到跨行业落地。
A. RAG(检索增强生成)¶
- 为什么单纯靠大模型不够:幻觉问题与知识更新难题。
- 向量数据库简介:嵌入与语义空间;ANN 检索算法(FAISS、HNSW、Milvus)。
- 检索 → 生成流水线:Retriever、Reader、Reranker;延迟与准确性的权衡。
- RAG 工程实践:FAQ bot、知识库问答、财报分析,端到端示例。
B. Agent(自主代理)¶
- 什么是 Agent:会调用工具的 LLM,区别于单纯对话。
- 规划与执行:任务分解、反思与“下一步”决策。
- Agent 的记忆:短期记忆(上下文)、长期记忆(外部存储/知识库)。
- 安全沙盒:如何防止 Agent 乱调用工具与安全隔离。
C. Prompt 工程¶
- Zero-shot vs Few-shot:示例如何影响模型输出。
- Chain-of-Thought:显性推理路径与解题步骤。
- Prompt 模板与上下文管理:构造稳定输入、变量插值、窗口裁剪。
D. 行业重构案例¶
- 医疗:诊断摘要、科研文献辅助,合规与责任界限。
- 金融:财报解析、自动化投研报告,实时数据对齐。
- 教育:个性化辅导、自动批改,公平性与可解释性。
- 软件开发:从 Copilot 到自主调试 agent,CI/CD 集成。
E. 扩展方向¶
- 多模态应用:图文/语音/视频 Agent 的融合;多模态 RAG。
- 大模型与传统系统融合:搜索引擎、数据库、ERP 与现有 IT 基建结合。
F. 评测与安全¶
- 场景化评测框架:任务-数据-指标-对齐的闭环;离线与在线评估融合。
- 幻觉治理与安全护栏:检索校对、反事实测试、裁判模型、人审混合。