从后端到 RAG 再到 Agent：一份可执行的大模型应用开发学习路线

张

张建站

2026/4/25 5:14:28

10分钟阅读

从后端到 RAG 再到 Agent一份可执行的大模型应用开发学习路线最近看到一份别人整理的大模型应用开发学习路线主线很清楚先补后端基础再学 RAG 和 Agent微调与推理优化作为加分项。我把这份路线重新整理了一遍补上了更适合自学执行的内容包括每个阶段应该学什么、做到什么、产出什么以及一个能真正落地的 12 周时间表。这篇文章的目标不是帮你“收藏更多资料”而是帮你把路线变成行动。这条路线适合谁这份路线更适合下面这类同学已经有一点编程基础想转向大模型应用开发想做的是 LLM 应用、Agent、RAG 相关岗位而不是纯算法研究希望先做出项目再逐步补模型原理、微调和推理优化如果你的目标是大模型应用开发岗那么真正的主线通常不是“先啃微调和 CUDA”而是后端基础 - 模型 API 调用 - LangChain / LangGraph - RAG - Agent - 评估与协议微调和推理优化可以学但更适合作为加分项而不是最先投入大量时间的主线。为什么我建议按这个顺序学大模型应用开发的核心不是“知道多少模型名词”而是你能不能把模型能力接进一个真实系统里。一个真实的大模型应用通常离不开这些东西一个能稳定提供服务的后端接口一套清晰的 Prompt、工具调用和结构化输出逻辑一个能解决知识问答问题的 RAG 链路一个能处理复杂任务的 Agent 或工作流一套最基本的评估与复盘方法所以学习顺序应该围绕“做系统”来排而不是围绕“资料热度”来排。一张图看完整主线阶段建议时长核心目标最低产出准备阶段2 到 3 天配好环境、模型 API、Git 仓库一个最小模型调用脚本Python 后端2 周补并发、HTTP、FastAPI、流式接口一个可运行的 API 服务LLM 应用基础1 周理解 Prompt、结构化输出、Tool Calling一个命令行助手LangChain / LangGraph2 周建立应用抽象与工作流思维一个工具调用工作流RAG3 周做出可用的知识库问答应用一个带引用和评估的 RAG 项目Agent / 协议2 周学会设计 Agent、理解 MCP/A2A一个研究或报告助手加分项1 周微调或推理优化二选一一份实践记录面试整理1 周项目包装、问答准备、查漏补缺简历项目问答清单第一阶段先把后端基础补起来很多人一提大模型应用开发就先去看 LangChain、LangGraph、MCP、Multi-Agent。其实如果后端基础不稳后面很快就会卡住。这一阶段最重要的不是“语法学全”而是搞懂下面几件事线程、多进程、协程分别适合什么场景HTTP 请求、状态码、超时、重试、流式返回是什么FastAPI 怎么写路由、参数校验、异步接口、文件上传和基础测试SSE 和 WebSocket 分别适合什么场景这一阶段建议做到什么程度能独立写一个 FastAPI 服务能提供普通接口和流式接口能处理日志、异常、超时和参数校验能向别人解释async/await为什么在大模型接口里很常见最低项目建议做一个最小聊天服务至少包含这几个接口/health/chat/chat/stream/upload你不需要把它做得很复杂但一定要让它“像一个能用的服务”。可参考资料FastAPI 官方教程Python 并发编程实战视频第二阶段先理解模型接口本身再上框架在学框架之前我非常建议先手写几次模型 API 调用。原因很简单如果你一开始就把所有逻辑交给框架后面遇到问题时你很难判断到底是模型问题、Prompt 问题还是框架封装的问题。这一阶段建议重点理解Prompt 的基本设计方式system prompt、few-shot、结构化输出Tool Calling 和函数调用Embedding、向量化、相似度这些基础概念token 成本、速率限制、上下文窗口最低项目建议做一个纯 Python 命令行助手支持普通对话JSON 结构化输出一次简单工具调用做到这一步你对“模型能力如何被程序使用”就会有很直观的理解。第三阶段LangChain 和 LangGraph 怎么学这一块是很多人真正开始接触“大模型应用开发框架”的地方。我的建议很明确LangChain 用来建立组件抽象LangGraph 用来建立工作流和状态编排能力很多人会问这两个是不是二选一我的理解不是。更准确地说LangChain 更像是“积木和接口层抽象”LangGraph 更像是“把复杂流程真正组织起来的骨架”。LangChain 重点看什么PromptTemplateMessagesModel 封装ToolsRetrieversOutput Parsers基础 AgentLangGraph 重点看什么StateGraph节点与边条件路由持久化记忆管理human-in-the-loop可恢复执行最低项目建议做一个带工具调用的工作流助手至少接两个工具至少有一个条件分支能记录每一步的执行状态可参考资料LangChain 官方文档LangGraph 官方文档LangChain 入门视频LangGraph 入门视频第四阶段RAG 是大模型应用开发最值得下功夫的主线如果你目标是做大模型应用开发那么 RAG 基本是绕不过去的重点。因为很多真实业务场景的核心问题并不是“模型会不会说”而是它能不能结合我的私有数据回答问题它能不能给出引用来源它的回答到底靠不靠谱一个完整的 RAG 系统至少包含这些环节文档清洗切块Embedding向量检索重排生成引用来源评估RAG 学习时最容易犯的错很多人一上来就追高级框架结果切块没搞清楚召回逻辑没搞清楚最后只能做一个“看起来像问答其实效果不可控”的 demo。我更建议这样学先做一个最朴素的 RAG 流程再去优化切块、metadata、query rewrite、rerank最后再横向看 RAGFlow、GraphRAG、Agentic RAG 这类高级方向这一阶段一定要学会的三件事切块为什么会直接影响召回质量检索优化到底在优化什么为什么 RAG 没有评估就等于没有真正完成最低项目建议做一个领域知识库助手要求支持上传或读取一批文档回答时展示引用来源至少记录几类失败案例写一份最小评估报告可参考资料All-in-RAGLlamaIndex 官方文档RAG From Scratch 代码仓库RAGAS 官方文档第五阶段Agent 的重点不是“多”而是“边界清楚”现在很多人一学 Agent 就冲着 Multi-Agent 去了但真实场景里很多问题其实根本不需要多个 Agent。我更建议先搞清楚这几个问题什么场景适合工作流什么场景适合 Agent什么场景需要模型自主规划什么场景应该走确定性流程什么时候该加审批节点什么时候需要长期记忆这一阶段建议重点看什么supervisor 和 workflow上下文工程短期记忆和长期记忆工具调用与任务拆解人机协同和审批流MCP 和 A2A 怎么理解这两个词现在很热但不要混着记。MCP更偏向于“让 Agent 以统一协议接工具和资源”A2A更偏向于“让不同 Agent 之间协作”前者解决的是 agent-to-tool 的问题后者更偏 agent-to-agent。最低项目建议做一个研究助手或报告生成助手流程里至少包含检索资料调用工具人工确认汇总输出可参考资料Hello-AgentsDify 官方文档AutoGen 官方文档MCP 官方介绍A2A 官方文档第六阶段微调和推理优化是加分项不是主线如果你面向的是应用开发岗那么微调和推理优化通常不该抢走主线太多时间。微调方向可以学什么SFTLoRAQLoRA数据构造评估与过拟合风险做法上完全可以先用一个成熟工具快速跑通流程例如LlamaFactory 官方仓库推理优化方向可以了解什么vLLM 官方文档KV cache吞吐和延迟的取舍在线推理与离线推理的区别SGLang 这类推理编排方案我的建议如果你还没有完成一个像样的 RAG 项目和一个像样的 Agent 项目就先不要把大量时间砸在微调和推理优化上。第七阶段面试准备一定要围绕项目来整理很多人学完一堆东西最后面试还是讲不出来问题通常不在“没学过”而在“没有形成自己的项目表达”。我建议至少准备两个核心项目一个 RAG 项目一个 Agent 项目每个项目都要能讲清楚下面几个点场景是什么为什么这么选型做过哪些优化遇到过什么问题怎么评估效果如果继续迭代下一步会做什么面试高频知识点并发模型线程、进程、协程FastAPI、SSE、WebSocketPrompt、结构化输出、Tool CallingRAG 的切块、检索、重排、评估workflow 和 agent 的区别MCP、A2A 各解决什么问题memory、上下文工程、人机协同微调和 RAG 分别适合什么场景一个可直接执行的 12 周计划下面这版默认按每周 10 到 12 小时设计适合边学边做。如果你能全职投入可以压缩到 6 到 8 周如果你是业余学习可以拉长到 16 周。周次主题主要任务验收标准第 1 周环境与并发基础搭环境、建仓库、连通模型 API、补协程基础能跑通最小模型调用脚本第 2 周FastAPI 实战写同步接口、异步接口、文件上传、流式输出一个能运行的 FastAPI demo第 3 周LLM API 基础做 Prompt、结构化输出、Tool Calling一个命令行助手第 4 周LangChain 基础理解 prompt/model/tool/retriever 抽象一个 LangChain 小 demo第 5 周LangGraph 工作流做状态图、条件分支、记忆和审批一个可追踪的工作流第 6 周RAG 基础文档清洗、切块、向量化、检索一个可回答问题的知识库原型第 7 周RAG 优化metadata、rerank、query rewrite、失败案例RAG v2 版本第 8 周RAG 评估造样本、做 RAGAS 或人工评估一份最小评估报告第 9 周Agent 设计检索、工具调用、上下文工程、审批流一个完成真实任务的 Agent第 10 周协议与协作理解 MCP、A2A、多智能体边界能清楚讲出协议差异第 11 周加分项实践LoRA 微调或 vLLM 部署二选一一份实验记录第 12 周项目整理与面试写 README、项目说明、常见问答可演示项目和简历描述这条路线里最值得做的 3 个项目1. 流式问答 API用 FastAPI 做一个/chat/stream接口支持流式返回、日志、超时和异常处理。这个项目看起来简单但它会逼着你把“模型调用”真正接成“服务能力”。2. 领域知识库助手自己找一批文档完成切块、向量化、检索、引用和评估。这是最值得写进简历的大模型应用项目之一因为它几乎覆盖了应用开发岗最常见的能力要求。3. Agent 工作流助手选一个具体任务例如周报生成文档问答后自动总结资料检索后输出结构化报告用 LangGraph 把检索、工具调用、确认、输出整理串起来。学这条路线时最容易踩的坑最后总结几个我认为最常见的坑。1. 只看资料不做代码大模型领域资料很多但真正能转化成能力的永远是你做出来的东西。2. 一开始就沉迷“高级框架”如果连模型 API、Prompt、切块和检索都没搞明白越高级的框架越容易把你带进黑盒。3. 把多 Agent 当成高级感的来源很多场景一个工作流就够了。多 Agent 不是目的解决问题才是目的。4. 不做评估没有评估的 RAG往往只是一个“看起来能答”的 demo。5. 项目没有失败案例真正做过项目的人一定知道哪里会出问题。能讲清失败案例往往比只讲成功案例更有说服力。我自己会怎么用这份路线如果让我按这份路线重新学一遍我会坚持三条原则每个阶段都留下一个可运行 demo每周都写一页总结记录问题和坑每两周做一次复盘决定是继续深入还是先进入下一阶段这样做的结果是到最后你得到的不只是“看过很多资料”而是一套能拿出来展示、能在面试里讲清楚、也能继续扩展的项目资产。参考资料后端与基础FastAPI 官方教程Python 并发编程实战视频LangChain / LangGraphLangChain 官方文档LangGraph 官方文档LangChain 入门视频LangGraph 入门视频RAGAll-in-RAGLlamaIndex 官方文档RAG From ScratchRAGAS 官方文档Agent / 协议Hello-AgentsDify 官方文档AutoGen 官方文档MCP 官方介绍A2A 官方文档加分项LlamaFactory 官方仓库vLLM 官方文档结语如果只用一句话总结这条路线那就是先把大模型做成“能用的系统”再去追求“更深的模型能力”。对于大部分想进入大模型应用开发方向的人来说后端、RAG、Agent、评估这四块才是最值得投入时间的主线。先把这条主线走通你再回头补微调、推理优化、模型原理会顺畅很多。

Neuro N6边缘AI视觉开发板解析与应用

1. 神经视觉开发套件Neuro N6概述Ohm Lab推出的Neuro N6是一款面向边缘AI视觉应用的开发板，采用Adafruit Feather标准尺寸（53.0422.838.85mm），核心搭载STMicro最新STM32N6微控制器。这个火柴盒大小的开发平台集成了Arm Cortex-M55…...

2026/4/25 5:13:59 阅读更多 →