本文介绍了Agent的基础概念包括Agent的核心公式、Agent与大模型的对比、记忆系统设计等。文章还对比了主流的Agent开发框架并提供了选型建议。此外本文详细阐述了Agent的三种工作模式反应式、深思熟虑式和混合式并探讨了RAG与Tool的知识管理策略。最后文章分享了LangGraph实战要点、Agent与工作流的区别、实战技巧以及进阶学习路径。对于想要学习大模型开发的小白或程序员来说本文提供了一个全面而实用的入门指南。一、Agent 基础概念1 Agent 核心公式Agent 大模型 System Prompt 工具(Tools) 知识库(RAG) 记忆(Memory)智能体是大模型的工程化应用通过配备插件使其具备-大模型推理引擎 规划能力 将复杂任务分解为可执行步骤-System Prompt角色定义和行为指导-工具(Tools)调用外部 API、检索数据、执行操作-知识库(RAG)领域知识检索-记忆(Memory)短期记忆上下文 长期记忆文件存储2 Agent vs 大模型对比维度纯大模型Agent交互模式对话式问答长程任务执行能力范围文本生成自主规划 工具调用记忆机制上下文窗口文件系统持久化适用场景简单咨询复杂任务链关键特性Agent 具备自主规划能力可根据要求自行决策调用哪些工具通过多步执行Action完成复杂任务典型限制单次执行步数上限约 50 步3 记忆系统设计短期记忆当前对话的上下文如前 5 轮存储在会话状态中长期记忆通过文件读写read_file / write_file实现案例Kimi 会记住用户历史偏好背后是 write_file 机制二、Agent 开发框架对比1 主流框架框架特点适用场景LangChain / LangGraph高代码工作流可视化Mermaid生态完善企业级项目需要精细控制流程Qwen-Agent轻量级内置 GUI快速验证原型开发小型项目Coze / Dify低代码拖拉拽入门友好业务人员快速搭建不需深度定制OpenClaw / HermesSkill 两段式调用内置工具需要模块化工具管理2 框架选型建议高代码框架推荐LangChain / LangGraph面试必备企业主流Qwen-Agent代码量是 LangGraph 的一半快速交付低代码框架Coze / Dify理解 Agent 逻辑的学习工具生产环境受限2.3 LangGraph 核心机制状态图StateGraph# 创建状态图workflowStateGraph(AgentState)# 添加节点每个节点 一个任务workflow.add_node(感知,perception_node)workflow.add_node(建模,modeling_node)workflow.add_node(推理,reasoning_node)# 添加边定义执行顺序workflow.add_edge(感知,建模)workflow.add_edge(建模,推理)# 设置入口和出口workflow.set_entry_point(感知)workflow.add_edge(推理,END)条件边Conditional Edge# 根据运行时状态动态选择路径workflow.add_conditional_edges(评估节点,route_function,# 返回 reactive 或 deliberative{reactive:快速响应节点,deliberative:深思熟虑节点})三、Agent 三种工作模式3.1 反应式Reactive特点接收输入 → 单次工具调用 → 立即返回无复杂推理链路适合高频、简单、时效性强的场景典型场景查询股票实时价格NPC 对话响应工业控制传感器报警优缺点优势劣势速度快延迟低无法处理复杂任务易于验证和调试可能陷入循环如扫地机器人转圈案例私募基金问答助手# 工具注册示例tooldefsearch_rules_by_keywords(keywords:str):根据关键词检索私募基金规则# 从知识库匹配关键词returnmatched_rulestooldefsearch_rules_by_category(category:str):根据类别检索私募基金规则# 按类别筛选returncategory_rules# Agent 创建agentcreate_agent(llmChatOpenAI(modelqwen-plus),tools[search_rules_by_keywords,search_rules_by_category],system_prompt你是私募基金咨询助手...)工具调用的不确定性同一问题可能调用不同工具关键词检索 vs 类别检索概率性选择工具无法完全预测2 深思熟虑式Deliberative特点多节点流水线Pipeline每个节点独立完成子任务结果逐层传递最终汇总典型场景投资研究报告生成物流路径优化复杂决策需比较多个候选方案工作流设计5 节点示例节点职责输入输出感知收集市场数据研究主题、行业焦点市场信息摘要建模分析市场状态感知节点输出经济周期判断、风险因素推理生成多个候选方案建模节点输出3-5 个投资策略方案决策方案评分筛选候选方案列表选中方案置信度最高报告撰写完整报告所有前序节点结果最终投研报告置信度Confidence的作用解决每个方案看起来都很好的问题让 Agent 自我打分辅助决策适用于方案数量 3 的场景案例智能投研助手# 状态定义classAgentState(TypedDict):research_topic:str# 研究主题industry_focus:str# 行业焦点time_horizon:str# 时间范围短期/中期/长期perception_data:str# 感知阶段输出modeling_result:str# 建模阶段输出candidate_plans:List# 候选方案selected_plan:str# 选中方案final_report:str# 最终报告# 节点示例建模节点defmodeling_node(state:AgentState):promptf 你是专业投资分析师根据以下市场信息分析{state[perception_data]}请分析 1. 当前经济周期阶段 2. 主要风险因素 3. 结构性机会 resultllm.invoke(prompt)return{modeling_result:result.content}执行时间单次运行约 1-2 分钟每个节点独立推理无法并行3 混合式Hybrid设计思路意图识别节点Router判断任务复杂度简单任务 → Reactive 路径复杂任务 → Deliberative 路径架构图意图识别实现defassess_query(state:AgentState):评估任务复杂度promptf 用户问题{state[user_query]}判断任务类型 - reactive需要快速查询如查股价、查余额 - deliberative需要深度分析如投资规划、风险评估 返回 JSON{{mode: reactive或deliberative}} resultllm.invoke(prompt)return{processing_mode:result.mode}# 条件路由workflow.add_conditional_edges(assess_query,lambdax:x[processing_mode],{reactive:reactive_agent,deliberative:collect_data})典型对话场景用户提问路由选择原因今天上证指数多少点Reactive单次查询无需分析如何应对经济衰退调整投资组合Deliberative需市场分析 多方案比较四、RAG vs Tool知识管理策略1 对比分析维度RAG知识库Tool工具调用稳定性高Pipeline 固定低AI 随机选择工具灵活性低受切分/检索算法限制高多维度动态检索适用场景领域知识相对固定多维度、复杂领域实现方式文件切分 → Top-K 检索注册多个检索工具2 推荐策略简单场景优先 RAG知识库边界清晰如企业内部规章制度问题类型相对固定复杂场景RAG Tool 组合# 工具层多维度检索tooldefsearch_by_keyword(keyword:str):...tooldefsearch_by_category(category:str):...tooldefsearch_financial_report(company:str):...# RAG 层提供使用说明书faq_content 情况 1用户询问公司财报调用 search_financial_report(公司名) 情况 2用户询问行业分类信息调用 search_by_category(类别名) 情况 3... # 将 faq_content 作为 RAG 文档指导 Agent 何时用哪个工具核心原则Tool 负责数据获取多维度灵活检索RAG 负责决策指导Few-Shot 示例 思维链4.3 RAG 的新角色传统 RAG直接提供答案片段现代 RAG提供操作手册faq.txt作为 RAG 文档 用户询问财报数据 - 调用search_financial_report(公司名) - 示例用户问贵州茅台营收调用 search_financial_report(贵州茅台) 用户询问行业趋势 - 步骤1调用 web_search(行业关键词) - 步骤2调用 search_by_category(行业类别) - 步骤3综合结果生成分析五、LangGraph 实战要点1 核心组件StateGraph状态图fromlanggraph.graphimportStateGraph,END# 定义共享状态classAgentState(TypedDict):user_query:strprocessing_mode:strtools_output:strfinal_result:str# 创建图workflowStateGraph(AgentState)节点Node每个节点 一个函数函数签名def node_func(state: AgentState) - dict返回值会更新 state边Edge普通边workflow.add_edge(A, B)条件边根据运行时状态动态路由2 调试技巧生成 Mermaid 流程图# 打印流程图代码print(workflow.get_graph().draw_mermaid())# 粘贴到 https://mermaid.live/ 可视化状态追踪# 在节点中打印状态defdebug_node(state):print(f当前状态{state})return{}3 与 Coze 的对比维度LangGraphCoze开发方式代码定义流程拖拉拽可视化灵活度动态修改流程代码控制受限于界面功能开发效率需要编码AI 辅助快手动配置节点多时繁琐适用规模30 节点复杂流程小型原型 10 节点结论LangGraph 更适合生产环境Coze 适合快速验证想法六、Agent vs 工作流1 核心区别对比维度Agent工作流Workflow驱动方式对话驱动需外界 Push定时/事件驱动自动执行流程动态AI 决定下一步固定预定义流程图适用场景通用助手、开放式任务周期性任务、固定流程落地难度高需持续对话低设置后自动运行2 项目落地建议优先工作流80% 价值每天固定时间执行的任务如每日市场简报流程明确的场景如数据同步、报告生成配合 Agent20% 价值处理临时性、个性化问题作为工作流的异常处理器示例量化交易系统# 工作流每天开盘前执行defdaily_workflow():# 1. 抓取新闻newsfetch_news()# 2. 分析热点板块sectorsanalyze_sectors(news)# 3. 生成持仓建议reportgenerate_report(sectors)# 4. 发送邮件send_email(report)# Agent处理用户临时提问agentcreate_agent(tools[query_stock,query_position,...],prompt你是量化交易助手...)七、实战技巧1 从 0 到 1 的正确姿势❌ 错误做法直接让 AI 写完整项目代码不稳定需反复调试难以把控细节✅ 推荐做法基于现有案例改写找相似案例跑通代码理解逻辑让 AI 基于案例修改迭代优化示例对话hybrid_wealth_advisor_langgraph.py assistant_ticket_bot-3.py 这是一个混合式投顾助手LangGraph 实现 参考 assistant_ticket_bot-3.pyQwen-Agent 实现 帮我用 Qwen-Agent 重写保留混合式逻辑 写入新的 .py 文件7.2 AI 辅助开发技巧生成代码文档文件路径 帮我整理代码逻辑可以适当讲解示例 不超过 800 字整理到 .html 包含 Mermaid 流程图二次开发先跑通现有案例基于案例 原文件 需求描述让 AI 增量修改避免从零开始找同类型框架案例Agent 类 → 找 Qwen-Agent 案例找同类型模式案例工作流 → 找 LangGraph 案例形式确定后改内容比改架构容易 10 倍3 工具选择决策树八、关键知识点速查8.1 Function Call vs MCP对比项Function CallMCP协议层LLM API 内置独立协议6277 端口注册方式API 参数FastMCP 包装适用场景简单工具调用跨平台工具共享转换方式# Function Call → MCPfromfastmcpimportFastMCP mcpFastMCP(我的工具)mcp.tool()defmy_function(param:str):原有 Function Callreturnresult# 启动 MCP 服务默认 6277 端口mcp.run()2 WebSearch 实现方式 1调用大模型自带 WebSearch# Qwen / Kimi / GLM 都支持responsellm.invoke(prompt,enable_searchTrue# 参数名各厂商不同)方式 2自建 WebSearch 工具tooldefreal_time_stock_price(symbol:str):实时查询股票价格精确到秒# 调用东方财富 APIreturnfetch_stock_api(symbol)推荐实时性要求高的数据如股价用自建工具一般信息用大模型 WebSearch3 Skill 两段式调用第一段决定调用哪个 Skillname: read_file description: 读取指定文件内容第二段读取 Skill 详细说明# SKILL.md ## 调用方式 read_file(file_path: str) - str ## 参数说明 - file_path: 绝对路径支持 .txt / .md / .py ## 返回值 文件内容字符串 ## 示例 read_file(/path/to/file.txt)调用流程LLM 根据 name/description 选择 Skill调用 read_file 工具加载 SKILL.md根据详细说明执行具体操作九、课程案例总结Case 1私募基金问答助手反应式-技术栈LangChain Function Call-知识库3 条规则JSON 格式-工具数量3 个关键词检索、类别检索、QA 匹配-特点快速响应单次工具调用Case 2智能投研助手深思熟虑-技术栈LangGraph 工作流-节点数量5 个感知 → 建模 → 推理 → 决策 → 报告-运行时间约 1-2 分钟-特点多方案生成 置信度评分Case 3投顾 AI 助手混合式-技术栈LangGraph 条件边-路由节点意图识别Assess Query-分支Reactive快速查询 Deliberative深度分析-特点根据任务复杂度自动选择模式构建Agent的核心思想十、进阶学习路径掌握基础跑通三个 Case理解三种模式框架对比LangGraph工作流vs Qwen-Agent灵活二次开发基于案例改写成自己的场景优化策略工具设计减少工具间冲突如合并相似工具Prompt 优化在 RAG 中提供 Few-Shot 示例流程简化用条件边替代冗余节点生产部署错误处理工具调用失败的兜底逻辑成本控制缓存高频查询结果监控告警记录异常路径和耗时学习建议先理解流程图再看代码实现用 AI 辅助生成文档Mermaid HTML从案例改写入手避免从零开始优先掌握 LangGraph企业主流最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】