汪图南
  • LLM基础

    • 名词缩写
  • LLM应用

    • RAG
    • Agent
  • 快速入门
  • 高级技巧
前端面试之道
  • 打包工具

    • Webpack
    • Rollup
  • TypeScript

    • TypeScript基础
    • TypeScript类型挑战
  • CSS预编译器

    • SASS
  • 自动化测试

    • Vue应用测试
  • Vue2.0源码分析
  • Vue3.0源码分析
  • 数据结构和算法(基础)
  • LeetCode(刷题)
  • JavaScript书籍

    • 你不知道的JavaScript(上)
    • 你不知道的JavaScript(中下)
    • JavaScript数据结构和算法
    • JavaScript设计模式与开发实践
    • 深入理解ES6
  • Git书籍

    • 精通Git
Github
  • LLM基础

    • 名词缩写
  • LLM应用

    • RAG
    • Agent
  • 快速入门
  • 高级技巧
前端面试之道
  • 打包工具

    • Webpack
    • Rollup
  • TypeScript

    • TypeScript基础
    • TypeScript类型挑战
  • CSS预编译器

    • SASS
  • 自动化测试

    • Vue应用测试
  • Vue2.0源码分析
  • Vue3.0源码分析
  • 数据结构和算法(基础)
  • LeetCode(刷题)
  • JavaScript书籍

    • 你不知道的JavaScript(上)
    • 你不知道的JavaScript(中下)
    • JavaScript数据结构和算法
    • JavaScript设计模式与开发实践
    • 深入理解ES6
  • Git书籍

    • 精通Git
Github
  • Agent基础

    • 介绍

介绍

AI Agent 是一种能够自主感知环境、进行决策并执行任务的智能系统,它不仅能“回答问题”(像传统 LLM),而是能够 理解目标 → 制定计划 → 调用工具 → 执行任务 → 根据结果继续决策。

Agent定义

Agent特征

  • Autonomy(自主性): 不需要人类逐步指令,可以自己决定下一步行动。
  • Perception(感知能力): 能读取外部信息,例如:用户输入、数据库、API、文件和网络等。
  • Reasoning(推理能力): 使用 LLM 或其他模型进行思考与决策。
  • Action(行动能力): 调用工具或系统执行操作,例如:调用API、执行代码、操作浏览器、查询数据库等。
  • Memory(记忆能力): 保存历史信息用于后续决策。

典型架构

一个典型 Agent 架构通常包含 5 个核心模块。

            +----------------+
            |     User       |
            +--------+-------+
                     |
                     v
            +----------------+
            |       LLM      |
            |  (Reasoning)   |
            +--------+-------+
                     |
        +------------+-------------+
        |                          |
        v                          v
+---------------+          +---------------+
|    Memory     |          |     Tools     |
| (向量数据库)   |          | API/代码/浏览器 |
+---------------+          +---------------+
                     |
                     v
               +-----------+
               |  Action   |
               +-----------+

核心流程:输入 → 思考 → 规划 → 调用工具 → 获取结果 → 再思考 → 输出。

开发框架

框架核心语言特点适用场景
LangChainPython / JS支持多工具调用、任务规划、Memory管理、Chain-of-Thought各类 Agent、RAG、企业知识库应用
LangGraphPython / JSLangChain升级版,更偏向可视化任务流、可组合Agent企业级复杂任务自动化
AutoGPTPython自动多步任务执行、任务规划能力强、可持续运行自动化任务、Web操作、数据抓取
Microsoft Semantic KernelC# / PythonAgent + LLM + Memory + Planner,企业级SDK企业智能助手、自动化流程
CrewAIPython多 Agent 协作框架,角色分工明确多 Agent 协作、复杂任务分工

Agent产品

产品公司核心能力特点应用场景
ChatGPTOpenAILLM + 插件调用可调用外部插件完成任务办公助手、开发、信息查询
Claude CodeAnthropicLLM + 多轮思维安全、可控性强企业问答、文档分析
CopilotMicrosoft代码生成 + IDE操作可自动生成代码、调用文档编程辅助、代码自动化
Cursor国外代码 Agent自动完成代码任务开发者生产力

低代码Agent平台

平台核心特点优势应用场景
CozeAI Agent 低代码平台支持任务链 + 数据源接入智能问答、自动化流程
DifyLLM + Agent 可视化构建支持多 Agent、插件调用、低代码拖拽企业办公、智能客服、自动化任务
n8n可视化工作流 + API 集成支持 LLM + 多系统集成,开源可自托管自动化办公、任务调度、数据处理
FastGPTLLM Agent 平台支持多 Agent 协作、插件管理、低代码拖拽自动化任务、知识问答、数据分析
AgentGPTWeb 可视化 Agent 创建无需编程,直接拖拽任务节点自动任务执行、爬虫、数据分析
最后更新时间: 2026/3/8 15:36
贡献者: wangtunan