EvoAgentX - 自我进化 AI Agent 框架
来源: GitHub 搜索
GitHub: https://github.com/EvoAgentX/EvoAgentX
Stars: 1000+ (2025年7月达到)
论文: https://arxiv.org/abs/2507.03616
Survey: https://arxiv.org/abs/2508.07407
日期: 2026-04-19
项目概述
EvoAgentX 是一个开源框架,用于以自动化、模块化、目标驱动的方式构建、评估和演化基于 LLM 的 Agent 或 Agentic Workflows。核心理念是让 AI Agent 能够像软件一样通过迭代反馈循环持续测试和改进。
核心特性
1. 自动工作流构建 (Agent Workflow Autoconstruction)
- 从单个自然语言提示自动生成结构化的多 Agent 工作流
- 无需手动编排,系统自动分解任务并分配给合适的 Agent
2. 内置评估系统 (Built-in Evaluation)
- 集成自动评估器,使用任务特定标准对 Agent 行为打分
- 支持自定义评估指标
3. 自我进化引擎 (Self-Evolution Engine)
- Agent 不仅工作,还能学习
- 使用自我进化算法改进工作流
- 支持 4 种 SOTA 算法:
- TextGrad: 基于梯度的提示词优化(Nature 2025)
- MIPRO: 模型无关的迭代提示优化
- AFlow: 基于 MCTS 的工作流进化
- EvoPrompt: 反馈驱动的提示词演化
4. 即插即用兼容性 (Plug-and-Play Compatibility)
- 支持 OpenAI、Claude、DeepSeek、Qwen 等主流模型
- 通过 LiteLLM/SiliconFlow/OpenRouter 支持更多模型
- 支持本地部署模型
5. 丰富的内置工具库
- 代码解释器: Python、Docker 沙箱执行
- 搜索工具: Google、Wikipedia、arXiv、DDGS、SerpAPI
- 文件系统: 读写、Shell 命令
- 数据库: MongoDB、PostgreSQL、FAISS 向量数据库
- 图像工具: 分析、生成(DALL·E、Flux)
- 浏览器自动化: 低级控制 + LLM 驱动的高级自动化
- MCP 工具支持
6. 记忆模块 (Memory Module)
- 短期记忆(ephemeral)
- 长期记忆(persistent)
- 支持跨交互的记忆、反思和改进
7. Human-in-the-Loop (HITL)
- 支持人工审核、纠正和引导 Agent 行为
- 可在关键步骤插入人工检查点
- 灵活的进入/退出机制
性能表现
在 GAIA 基准测试上优化现有多 Agent 系统:
- Open Deep Research: 优化后性能提升
- OWL: 优化后性能提升
在三个任务上的评估(50 验证样本 + 100 测试样本):
- HotPotQA (多跳问答): F1 从 63.58% → 71.02% (TextGrad)
- MBPP (代码生成): Pass@1 从 69% → 79% (AFlow)
- MATH (推理): 解决率从 66% → 76% (TextGrad)
与 OpenClaw Evolver 对比
| 维度 | EvoAgentX | OpenClaw Evolver |
|---|---|---|
| 架构 | 完整的 Agent 框架 | 技能演化引擎(OpenSpace 子模块) |
| 演化对象 | 工作流结构 + 提示词 | Skills (SKILL.md 文件) |
| 触发机制 | 主动优化循环 + 评估驱动 | 被动触发(post-analysis / tool-degradation / metric-monitor) |
| 算法 | 4 种集成 SOTA 算法 | 自定义规则 + LLM 确认 |
| 评估系统 | 内置评估器 + 基准测试 | 基于 metrics (applied_rate / completion_rate / effective_rate) |
| 记忆系统 | 短期 + 长期记忆模块 | 无(依赖 SkillStore) |
| HITL | 原生支持 | 无 |
| 状态 | 活跃开发(1000+ stars) | 已实现但未生效(需要手动触发) |
| 社区 | Discord + X + WeChat + 周会 | OpenClaw 社区 |
关键洞察
EvoAgentX 的优势
- 完整的生态系统: 从工作流生成到评估到演化的闭环
- 学术支撑: 有论文和 Survey,算法有理论基础
- 活跃社区: 定期周会、技术分享、持续更新
- 工具丰富: 70+ 内置工具,覆盖大部分场景
OpenClaw Evolver 的优势
- 轻量级: 专注于 skill 演化,不是完整框架
- 集成度高: 与 OpenClaw 生态深度集成
- 灵活性: 可以针对 OpenClaw 的特定需求定制
互补性
- EvoAgentX 适合从零构建自我进化的 Agent 系统
- OpenClaw Evolver 适合在现有 OpenClaw 生态中演化 skills
- 两者可以互相借鉴算法和设计理念
应用场景
EvoAgentX 官方示例
- 金融信息 Agentic Workflow: 收集公司公开信息、股价、机构买卖活动,生成 HTML 报告和投资建议
- arXiv 研究摘要器: 基于关键词和时间范围检索和总结论文
潜在集成方向
- 短期: 研究 EvoAgentX 的算法实现,借鉴到 OpenClaw Evolver
- 中期: 将 EvoAgentX 的评估系统集成到 OpenSpace
- 长期: 评估是否将 EvoAgentX 作为 OpenSpace 的演化后端
技术栈
- 语言: Python 3.11+
- 安装:
pip install evoagentx - 依赖: OpenAI SDK、LiteLLM、各种工具库
- 许可: MIT License
社区资源
- 官网: https://evoagentx.org/
- 文档: https://EvoAgentX.github.io/EvoAgentX/
- Discord: https://discord.gg/XWBZUJFwKe
- X (Twitter): https://x.com/EvoAgentX
- 周会: 每周日 16:30-17:30 GMT+8
- YouTube: 技术分享和 Demo 视频
- Bilibili: 中文社区视频
相关论文
EvoAgentX Framework Paper (2025-07)
https://arxiv.org/abs/2507.03616Self-Evolving AI Agents Survey (2025-08)
https://arxiv.org/abs/2508.07407
待办
- 深入研究 TextGrad 和 AFlow 算法实现
- 对比 EvoAgentX 的评估系统与 OpenSpace ExecutionAnalyzer
- 评估 EvoAgentX 的工具库是否可以集成到 OpenClaw
- 测试 EvoAgentX 在 OpenClaw 场景下的表现
- 考虑是否贡献 OpenClaw 相关的 toolkit 到 EvoAgentX
引用
@article{wang2025evoagentx,
title={EvoAgentX: An Automated Framework for Evolving Agentic Workflows},
author={Wang, Yingxu and Liu, Siwei and Fang, Jinyuan and Meng, Zaiqiao},
journal={arXiv preprint arXiv:2507.03616},
year={2025}
}