Published on

AI-Agents

Authors

通用平台与框架

craft-agents-oss

一个面向 AI Agent 的开源工作台,更像“桌面化的 agent 操作系统”,而不只是单轮对话工具。它把多会话管理、模型接入、MCP / API / 本地资源连接、Skills、权限控制和代码 diff 查看整合到一个 Bun + Electron + React 的 monorepo 里,适合需要长期运行、多工具协作和可视化管理 agent 工作流的场景。

  • 既有桌面端,也提供 CLI 入口,适合图形化使用和脚本化执行两种方式。
  • 支持多模型与多提供商,不局限于单一模型生态。
  • 强调把外部能力接进 agent:MCP server、REST API、本地文件系统和工作区技能都能纳入统一工作流。

Auto-Claude

一个能够自主规划、构建和验证软件的多智能体编码框架。它提供了跨平台的桌面应用程序下载、详细的功能特性说明、使用指南、安全模型以及开发与贡献信息。

OpenManus

OpenManus 是一个开源通用 AI 代理框架,无需邀请码即可使用,支持快速构建和定制 AI 代理。它提供简易安装、多代理集成、强化学习扩展及社区协作功能,旨在帮助用户高效实现各类 AI 应用创意。

handy-multi-agent

hello-agents

多 Agent 协作与编排

agency-agents

触手可及的完整 AI 智囊团——从前端魔法师到 Reddit 社区忍者,从奇思妙想注入者到现实校验专家。每个智能体都是独具个性、流程严谨且成果卓著的专业领域行家。

gastown
Gas Town 是一个多智能体编排系统,专为 Claude Code 设计,通过 Git 支持的钩子实现持久化工作跟踪。它允许用户协调多个智能体处理不同任务,支持扩展到 20 到 30 个智能体协同工作。

claude-flow
Claude Flow 是一个智能体编排平台,支持部署多智能体集群、协调自主工作流,并通过 MCP 协议原生接入 Claude Code。

Ruflo
Ruflo 是面向 Claude 的 Agent 编排平台,用来部署多 Agent swarm、协调自主工作流和构建对话式 AI 系统。它强调企业级架构、分布式 swarm intelligence、RAG 集成,并原生支持 Claude Code / Codex 集成。

claude_code_bridge
实时多 AI 协作:Claude、Codex 与 Gemini,具备持久上下文和最小化令牌开销。

OpenAgentsControl
OpenAgents Control 是一个以计划优先、基于批准执行的 AI 智能体框架,支持多语言开发,内置自动测试、代码审查和验证等功能。

claude-code-sub-agents

continuous-claude

Ralph Orchestrator
Ralph 是一个让 AI Agent 持续循环执行直到任务完成的编排框架。它支持 Claude Code、Gemini CLI、Codex、Copilot CLI、OpenCode 等后端,用 hat system 组织专门角色,并用测试、lint、typecheck 等 backpressure gate 拦住未完成结果。

Goal-Driven Goal-Driven 是一套给多 Agent 系统使用的长时间任务执行模板,适合 Claude Code、Codex、OpenClaw 等支持子代理的工具。核心是让 Master Agent 只盯最终目标和成功标准:创建 Subagent,定期检查活跃状态和阶段结果;如果结果没有满足标准,就要求继续或重启子代理,直到可验证标准达成。

  • 适合高度复杂但可验收的任务:编译器设计、数学定理证明、数据库架构、系统级设计、EDA 仿真等。
  • 重点不在堆更多 agent,而是把 GoalCriteria 写清楚,让主代理用可验证标准控制循环。
  • 仓库给出过 C++ 实现 TypeScript 编译器、Rust 实现 SQLite、TypeScript 实现 Lean4 编译器等示例项目。
  • 作者明确提醒不要把这段 prompt 做成 skill 或插件,避免污染上下文;更适合作为需要时临时填目标和成功标准的模板。
  • 更适合放在 AI Agents 的“多 Agent 协作与编排”:它提供的是长时间自治工作的控制方法,而不是单个应用或开发工具。

Agent 社会与仿真

GOD - Govern · Observe · Direct GOD 是一个面向 Agent 社会的实时控制台,用来观察、回放和干预一座由 LLM Agent 驱动的小镇。它把 React/Vite 控制台、本地 FastAPI 后端、Agent runtime、像素地图、实验文件和 replay store 串成 local-first 工作流,适合研究 generative agents、社会仿真和可交互实验控制。

  • 重点不只是“看 Agent 行动”,而是能暂停时间、按 step 回放、向单个 Agent 或群组发问,并把指令注入下一步。
  • 自带浏览器配置向导,可以配置 OpenAI 兼容模型、选择内置实验或创建自定义场景,再进入控制台运行。
  • 内置 GOD Town 与 PKU Trump Visit 两类实验,也支持通过地图包和实验文件扩展新世界。
  • 更适合放在 AI Agents 的“Agent 社会与仿真”:它关注多 Agent 社会运行与实验干预,不是普通 AI 开发工具或单个编码 Agent。

GUI 与设备操作 Agent

Browser Harness
Browser Harness 是一个基于 Chrome DevTools Protocol 的浏览器操作 harness。它把浏览器控制能力暴露给 LLM,并允许 Agent 在任务中补写缺失 helper,适合研究浏览器自动化、网页操作 Agent 和可自愈 harness。

Webwright

Webwright 是 Microsoft 开源的浏览器 Agent 框架。它把浏览器任务交给 coding agent 在终端里编写、运行和修复 Playwright 脚本,而不是让模型逐步预测点击、输入或坐标动作。每次任务都会沉淀为可重跑的 Python 脚本,并把轨迹、截图和调试产物写入工作区,适合研究长链路网页任务、可复用浏览器自动化和 agent harness 设计。

  • 核心思路是 code-as-action:浏览器会话可以丢弃,真正保留的是代码、日志和截图。
  • 框架较轻量:核心 agent loop、Playwright 环境、CLI 和模型后端都保持在较小代码量,便于阅读和 fork。
  • 支持 OpenAI、Anthropic、OpenRouter 后端,也提供 Claude Code、Codex、OpenClaw、Hermes 的插件或 Skill 接入方式。
  • 适合放在 GUI 与设备操作 Agent:它关注浏览器操作能力和长任务执行,不只是普通开发工具或提示词集合。

Open Computer Use
Open Computer Use 是一个开源 Computer Use 服务,以 MCP 形式暴露给 Codex、Claude Code、Gemini CLI、opencode 等客户端。它支持 macOS、Linux 和 Windows,适合研究非侵入式桌面操作、Accessibility 驱动的 CUA 和 Codex Computer Use 替代方案。

UI-TARS-desktop

这是一个基于 UI-TARS 的图形用户界面代理应用程序,让您可以通过自然语言来控制您的计算机。

Open-AutoGLM

这是一个基于 AutoGLM 构建的手机端智能助理框架。它能够通过多模态模型理解手机屏幕内容,并借助 ADB 或 HDC 自动化操作帮助用户完成任务。

垂直场景 Agent

Web 研究

Firecrawl Web Agent

Firecrawl Web Agent 是一个面向结构化 Web 研究的开源数据 Agent。它基于 LangChain Deep Agents harness,把 Firecrawl 的 search、scrape、interact 浏览器自动化、bash、Skills、Subagents 和结构化输出串成 plan-act-observe 循环,适合做可部署的网页研究、数据抽取和多子代理并行采集。

影视

waoowaoo

首家工业级全流程 AI 影视生产平台

营销

BettaFish - Agent 舆情分析助手

金融

Dexter - 金融研究 Agent

Dexter 是一个面向深度金融研究的自主 Agent,主打任务规划、自我反思、自我校验和实时市场数据分析。它更像“专为金融研究定制的 Claude Code”,适合把复杂投研问题拆成可执行研究步骤,再逐步收集数据、验证结论并输出结果。

  • 面向金融分析场景:围绕财报、资产负债表、现金流和实时市场数据展开,而不是通用问答。
  • 自主执行链路完整:支持任务拆解、工具选择、结果校验和迭代修正,不只是单轮调用模型。
  • 带评测与调试能力:内置 eval 流程,也会把工具调用和推理轨迹记到 .dexter/scratchpad/,便于回放和排查。
  • 可扩展到消息入口:除交互式终端外,还支持接入 WhatsApp 网关。

专业写作

PatentWriterAgent-专利 Agent

能力增强

pua

本文介绍了一款名为“PUA”的 AI 编程助手技能插件,旨在通过模拟企业 PUA(中文版)/PIP(英文版)话术,强制 AI 在遇到问题时穷尽所有解决方案,而非轻易放弃。该插件支持多种 AI 编程工具(如 Claude Code、OpenAI Codex CLI 等),通过压力升级机制、主动性强化和调试方法论,显著提升 AI 的调试效率、问题解决率和工具使用率。插件提供多语言版本,并包含安装指南、团队使用建议及高阶版本“High-Agency”的介绍。