AI-Agents

通用平台与框架
多 Agent 协作与编排
Agent 社会与仿真
GUI 与设备操作 Agent
垂直场景 Agent
Web 研究
影视
营销
金融
专业写作
能力增强

通用平台与框架
多 Agent 协作与编排
Agent 社会与仿真
GUI 与设备操作 Agent
垂直场景 Agent
Web 研究
影视
营销
金融
专业写作
能力增强

通用平台与框架

一个面向 AI Agent 的开源工作台，更像“桌面化的 agent 操作系统”，而不只是单轮对话工具。它把多会话管理、模型接入、MCP / API / 本地资源连接、Skills、权限控制和代码 diff 查看整合到一个 Bun + Electron + React 的 monorepo 里，适合需要长期运行、多工具协作和可视化管理 agent 工作流的场景。

既有桌面端，也提供 CLI 入口，适合图形化使用和脚本化执行两种方式。
支持多模型与多提供商，不局限于单一模型生态。
强调把外部能力接进 agent：MCP server、REST API、本地文件系统和工作区技能都能纳入统一工作流。

Auto-Claude

一个能够自主规划、构建和验证软件的多智能体编码框架。它提供了跨平台的桌面应用程序下载、详细的功能特性说明、使用指南、安全模型以及开发与贡献信息。

OpenManus

OpenManus 是一个开源通用 AI 代理框架，无需邀请码即可使用，支持快速构建和定制 AI 代理。它提供简易安装、多代理集成、强化学习扩展及社区协作功能，旨在帮助用户高效实现各类 AI 应用创意。

handy-multi-agent

hello-agents

多 Agent 协作与编排

agency-agents

触手可及的完整 AI 智囊团——从前端魔法师到 Reddit 社区忍者，从奇思妙想注入者到现实校验专家。每个智能体都是独具个性、流程严谨且成果卓著的专业领域行家。

gastown
Gas Town 是一个多智能体编排系统，专为 Claude Code 设计，通过 Git 支持的钩子实现持久化工作跟踪。它允许用户协调多个智能体处理不同任务，支持扩展到 20 到 30 个智能体协同工作。

claude-flow
Claude Flow 是一个智能体编排平台，支持部署多智能体集群、协调自主工作流，并通过 MCP 协议原生接入 Claude Code。

Ruflo
Ruflo 是面向 Claude 的 Agent 编排平台，用来部署多 Agent swarm、协调自主工作流和构建对话式 AI 系统。它强调企业级架构、分布式 swarm intelligence、RAG 集成，并原生支持 Claude Code / Codex 集成。

claude_code_bridge
实时多 AI 协作：Claude、Codex 与 Gemini，具备持久上下文和最小化令牌开销。

OpenAgentsControl
OpenAgents Control 是一个以计划优先、基于批准执行的 AI 智能体框架，支持多语言开发，内置自动测试、代码审查和验证等功能。

claude-code-sub-agents

continuous-claude

Ralph Orchestrator
Ralph 是一个让 AI Agent 持续循环执行直到任务完成的编排框架。它支持 Claude Code、Gemini CLI、Codex、Copilot CLI、OpenCode 等后端，用 hat system 组织专门角色，并用测试、lint、typecheck 等 backpressure gate 拦住未完成结果。

Goal-Driven Goal-Driven 是一套给多 Agent 系统使用的长时间任务执行模板，适合 Claude Code、Codex、OpenClaw 等支持子代理的工具。核心是让 Master Agent 只盯最终目标和成功标准：创建 Subagent，定期检查活跃状态和阶段结果；如果结果没有满足标准，就要求继续或重启子代理，直到可验证标准达成。

适合高度复杂但可验收的任务：编译器设计、数学定理证明、数据库架构、系统级设计、EDA 仿真等。
重点不在堆更多 agent，而是把 Goal 和 Criteria 写清楚，让主代理用可验证标准控制循环。
仓库给出过 C++ 实现 TypeScript 编译器、Rust 实现 SQLite、TypeScript 实现 Lean4 编译器等示例项目。
作者明确提醒不要把这段 prompt 做成 skill 或插件，避免污染上下文；更适合作为需要时临时填目标和成功标准的模板。
更适合放在 AI Agents 的“多 Agent 协作与编排”：它提供的是长时间自治工作的控制方法，而不是单个应用或开发工具。

Agent 社会与仿真

GOD - Govern · Observe · Direct GOD 是一个面向 Agent 社会的实时控制台，用来观察、回放和干预一座由 LLM Agent 驱动的小镇。它把 React/Vite 控制台、本地 FastAPI 后端、Agent runtime、像素地图、实验文件和 replay store 串成 local-first 工作流，适合研究 generative agents、社会仿真和可交互实验控制。

重点不只是“看 Agent 行动”，而是能暂停时间、按 step 回放、向单个 Agent 或群组发问，并把指令注入下一步。
自带浏览器配置向导，可以配置 OpenAI 兼容模型、选择内置实验或创建自定义场景，再进入控制台运行。
内置 GOD Town 与 PKU Trump Visit 两类实验，也支持通过地图包和实验文件扩展新世界。
更适合放在 AI Agents 的“Agent 社会与仿真”：它关注多 Agent 社会运行与实验干预，不是普通 AI 开发工具或单个编码 Agent。

GUI 与设备操作 Agent

Browser Harness
Browser Harness 是一个基于 Chrome DevTools Protocol 的浏览器操作 harness。它把浏览器控制能力暴露给 LLM，并允许 Agent 在任务中补写缺失 helper，适合研究浏览器自动化、网页操作 Agent 和可自愈 harness。

Webwright

Webwright 是 Microsoft 开源的浏览器 Agent 框架。它把浏览器任务交给 coding agent 在终端里编写、运行和修复 Playwright 脚本，而不是让模型逐步预测点击、输入或坐标动作。每次任务都会沉淀为可重跑的 Python 脚本，并把轨迹、截图和调试产物写入工作区，适合研究长链路网页任务、可复用浏览器自动化和 agent harness 设计。

核心思路是 code-as-action：浏览器会话可以丢弃，真正保留的是代码、日志和截图。
框架较轻量：核心 agent loop、Playwright 环境、CLI 和模型后端都保持在较小代码量，便于阅读和 fork。
支持 OpenAI、Anthropic、OpenRouter 后端，也提供 Claude Code、Codex、OpenClaw、Hermes 的插件或 Skill 接入方式。
适合放在 GUI 与设备操作 Agent：它关注浏览器操作能力和长任务执行，不只是普通开发工具或提示词集合。

Open Computer Use
Open Computer Use 是一个开源 Computer Use 服务，以 MCP 形式暴露给 Codex、Claude Code、Gemini CLI、opencode 等客户端。它支持 macOS、Linux 和 Windows，适合研究非侵入式桌面操作、Accessibility 驱动的 CUA 和 Codex Computer Use 替代方案。

Harness Anything
Harness Anything 是一个面向 AI Agent 的桌面软件控制工具集，把 WPS / Microsoft Office、Zotero、Adobe Illustrator、Photoshop 等应用包装成 CLI / COM harness。它适合研究如何让 Agent 从“只会写文本和代码”扩展到真实办公、学术写作、图形设计和 PPT 生产场景。

办公侧提供 47 个 CLI 命令，可操控 Word、Excel、PowerPoint / WPS Writer、Calc、Impress，并支持导出 DOCX、XLSX、PPTX、PDF、CSV 等格式。
学术侧集成 Zotero 与 27 个 academic skills，覆盖文献检索、综述、写作、同行评审、可视化、统计分析和完整论文流水线。
设计侧通过 Windows COM 自动化接入 Illustrator 与 Photoshop，让 Agent 能创建、编辑和导出矢量图或位图资产。
更适合放在 AI Agents 的「GUI 与设备操作 Agent」：它提供的是 Agent 操作真实桌面软件的 harness，而不是普通 CLI 工具或单一办公插件。

UI-TARS-desktop

这是一个基于 UI-TARS 的图形用户界面代理应用程序，让您可以通过自然语言来控制您的计算机。

Open-AutoGLM

这是一个基于 AutoGLM 构建的手机端智能助理框架。它能够通过多模态模型理解手机屏幕内容，并借助 ADB 或 HDC 自动化操作帮助用户完成任务。

垂直场景 Agent

Web 研究

Firecrawl Web Agent

Firecrawl Web Agent 是一个面向结构化 Web 研究的开源数据 Agent。它基于 LangChain Deep Agents harness，把 Firecrawl 的 search、scrape、interact 浏览器自动化、bash、Skills、Subagents 和结构化输出串成 plan-act-observe 循环，适合做可部署的网页研究、数据抽取和多子代理并行采集。

影视

waoowaoo

首家工业级全流程 AI 影视生产平台

OpenMontage

OpenMontage 是一个开源的 agentic 视频生产系统，目标是把 Claude Code、Cursor、Copilot、Windsurf、Codex 等 coding assistant 变成视频制作工作室。它把选题研究、脚本、素材生成与检索、配音、音乐、字幕、剪辑、Remotion / HyperFrames / FFmpeg 渲染和自检串成流水线，既能做图像驱动短片，也能走真实 footage montage 路线。

更适合研究「Agent + 视频生产」完整链路，而不是单个图像或视频生成 API。
支持从参考视频出发，分析转录、节奏、场景、关键帧和风格，再产出变体方案、成本估算和制作路径。
零 API key 也能通过 Piper TTS、开放影像素材、Remotion / HyperFrames 和 FFmpeg 生成基础作品；接入 FAL、OpenAI、ElevenLabs、Runway 等 key 后能力更完整。
更适合放在 AI Agents 的「影视」：核心价值是让 coding assistant 按流水线自主规划和制作视频，而不是普通剪辑工具或素材库。

营销

BettaFish - Agent 舆情分析助手

金融

Dexter - 金融研究 Agent

Dexter 是一个面向深度金融研究的自主 Agent，主打任务规划、自我反思、自我校验和实时市场数据分析。它更像“专为金融研究定制的 Claude Code”，适合把复杂投研问题拆成可执行研究步骤，再逐步收集数据、验证结论并输出结果。

面向金融分析场景：围绕财报、资产负债表、现金流和实时市场数据展开，而不是通用问答。
自主执行链路完整：支持任务拆解、工具选择、结果校验和迭代修正，不只是单轮调用模型。
带评测与调试能力：内置 eval 流程，也会把工具调用和推理轨迹记到 .dexter/scratchpad/，便于回放和排查。
可扩展到消息入口：除交互式终端外，还支持接入 WhatsApp 网关。

专业写作

PatentWriterAgent-专利 Agent

能力增强

pua

本文介绍了一款名为“PUA”的 AI 编程助手技能插件，旨在通过模拟企业 PUA（中文版）/PIP（英文版）话术，强制 AI 在遇到问题时穷尽所有解决方案，而非轻易放弃。该插件支持多种 AI 编程工具（如 Claude Code、OpenAI Codex CLI 等），通过压力升级机制、主动性强化和调试方法论，显著提升 AI 的调试效率、问题解决率和工具使用率。插件提供多语言版本，并包含安装指南、团队使用建议及高阶版本“High-Agency”的介绍。