Published on

AI-DevTools

Authors

这个页面收开发者向 AI 工具生态:MCP、插件、工作流、测试、记忆、工作台、运行时和服务。不以“是否是 Agent”或“是否是 CLI”划分,而是以“是否主要服务开发流程”划分。

MCP 与环境桥接

mobile-use - AI 操作安卓和 iOS 应用程序

claude-context - 代码搜索 mcp

ios-simulator-mcp - 用于与 iOS 模拟器交互

mcp-chrome

Figma-Context-MCP / Framelink MCP for Figma

一个把 Figma 设计数据翻译成 AI 编码代理更容易消费的 MCP 服务,主要面向 Cursor 一类 IDE 内 agent 场景。相比直接贴截图,它会把文件、画板或分组中的布局和样式信息做一层压缩与转换,让模型更容易一次性还原出接近设计稿的界面实现。

  • 适合设计到代码链路:把 Figma 链接直接喂给 IDE 内 agent,再让它拉取结构化设计上下文去实现页面,而不是只靠视觉猜测。
  • 做了上下文裁剪:不会原样把 Figma API 全量响应塞给模型,而是优先保留更相关的布局和样式信息,减少上下文噪音。
  • 接入门槛不高:通过 npx -y figma-developer-mcp --figma-api-key=... --stdio 就能挂到大多数 MCP 客户端配置里。
  • 更适合开发流程页:它是服务设计实现链路的基础设施,不只是单个 prompt 或设计资源,因此放在 AI DevTools 比放到 AI Skills 更合适。

midscene

Midscene.js 是一个基于视觉模型驱动的跨平台 UI 自动化框架,支持通过自然语言描述自动化任务,覆盖 Web、Android、iOS 等多种界面,并提供开发者友好的 SDK、调试工具和社区生态。

Claude Code 插件与工具链

plannotator - 可视化 CC 的运行过程
ralph-wiggum - 自循环迭代开发

CCPlugins

oh-my-claudecode
一个面向 Claude Code 的多智能体编排插件,主打零学习曲线。安装后可以直接用自然语言触发 Team 流水线、tmux 工作者和多模型协作,而不需要手动组织复杂命令。

  • Team 优先编排:默认走 team-plan → team-prd → team-exec → team-verify → team-fix 阶段化流水线。
  • 插件化接入 Claude Code:通过 /plugin marketplace add/plugin install 安装,适合作为日常 Claude Code 工作台增强。
  • 支持外部 CLI 工作者:可在 tmux 中拉起 Codex、Gemini、Claude CLI 做并行审查、UI 设计和实现任务。
  • 面向真实开发流程:内置 setup、doctor、更新、深度访谈等命令,覆盖从需求澄清到执行验证的整套工作流。

codex-plugin-cc - 在 Claude Code 内调用 Codex
OpenAI 官方的 Claude Code 插件,让你直接在 Claude Code 工作流里调用 Codex 做代码审查或委托任务。安装后可通过 /codex:review/codex:adversarial-review/codex:rescue/codex:status/codex:result 等命令,在当前仓库里发起只读审查、挑战式审查和后台救火任务。

  • 官方插件接入:通过 /plugin marketplace add openai/codex-plugin-cc/plugin install codex@openai-codex 安装,适合已经把 Claude Code 当主工作台的用户。
  • 审查与委托一体:既能做普通 review,也能把排查问题、尝试修复、续跑上一次任务交给 Codex。
  • 复用本机 Codex 环境:依赖本地 codex CLI、登录态和 .codex/config.toml 配置,不额外引入一套独立运行时。
  • 使用门槛明确:需要本机已安装 Codex、Node.js 18.18+,并用 ChatGPT 账号或 OpenAI API key 完成 Codex 登录。

claude-code-marketplace
gstack
Claude Code 的开源软件工厂,用 slash commands 组织产品、设计、评审、QA 和发布流程。
claude-code-action
claude-code-infrastructure-showcase
buildwithclaude
codex-toolkit-for-claude 在 claude 中调用 codex

工作流与测试

cc-wf-studio
CC Workflow Studio 是一款可视化 AI 工作流编辑器,支持通过拖拽或自然语言对话设计复杂的 AI 代理工作流。它可一键导出至多种 AI 代码工具,如 Claude Code、GitHub Copilot,并直接运行工作流,无需编写代码。

agent-orchestrator Agent Orchestrator 是一个面向并行 AI 编码代理的编排层,重点解决“多个 agent 同时在同一代码库里工作”时的分支隔离、任务分发、CI 回路和 review 回路问题。它给每个 agent 分配独立 git worktree、分支和 PR,再用统一面板跟踪状态。

  • 核心价值是把多代理开发流程跑顺:issue 分配、agent 拉起、PR 创建、CI 失败回传、review 评论回传,都能在同一条链路里自动流转。
  • 对底层代理和运行时比较中立:README 明确写了可接 Claude Code、Codex、Aider,也支持 tmux 和 Docker 一类运行时。
  • 更像编排系统而不是单个 agent:你主要操作的是 orchestrator 和 dashboard,而不是手动盯每个终端会话。
  • 插件位设计比较完整:agent、runtime、workspace、tracker、SCM、notifier、terminal 都能替换,适合需要长期扩展工作流的团队。

expect Expect 是一个让 AI agent 在真实浏览器里测试代码改动的工具。它会扫描未提交改动或分支 diff,生成测试计划,再驱动浏览器执行验证并输出通过或失败结果。

  • 面向代码变更测试:直接读取 git diff 来决定测什么,不是手写固定脚本后再运行。
  • 支持真实浏览器会话:基于 Playwright 执行,用你现有登录态验证真实用户流程,减少额外鉴权配置。
  • 兼容 Claude 和 Codex:可以把 Claude Code 或 Codex CLI 作为生成测试计划的 agent。
  • 适合本地与 CI:本地可用交互式 TUI 审核计划,CI 中可用 -y 跳过审核直接无头执行。

aimock aimock 是一套面向 AI 应用测试的统一 Mock 基础设施。它不是只模拟单个 LLM 接口,而是把 AI 应用真正会依赖的一整层外部能力一起替身掉,包括 LLM API、MCP、A2A、AG-UI、向量库、搜索、rerank、moderation,以及图片、语音、视频等多媒体接口。

  • 更适合集成测试和 CI:既可以程序化嵌进测试,也可以用单独端口跑成统一 mock 服务,把 OpenAI、Claude、Gemini 一类入口一起切到本地。
  • 覆盖 agent 真实依赖:除了模型接口,还支持 MCP tools、A2A agent、AG-UI 事件流和向量数据库,适合测试多协议、多服务的 agent 应用。
  • 支持录制回放和漂移检测:可以代理真实 API 录成 fixtures,再稳定回放;也能在 CI 里做 drift detection,持续检查 mock 与真实供应商行为是否偏离。
  • 对异常场景友好:支持 500、坏 JSON、流中断这类 chaos testing,适合补齐“平时最难稳定复现”的 AI 失败路径。

ralph - 基于 PRD 的自循环开发工作流 Ralph 是一个围绕 Geoffrey Huntley Ralph pattern 落地的自动化开发循环,用 Bash 脚本反复拉起新的 AI coding tool 实例,直到 prd.json 里的需求项全部完成。它支持 Amp 和 Claude Code,核心不是“长会话坚持到底”,而是“每轮都用干净上下文重新开始”,再通过 git 历史、progress.txtprd.json 保持跨轮次记忆。

  • 核心执行模型很清晰:每次迭代只做一个足够小的 story,跑实现、质量检查、提交、更新状态,然后再开一个全新 agent 继续下一轮。
  • 适合长任务拆分:它强调 PRD item 必须小到能在单个上下文窗口内完成,否则会因为上下文耗尽导致质量下降。
  • 记忆设计偏工程化:不依赖单个会话上下文续命,而是把长期记忆沉淀到 commit、progress.txtprd.jsonAGENTS.md 更新里。
  • 带配套技能:仓库同时提供 /prd/ralph 两个 skill,用来先生成需求文档,再转成适合自动执行的 prd.json
  • 更像“本地自治循环器”而不是通用平台:它没有做成完整工作台,而是把自主开发流程压缩成一套可直接拷进项目的脚本和 prompt 模板,适合研究 agent 如何通过小步快跑和反馈回路稳定推进任务。

记忆与状态

claude-mem Claude-Mem 是一款为 Claude Code 设计的持久化记忆压缩系统,能够自动捕获工具使用记录、生成语义摘要,并在不同会话间保持上下文连续性,从而让 Claude 在项目开发中具备跨会话的记忆能力。

claude-subconscious Claude Subconscious 是 Letta 推出的 Claude Code 后台代理插件,它会在后台观察会话 transcript、读取代码库、积累长期记忆,并在下一次提示前向 Claude 注入简短“耳语”式上下文提示。

  • 不是静态记忆文件:它不会把内容写进 CLAUDE.md,而是通过后台 agent 持续分析会话和代码库,再按需回送提醒。
  • 支持跨会话记忆:可在不同 session、不同项目之间共享长期记忆,弥补 Claude Code 原生会话记忆易丢失的问题。
  • 带工具访问能力:后台 agent 可以读文件、搜索代码,甚至结合 Letta 的 Web 能力扩展上下文,不只是简单摘要。
  • 更接近“记忆副驾驶”:适合重度 Claude Code 用户做长期项目跟踪、上下文延续和工作习惯沉淀。

客户端与工作台

CodexMonitor
CodexMonitor 是一款基于 Tauri 框架的 macOS 应用程序,用于在本地工作区中编排和管理多个 Codex 智能体。它通过侧边栏管理项目,提供主屏幕快速操作,并支持基于 Codex app-server 协议的对话视图。

happy
Happy Coder 是一个为 Claude Code 和 Codex AI 编程工具提供的移动端与网页客户端,支持端到端加密和跨设备即时切换。

hapi
HAPI 是一个本地优先的 AI 编程辅助工具,支持在本地运行 Claude Code、Codex 和 Gemini 等 AI 会话,并可通过 Web、PWA 或 Telegram Mini App 进行远程控制。

ccmate
CC Mate 是一款为 Claude Code 设计的图形化配置与管理工具,提供直观的界面来轻松设置、切换配置、监控使用情况并管理 MCP 服务器。

CodeBar - 用量统计
CodexBar 是一款专为 macOS 14+ 设计的轻量级菜单栏应用,可实时监控并显示多种 AI 服务的用量限额和重置时间。它支持多服务切换、隐私优先设计,并提供 CLI 工具和桌面小组件。

confirmo CONFIRMO 是一款桌面端 AI 编程助手,支持 macOS、Windows 和 Linux。

conductor 该工具允许用户在隔离的工作空间中并行创建 Codex 和 Claude Code 代理,实时查看其工作状态,并审核与合并代码更改。

OpenASE
OpenASE 是一个把同步交互式 AI 和异步 ticket agent 串起来的开发工作台。它把 Codex、Claude Code、Gemini 等放进同一个控制面,一边保留“边聊边想边改”的 Project AI,一边用看板加 Workflow 让异步 agent 按票据、依赖和阶段自动推进。

  • 同步与异步一体:需求还模糊时先在 Project AI 里讨论方案、拆票、补文档;需求清晰后再交给 ticket agent 自动执行。
  • 工作流可编排:支持看板状态流、任务依赖、并行执行和多角色接力,适合把单兵全流程或前后端、测试协作流都收进一个面板。
  • 面向本机执行:agent 会在你的机器上跑工作流,同时保留 ticket、执行状态和结果的可追踪性。
  • 更像 AI 开发控制台:它的核心价值是统一工作台与执行编排,不是单独的 Agent 框架或纯 CLI,所以放在 AI DevTools 比放到 AI Agents 更准确。
  • 收录来源:GitHubDaily #787

Multica - 托管式 AI Agent 开发平台 Multica 是一个把 coding agent 变成“团队成员”的开源托管平台。它不只是起一个 agent 跑任务,而是把 issue 分配、状态流转、实时进度、运行时调度和技能沉淀都放进同一套工作台里,适合把 Claude Code、Codex、OpenClaw、OpenCode 这类 agent 真正纳入研发协作流程。

  • 任务分配方式接近人类协作:你可以像给同事派单一样把 issue 指给 agent,agent 会领取任务、执行、汇报阻塞并更新状态,而不是每次都手动复制 prompt。
  • 工作台与运行时分离:Web 端负责看板、Agent、Workspace 和状态可视化;本机 daemon 负责发现本地 CLI、执行任务并把运行状态回传到平台。
  • 支持多运行时和多工作区:同一个平台可以接本地 runtime 或云端 runtime,并按 workspace 做隔离,适合团队化管理。
  • 强调能力复用:项目把 skills 视为可沉淀的团队资产,不只是这次任务用完即弃的 prompt。
  • 技术栈清晰:前端是 Next.js,后端是 Go + WebSocket,数据库是 PostgreSQL + pgvector,整体更像“agent 协作基础设施”而不是单个桌面客户端。

EnsoAI EnsoAI 是一款面向开发者的 AI 智能工作空间管理工具,通过集成 Git Worktree 与多 AI 代理,支持在同一个项目中并行处理多个分支任务。

运行时与服务

OpenHarness - Open Agent Harness OpenHarness 是一个开源 Agent Harness,核心覆盖 tool-use、skills、memory、权限治理和多 Agent 协作。它更适合放在 AI DevTools,因为它提供的是一整套 agent 基础设施,而不是某个单点应用或单一 CLI 包装。

  • 基础骨架比较完整:仓库把工具调用循环、上下文压缩、持久记忆、权限模式、Hook 和子代理协作放进同一套实现里,适合拿来理解 agent runtime 怎么搭。
  • 兼顾研究和落地:主实现基于 Python,同时带 React 终端界面,内置文件、Shell、搜索、Web、MCP 等工具能力,适合作为二次开发底座。
  • 适合接现有工作流:支持按需加载 .md skills,也强调插件生态和多代理协作,对已经在研究 Claude Code、Codex 一类 harness 的人比较有参考价值。
  • 上手门槛不高:项目提供 oh 入口和安装脚本,可以直接跑 Demo,也可以从源码安装后继续改造成自己的 harness。

Archon - AI coding workflow engine Archon 是一个面向 AI 编码代理的工作流引擎。它的重点不是“再造一个聊天界面”,而是把规划、实现、测试、审查、人工批准和 PR 提交流程写成可复用的 YAML workflow,让 agent 按固定链路执行。

  • 更像开发流程编排层:把确定性步骤、Shell 命令、git 操作和 LLM 节点串成同一条执行链,适合需要稳定产出而不是一次性 prompt 的场景。
  • 适合多任务并行:项目强调用隔离的 git worktree 跑任务,减少多个 agent 同时改仓库时互相踩踏的风险。
  • 入口比较全:除 CLI 外,也提供 Web UI,并支持从 Slack、Telegram 和 GitHub 触发工作流,适合团队协作或远程盯流程。
  • 当前主线是 v2:仓库保留了旧版 Python 任务管理 + RAG 方案的归档分支,但现在主方向已经转到通用 AI coding workflow engine。

agent-infra/sandbox - AI Agent 一体化沙箱 AIO Sandbox 是一个把浏览器、Shell、共享文件系统、MCP、VS Code Server 甚至 Jupyter 放进同一个 Docker 容器的 agent 运行时,适合需要“能看网页、能跑命令、能处理文件、还能调试”的一体化执行环境。

  • 不只是隔离执行:重点在于把浏览器下载的文件、Shell 产生的结果和代码运行环境放进同一份共享状态里,减少跨工具搬运数据的摩擦。
  • 适合 Agent 基础设施场景:如果你在搭自己的 coding agent、browser agent 或自动化 worker,这类沙箱比零散拼 Playwright + shell + volume 更成体系。
  • 内建开发接口:除了浏览器和命令执行,还带 VS Code Server、Jupyter 和 MCP,比较适合调试 agent 行为与观察运行现场。
  • 更接近运行时而非 Skill:它服务的是 agent 的执行底座,所以放在 AI DevTools 的“运行时与服务”比放到 AI SkillsAI CLI 更准确。

osaurus Osaurus 是一款专为 macOS 设计的 AI 边缘运行时,集本地与云端模型于一体。它通过 MCP 协议暴露共享工具,为 AI 应用和工作流提供了一个原生、常驻的基础平台。

relaypulse - 中转站联通性查看