AI-DevTools

这个页面收开发者向 AI 工具生态：MCP、插件、工作流、测试、记忆、工作台、运行时和服务。不以“是否是 Agent”或“是否是 CLI”划分，而是以“是否主要服务开发流程”划分。

MCP 与环境桥接

Figma-Context-MCP / Framelink MCP for Figma

一个把 Figma 设计数据翻译成 AI 编码代理更容易消费的 MCP 服务，主要面向 Cursor 一类 IDE 内 agent 场景。相比直接贴截图，它会把文件、画板或分组中的布局和样式信息做一层压缩与转换，让模型更容易一次性还原出接近设计稿的界面实现。

适合设计到代码链路：把 Figma 链接直接喂给 IDE 内 agent，再让它拉取结构化设计上下文去实现页面，而不是只靠视觉猜测。
做了上下文裁剪：不会原样把 Figma API 全量响应塞给模型，而是优先保留更相关的布局和样式信息，减少上下文噪音。
接入门槛不高：通过 npx -y figma-developer-mcp --figma-api-key=... --stdio 就能挂到大多数 MCP 客户端配置里。
更适合开发流程页：它是服务设计实现链路的基础设施，不只是单个 prompt 或设计资源，因此放在 AI DevTools 比放到 AI Skills 更合适。

midscene

Midscene.js 是一个基于视觉模型驱动的跨平台 UI 自动化框架，支持通过自然语言描述自动化任务，覆盖 Web、Android、iOS 等多种界面，并提供开发者友好的 SDK、调试工具和社区生态。

Claude Code 插件与工具链

plannotator - 可视化 CC 的运行过程
 ralph-wiggum - 自循环迭代开发

CCPlugins

oh-my-claudecode
一个面向 Claude Code 的多智能体编排插件，主打零学习曲线。安装后可以直接用自然语言触发 Team 流水线、tmux 工作者和多模型协作，而不需要手动组织复杂命令。

Team 优先编排：默认走 team-plan → team-prd → team-exec → team-verify → team-fix 阶段化流水线。
插件化接入 Claude Code：通过 /plugin marketplace add 和 /plugin install 安装，适合作为日常 Claude Code 工作台增强。
支持外部 CLI 工作者：可在 tmux 中拉起 Codex、Gemini、Claude CLI 做并行审查、UI 设计和实现任务。
面向真实开发流程：内置 setup、doctor、更新、深度访谈等命令，覆盖从需求澄清到执行验证的整套工作流。

codex-plugin-cc - 在 Claude Code 内调用 Codex
OpenAI 官方的 Claude Code 插件，让你直接在 Claude Code 工作流里调用 Codex 做代码审查或委托任务。安装后可通过 /codex:review、/codex:adversarial-review、/codex:rescue、/codex:status、/codex:result 等命令，在当前仓库里发起只读审查、挑战式审查和后台救火任务。

官方插件接入：通过 /plugin marketplace add openai/codex-plugin-cc 和 /plugin install codex@openai-codex 安装，适合已经把 Claude Code 当主工作台的用户。
审查与委托一体：既能做普通 review，也能把排查问题、尝试修复、续跑上一次任务交给 Codex。
复用本机 Codex 环境：依赖本地 codex CLI、登录态和 .codex/config.toml 配置，不额外引入一套独立运行时。
使用门槛明确：需要本机已安装 Codex、Node.js 18.18+，并用 ChatGPT 账号或 OpenAI API key 完成 Codex 登录。

claude-code-marketplace
gstack
Claude Code 的开源软件工厂，用 slash commands 组织产品、设计、评审、QA 和发布流程。
claude-code-action
claude-code-infrastructure-showcase
buildwithclaude
codex-toolkit-for-claude 在 claude 中调用 codex

工作流与测试

cc-wf-studio
CC Workflow Studio 是一款可视化 AI 工作流编辑器，支持通过拖拽或自然语言对话设计复杂的 AI 代理工作流。它可一键导出至多种 AI 代码工具，如 Claude Code、GitHub Copilot，并直接运行工作流，无需编写代码。

agent-orchestrator Agent Orchestrator 是一个面向并行 AI 编码代理的编排层，重点解决“多个 agent 同时在同一代码库里工作”时的分支隔离、任务分发、CI 回路和 review 回路问题。它给每个 agent 分配独立 git worktree、分支和 PR，再用统一面板跟踪状态。

核心价值是把多代理开发流程跑顺：issue 分配、agent 拉起、PR 创建、CI 失败回传、review 评论回传，都能在同一条链路里自动流转。
对底层代理和运行时比较中立：README 明确写了可接 Claude Code、Codex、Aider，也支持 tmux 和 Docker 一类运行时。
更像编排系统而不是单个 agent：你主要操作的是 orchestrator 和 dashboard，而不是手动盯每个终端会话。
插件位设计比较完整：agent、runtime、workspace、tracker、SCM、notifier、terminal 都能替换，适合需要长期扩展工作流的团队。

expect Expect 是一个让 AI agent 在真实浏览器里测试代码改动的工具。它会扫描未提交改动或分支 diff，生成测试计划，再驱动浏览器执行验证并输出通过或失败结果。

面向代码变更测试：直接读取 git diff 来决定测什么，不是手写固定脚本后再运行。
支持真实浏览器会话：基于 Playwright 执行，用你现有登录态验证真实用户流程，减少额外鉴权配置。
兼容 Claude 和 Codex：可以把 Claude Code 或 Codex CLI 作为生成测试计划的 agent。
适合本地与 CI：本地可用交互式 TUI 审核计划，CI 中可用 -y 跳过审核直接无头执行。

aimock aimock 是一套面向 AI 应用测试的统一 Mock 基础设施。它不是只模拟单个 LLM 接口，而是把 AI 应用真正会依赖的一整层外部能力一起替身掉，包括 LLM API、MCP、A2A、AG-UI、向量库、搜索、rerank、moderation，以及图片、语音、视频等多媒体接口。

更适合集成测试和 CI：既可以程序化嵌进测试，也可以用单独端口跑成统一 mock 服务，把 OpenAI、Claude、Gemini 一类入口一起切到本地。
覆盖 agent 真实依赖：除了模型接口，还支持 MCP tools、A2A agent、AG-UI 事件流和向量数据库，适合测试多协议、多服务的 agent 应用。
支持录制回放和漂移检测：可以代理真实 API 录成 fixtures，再稳定回放；也能在 CI 里做 drift detection，持续检查 mock 与真实供应商行为是否偏离。
对异常场景友好：支持 500、坏 JSON、流中断这类 chaos testing，适合补齐“平时最难稳定复现”的 AI 失败路径。

ralph - 基于 PRD 的自循环开发工作流 Ralph 是一个围绕 Geoffrey Huntley Ralph pattern 落地的自动化开发循环，用 Bash 脚本反复拉起新的 AI coding tool 实例，直到 prd.json 里的需求项全部完成。它支持 Amp 和 Claude Code，核心不是“长会话坚持到底”，而是“每轮都用干净上下文重新开始”，再通过 git 历史、progress.txt 和 prd.json 保持跨轮次记忆。

核心执行模型很清晰：每次迭代只做一个足够小的 story，跑实现、质量检查、提交、更新状态，然后再开一个全新 agent 继续下一轮。
适合长任务拆分：它强调 PRD item 必须小到能在单个上下文窗口内完成，否则会因为上下文耗尽导致质量下降。
记忆设计偏工程化：不依赖单个会话上下文续命，而是把长期记忆沉淀到 commit、progress.txt、prd.json 和 AGENTS.md 更新里。
带配套技能：仓库同时提供 /prd 和 /ralph 两个 skill，用来先生成需求文档，再转成适合自动执行的 prd.json。
更像“本地自治循环器”而不是通用平台：它没有做成完整工作台，而是把自主开发流程压缩成一套可直接拷进项目的脚本和 prompt 模板，适合研究 agent 如何通过小步快跑和反馈回路稳定推进任务。

Trellis - AI coding 工作流框架 Trellis 是一个把 AI 开发规范、任务上下文、项目记忆和多平台接入收进仓库的开源框架。它用 .trellis/spec/ 保存项目规则，用 .trellis/tasks/ 组织 PRD、实现上下文和检查状态，用 .trellis/workspace/ 保留个人 journal，让 Claude Code、Cursor、Codex、Gemini CLI 等工具可以复用同一套工作流。

适合把团队约定沉淀成版本化资产：编码规范、目录规则、评审习惯和流程偏好都能写进 spec，而不是散落在单次对话里。
面向多 AI coding 工具协作：同一套 Trellis 结构可以生成不同平台的接入文件，降低切换工具时重复搭流程的成本。
兼顾任务拆分和连续性：task 文件夹负责当前任务的计划与检查，workspace journal 负责跨会话记忆，适合长期项目和多人协作。
更适合放在 AI DevTools：它提供的是开发流程基础设施，不是单个 agent、单个 prompt 或单纯 CLI 包装。

记忆与状态

claude-mem Claude-Mem 是一款为 Claude Code 设计的持久化记忆压缩系统，能够自动捕获工具使用记录、生成语义摘要，并在不同会话间保持上下文连续性，从而让 Claude 在项目开发中具备跨会话的记忆能力。

claude-subconscious Claude Subconscious 是 Letta 推出的 Claude Code 后台代理插件，它会在后台观察会话 transcript、读取代码库、积累长期记忆，并在下一次提示前向 Claude 注入简短“耳语”式上下文提示。

不是静态记忆文件：它不会把内容写进 CLAUDE.md，而是通过后台 agent 持续分析会话和代码库，再按需回送提醒。
支持跨会话记忆：可在不同 session、不同项目之间共享长期记忆，弥补 Claude Code 原生会话记忆易丢失的问题。
带工具访问能力：后台 agent 可以读文件、搜索代码，甚至结合 Letta 的 Web 能力扩展上下文，不只是简单摘要。
更接近“记忆副驾驶”：适合重度 Claude Code 用户做长期项目跟踪、上下文延续和工作习惯沉淀。

客户端与工作台

CodexMonitor
CodexMonitor 是一款基于 Tauri 框架的 macOS 应用程序，用于在本地工作区中编排和管理多个 Codex 智能体。它通过侧边栏管理项目，提供主屏幕快速操作，并支持基于 Codex app-server 协议的对话视图。

happy
Happy Coder 是一个为 Claude Code 和 Codex AI 编程工具提供的移动端与网页客户端，支持端到端加密和跨设备即时切换。

hapi
HAPI 是一个本地优先的 AI 编程辅助工具，支持在本地运行 Claude Code、Codex 和 Gemini 等 AI 会话，并可通过 Web、PWA 或 Telegram Mini App 进行远程控制。

ccmate
CC Mate 是一款为 Claude Code 设计的图形化配置与管理工具，提供直观的界面来轻松设置、切换配置、监控使用情况并管理 MCP 服务器。

CodeBar - 用量统计
CodexBar 是一款专为 macOS 14+ 设计的轻量级菜单栏应用，可实时监控并显示多种 AI 服务的用量限额和重置时间。它支持多服务切换、隐私优先设计，并提供 CLI 工具和桌面小组件。

confirmo CONFIRMO 是一款桌面端 AI 编程助手，支持 macOS、Windows 和 Linux。

conductor 该工具允许用户在隔离的工作空间中并行创建 Codex 和 Claude Code 代理，实时查看其工作状态，并审核与合并代码更改。

OpenASE
OpenASE 是一个把同步交互式 AI 和异步 ticket agent 串起来的开发工作台。它把 Codex、Claude Code、Gemini 等放进同一个控制面，一边保留“边聊边想边改”的 Project AI，一边用看板加 Workflow 让异步 agent 按票据、依赖和阶段自动推进。

同步与异步一体：需求还模糊时先在 Project AI 里讨论方案、拆票、补文档；需求清晰后再交给 ticket agent 自动执行。
工作流可编排：支持看板状态流、任务依赖、并行执行和多角色接力，适合把单兵全流程或前后端、测试协作流都收进一个面板。
面向本机执行：agent 会在你的机器上跑工作流，同时保留 ticket、执行状态和结果的可追踪性。
更像 AI 开发控制台：它的核心价值是统一工作台与执行编排，不是单独的 Agent 框架或纯 CLI，所以放在 AI DevTools 比放到 AI Agents 更准确。
收录来源：GitHubDaily #787

Multica - 托管式 AI Agent 开发平台 Multica 是一个把 coding agent 变成“团队成员”的开源托管平台。它不只是起一个 agent 跑任务，而是把 issue 分配、状态流转、实时进度、运行时调度和技能沉淀都放进同一套工作台里，适合把 Claude Code、Codex、OpenClaw、OpenCode 这类 agent 真正纳入研发协作流程。

任务分配方式接近人类协作：你可以像给同事派单一样把 issue 指给 agent，agent 会领取任务、执行、汇报阻塞并更新状态，而不是每次都手动复制 prompt。
工作台与运行时分离：Web 端负责看板、Agent、Workspace 和状态可视化；本机 daemon 负责发现本地 CLI、执行任务并把运行状态回传到平台。
支持多运行时和多工作区：同一个平台可以接本地 runtime 或云端 runtime，并按 workspace 做隔离，适合团队化管理。
强调能力复用：项目把 skills 视为可沉淀的团队资产，不只是这次任务用完即弃的 prompt。
技术栈清晰：前端是 Next.js，后端是 Go + WebSocket，数据库是 PostgreSQL + pgvector，整体更像“agent 协作基础设施”而不是单个桌面客户端。

OpenClaw Dashboard OpenClaw Dashboard 是一个轻量级 Web 仪表盘，用来集中查看 OpenClaw 的 Bots、Agents、Models 和 Sessions 状态。它直接读取 ~/.openclaw/openclaw.json 和本地会话文件，不依赖数据库，适合监控多平台 Agent、模型配置、Gateway 健康、Token 消耗和会话连通性。

更适合放在 AI DevTools 的“客户端与工作台”：它服务的是 OpenClaw Agent 生态的可视化管理，不是新的 Agent 框架。
功能覆盖机器人总览、模型列表、会话管理、统计图表、技能管理、告警中心和平台连通测试，还带一个像素办公室视图。

EnsoAI EnsoAI 是一款面向开发者的 AI 智能工作空间管理工具，通过集成 Git Worktree 与多 AI 代理，支持在同一个项目中并行处理多个分支任务。

运行时与服务

Personal AI Infrastructure - PAI PAI 是 Daniel Miessler 做的个人 AI 基础设施。它不是再造聊天客户端，而是在 Claude Code 之上搭一套“Life Operating System”：把个人目标、身份、偏好、记忆、Skills、Hooks、工作流和本地 Pulse Dashboard 串起来，让 Digital Assistant 能长期理解用户并持续改进。

更适合放在 AI DevTools 的运行时与服务：它提供的是个人 AI 操作系统底座，而不是单个 Agent、Prompt 或 CLI。
Claude Code native：依赖 Claude Code 的 hooks、上下文和 agentic 能力，同时补上记忆、routing、skills、自我改进和身份层。
偏文本化基础设施：强调 Markdown、文件系统、rg 和可读状态，尽量避免把个人上下文锁进不透明存储。
有完整执行链路：v5.0.0 引入 Pulse daemon、DA identity、Algorithm 七阶段循环、ISA 文档原语、45 个 skills、171 个 workflows 和 37 个 hooks。
适合参考个人 AI 工作台怎么组织长期上下文、目标系统、验证回路和可安装能力，也适合作为 Claude Code 深度定制样本。

OpenHarness - Open Agent Harness OpenHarness 是一个开源 Agent Harness，核心覆盖 tool-use、skills、memory、权限治理和多 Agent 协作。它更适合放在 AI DevTools，因为它提供的是一整套 agent 基础设施，而不是某个单点应用或单一 CLI 包装。

基础骨架比较完整：仓库把工具调用循环、上下文压缩、持久记忆、权限模式、Hook 和子代理协作放进同一套实现里，适合拿来理解 agent runtime 怎么搭。
兼顾研究和落地：主实现基于 Python，同时带 React 终端界面，内置文件、Shell、搜索、Web、MCP 等工具能力，适合作为二次开发底座。
适合接现有工作流：支持按需加载 .md skills，也强调插件生态和多代理协作，对已经在研究 Claude Code、Codex 一类 harness 的人比较有参考价值。
上手门槛不高：项目提供 oh 入口和安装脚本，可以直接跑 Demo，也可以从源码安装后继续改造成自己的 harness。

Archon - AI coding workflow engine Archon 是一个面向 AI 编码代理的工作流引擎。它的重点不是“再造一个聊天界面”，而是把规划、实现、测试、审查、人工批准和 PR 提交流程写成可复用的 YAML workflow，让 agent 按固定链路执行。

更像开发流程编排层：把确定性步骤、Shell 命令、git 操作和 LLM 节点串成同一条执行链，适合需要稳定产出而不是一次性 prompt 的场景。
适合多任务并行：项目强调用隔离的 git worktree 跑任务，减少多个 agent 同时改仓库时互相踩踏的风险。
入口比较全：除 CLI 外，也提供 Web UI，并支持从 Slack、Telegram 和 GitHub 触发工作流，适合团队协作或远程盯流程。
当前主线是 v2：仓库保留了旧版 Python 任务管理 + RAG 方案的归档分支，但现在主方向已经转到通用 AI coding workflow engine。

agent-infra/sandbox - AI Agent 一体化沙箱 AIO Sandbox 是一个把浏览器、Shell、共享文件系统、MCP、VS Code Server 甚至 Jupyter 放进同一个 Docker 容器的 agent 运行时，适合需要“能看网页、能跑命令、能处理文件、还能调试”的一体化执行环境。

不只是隔离执行：重点在于把浏览器下载的文件、Shell 产生的结果和代码运行环境放进同一份共享状态里，减少跨工具搬运数据的摩擦。
适合 Agent 基础设施场景：如果你在搭自己的 coding agent、browser agent 或自动化 worker，这类沙箱比零散拼 Playwright + shell + volume 更成体系。
内建开发接口：除了浏览器和命令执行，还带 VS Code Server、Jupyter 和 MCP，比较适合调试 agent 行为与观察运行现场。
更接近运行时而非 Skill：它服务的是 agent 的执行底座，所以放在 AI DevTools 的“运行时与服务”比放到 AI Skills 或 AI CLI 更准确。

osaurus Osaurus 是一款专为 macOS 设计的 AI 边缘运行时，集本地与云端模型于一体。它通过 MCP 协议暴露共享工具，为 AI 应用和工作流提供了一个原生、常驻的基础平台。

relaypulse - 中转站联通性查看