Published on

2026-第八周

Authors

该周报主要为各个地方内容的汇总整理

技术

AGENTS.md 在我们的代理评估中表现优于技能 - Vercel

我们原本期望通过技能(skills)来教授 AI 编程助手框架知识,但测试发现,将压缩的文档索引直接嵌入 AGENTS.md 文件实现了 100% 的通过率,而技能方法即使在明确指令下最高也只有 79%。被动上下文之所以优于按需检索,主要因为消除了代理的决策点、确保信息始终可用,并避免了顺序问题。

  • 🧠 技能未被可靠触发:在 56% 的测试案例中,代理从未调用技能,导致表现与无文档时相同。
  • 📝 明确指令提升有限:添加使用技能的指令后,通过率提升至 79%,但效果受措辞影响大,显得脆弱。
  • 🏆 AGENTS.md 表现卓越:嵌入压缩文档索引的方法在测试中达到 100% 通过率,全面优于技能方法。
  • 🔍 消除决策点优势:被动上下文让代理无需决定是否查阅文档,信息始终可用,避免了检索顺序问题。
  • 📦 高效压缩处理:文档索引被压缩 80% 至 8KB,通过管道分隔结构指向外部文件,既节省上下文又保持效果。
  • 🛠️ 实际应用简便:通过npx @next/codemod@canary agents-md命令可自动为 Next.js 项目设置 AGENTS.md。
  • ⚖️ 技能仍有特定价值:技能适用于垂直的、用户明确触发的操作,如版本升级或迁移任务。
  • 🧪 测试与设计建议:应针对训练数据中未包含的 API 构建评估,并设计便于代理检索的文档结构。

工具

GitHub - Blazity/next-migration-skills

这是一个用于将 Next.js 项目从 Pages Router 迁移到 App Router 的代理导向工具包,包含多个技能模块,旨在通过 AST 分析和转换工具自动化迁移过程。

  • 🛠️ 核心工具包:提供 AST 分析和转换工具(ts-morph),是所有其他技能的基础依赖
  • 📊 迁移评估:分析代码库复杂性和迁移准备情况
  • 📋 迁移规划:创建分阶段迁移计划
  • 🔗 依赖映射:将旧依赖映射到 App Router 等效项
  • 🛣️ 路由转换:将 pages/路由转换为 app/路由结构
  • ⚛️ 组件迁移:迁移组件以实现 RSC 兼容性
  • 📡 数据层迁移:迁移数据获取和 API 路由
  • 验证测试:在每个阶段后验证正确性

更新

发布 styled-components@6.3.0 · styled-components/styled-components · GitHub

styled-components 6.3.0 版本发布,主要增加了对 React Server Components (RSC) 的原生支持,无需额外配置即可在 RSC 环境中自动处理 CSS 注入。同时扩展了内置 HTML 和 SVG 元素别名,并修复了 TypeScript 中对 CSS 自定义属性的类型支持。

  • 🚀 新增 React Server Components (RSC) 支持:自动检测 RSC 环境,无需 'use client' 指令,CSS 以内联样式标签注入并由 React 19 自动优化。
  • 🧩 扩展元素别名:新增对现代 HTML(如 searchslot)和 SVG 元素(如 feBlendlinearGradient)的样式支持。
  • 🔧 修复 TypeScript 类型:现在完全支持在 style 属性和 .attrs 中使用 CSS 自定义属性(CSS 变量)。
  • ⚙️ 更新构建工具:共享 CSS 属性处理工具已更新至最新版本。

设计

AI

其他

工程成熟度即所需——nilenso 博客

构建可靠 AI 应用的关键在于工程成熟度,而非模型选择或提示技巧。它强调通过文档化、测试、可观测性和评估等传统软件实践,建立系统化流程来持续发现和改进 AI 系统行为,从而实现快速迭代与可靠交付。

  • 📝 工程成熟度指团队通过短期决策确保长期可靠交付的能力,对 AI 应用而言,这意味着构建支持“发现”而非“设计”的基础设施。
  • 🔄 AI 工程是经验性的,无法通过演绎推导最佳方案,必须依赖结构化实验来发现有效的提示、工具架构和用户交互模式。
  • 📊 可观测性不是后期功能,而是发现过程的仪表盘,需记录完整的 LLM 交互、用户会话追踪和上下文内容,否则调试如同盲人摸象。
  • 🧪 评估(Evals)是 AI 应用的遥测系统,通过测试用例和评分机制记录团队发现、定义产品行为,并防止回归。
  • 🗂️ 数据集是积累“有效与无效经验”的核心资产,而非单纯训练材料,需随产品迭代不断丰富。
  • 🪜 工程成熟度分为五级:原型(混乱依赖个人经验)、文档化可重复流程、规范测试验证、系统化测量、持续优化飞轮。
  • 📚 文档(PRD、技术设计、ADR)是仅次于代码的重要产出,为团队和编码代理提供上下文与项目记忆。
  • 🚀 持续部署应自动化且无风险,频繁小批次发布才能快速定位问题,支撑 AI 所需的快速实验循环。
  • ⚙️ AI 应用仍需测试确定性部分(工具实现、API 集成),避免因聚焦 LLM 而忽略基础代码质量。
  • 🔁 成熟团队构建“飞轮”:部署→观察用户交互→识别成败→更新评估集与案例库→改进系统,形成持续强化循环。

升职的秘诀 | 比约格

晋升的关键在于先赢得情感上的信任,再以实际表现佐证。公司通常要求员工在晋升前已承担下一级别的工作,但明确的职级标准往往难以界定。即便遵循所有规则,晋升决策仍常基于信任感;若未获晋升,反思信任缺失可能比纠结规则更重要。虽然存在因偏好、机遇等非信任因素晋升的情况,但这往往带来后续问题。若无晋升机会,可专注个人成长或通过基础工作逐步建立信任。

  • 🎯 晋升本质是情感决策:如同陪审团凭情感裁决后寻找证据支持,晋升也需先赢得信任,再提供工作证明
  • 🤝 建立信任方式多样:可通过承担更大项目、提升工作能见度、专注完成关键任务或改善沟通等方式实现,需根据自身情况选择合适策略
  • 👁️ 能见度与政治的平衡:若优秀工作未被知晓,需主动展示甚至参与办公室政治;若已被认可但被视为阻碍,则应专注本职避免纷争
  • 📈 普遍采用“提前胜任”晋升模式:员工需先展现下一职级能力(如 L2 完成 L3 工作)约六个月,晋升实为对已有表现的追认
  • 📊 职级标准存在模糊性:即便有职业阶梯文件,对“大型项目”“深度理解”等概念的定义仍依赖主观判断
  • 🔑 信任常比规则更重要:九成情况下获得信任即获晋升,规章制度多用于合理化已做出的情感决策
  • ⚠️ 非信任晋升的风险:因 CEO 青睐、岗位空缺或资历获得的晋升可能引发后续问题,如能力不匹配或重大失误
  • 🌱 无机会时的应对策略:在公司停滞时可考虑离职,也可转向个人成长或通过基础工作积累信任资本
  • 👥 关键信任对象:直属上司最为重要,其次包括部门负责人、高管及拥有软权力的意见影响者
  • ⚖️ 复杂制度的双刃剑:过度细化的晋升标准可能被忽视,反而加剧偏见,且易陷入教条主义(如用时间分配衡量战略价值)