本文是「企业研发 AI 自动化」系列第 32 篇。讨论的论文是《To Run or Not to Run: Analyzing the Cost-Effectiveness of Code Execution in LLM-Based Program Repair》，2026 年 6 月 25 日提交到 arXiv，已被 ISSTA 2026 接收。它关注的是一个很多团队都会遇到的问题：在 LLM-based program repair 里，让 Coding Agent 频繁执行测试，究竟能带来多少修复收益，又会消耗多少 token、时间和环境成本。

AISoftware Engineeringprogram repair

#50

2026-07-06 周一文章

Signal #19：AI 工具越来越多，团队要开始管起来了

本文是「每周 Signal｜AI × SE」第 19 期。本期关注：AI 工具从“个人选择”走向“团队管理”。当模型、Agent、网关和执行环境越来越多，研发团队真正要解决的，不只是哪个工具好用，而是如何把这些 AI 能力调度成稳定、可控、可度量的研发能力。

AISoftware Engineeringteam management

#49

2026-06-29 周一文章

Signal #18：Coding Agent，从 IDE 走进研发系统

本文是「每周 Signal｜AI × SE」第 18 期。本周关注：Coding Agent 的任务入口正在发生变化。它不再只是开发者在 IDE、CLI 或云端任务界面里主动唤起的工具，而是开始被 Jira、Notion、Slack、PR、Review 等真实研发系统调用，成为任务执行链路的一部分。

AICoding AgentSoftware Engineering

#48

2026-06-27 周六文章

字节 AI Coding 到 90%，反而看清了软件工程

最近读到字节跳动技术副总裁洪定坤分享的《AI Coding 的实践与探索》，最触动我的不是“AI 写了多少代码”，而是那组看起来有点反直觉的数据：TRAE 团队超过 90% 的代码由 AI 生成，但人均需求吞吐率提升约 60%。这不是在证明 AI Coding 不行，恰恰相反，它说明 AI Coding 已经用得足够深，真实的软件工程问题开始浮出水面了。

bytedanceai-codingsoftware-engineering

#47

2026-06-26 周五文章

Figma 转代码，为什么总是差最后一公里？

最近看到一篇论文 Figma2Code: Automating Multimodal Design to Code in the Wild，ICLR 2026，作者团队来自华中科技大学、浙江大学、马里兰大学、UIC 等机构。论文关注的是 Design-to-Code，也就是我们常说的 D2C / 设计转代码。它不是单纯研究“截图转 HTML”，而是把 Figma 文件里的 metadata、assets、screenshot 一起作为输入，尝试评估真实设计稿到前端代码的自动化生成能力。论文链接：https://arxiv.org/abs/2604.13648 代码仓库：https://github.com/CGCL-codes/naturalcc/tree/main/examples/figma2code 数据集：https://huggingface.co/datasets/xcodemind/Figma2Code 这篇文章想借这篇论文讨论一个更现实的问题：Figma 转代码看起来已经很近了，为什么进入真实工程后，还是总差最后一公里？

FigmaD2CDesign-to-Code+2

#46

2026-06-22 周一文章

Signal #17：Agent 开始进入组织系统

本文是「每周 Signal｜AI × SE」第 17 期。上周我们说，Coding Agent 开始有了工作现场。它不再只是一次聊天里的代码建议，而是开始有 session、workspace、logs、review 和可接管的执行过程。这周的信号更进一步：当 Agent 有了工作现场之后，它还要进入组织系统。

#45

2026-06-20 周六文章

端到端研发自动化，为什么不能只靠 Workflow 或 SDD

Workflow 能把流程组织起来，SDD 能把规格表达清楚，但端到端研发自动化真正困难的地方，不只是“任务如何被描述”，也不是“步骤如何被编排”，而是 Agent 如何在真实研发现场里被承载、被观察、被验证、被接管，并在一次次失败和修正中持续收敛。

WorkflowSDDAI Agent

#44

2026-06-19 周五文章

AI Agent 为什么看起来很忙，却做不好真实工作

最近读到一篇来自上海交通大学、字节跳动等机构的论文《Workspace-Bench 1.0: Benchmarking AI Agents on Workspace Tasks with Large-Scale File Dependencies》。它不是评估 Agent 会不会读一个文件、总结一份文档，或者调用一个工具，而是把 Agent 放进一个更接近真实工作的环境里：大量文件、多种格式、历史版本、隐含关系、跨文件依赖，以及需要完成的真实任务。论文地址：https://arxiv.org/abs/2605.03596 这篇文章想讨论的不是一个新的 Benchmark 本身，而是它背后暴露出的更大问题：AI Agent 真正进入工作场景后，难点不只是“能不能打开文件”，而是能不能理解一个人的工作空间。

AI AgentWorkspaceDependency Graph

#43

2026-06-18 周四文章

Spec 也会骗人：AI Coding 为什么一进真实仓库就翻车

最近读到一篇论文《Spec Kit Agents: Context-Grounded Agentic Workflows》，讨论的是 AI Coding Agent 在真实仓库中为什么会出现“上下文失明”：它能写 Spec、Plan 和 Tasks，但这些中间产物仍然可能引用不存在的 API、错误理解仓库结构，或者违反已有架构约定。论文地址：https://arxiv.org/abs/2604.05278 这篇文章不是逐段翻译论文，而是借它讨论一个更现实的问题：AI Coding 真正进入工程化之后，难点不只是生成代码，而是让需求、方案、任务、代码和验证都能被真实仓库校准。

AI CodingSpecEngineering+1

#42

2026-06-15 周一文章

Signal #16：AI Coding 的下一站，是可接管的工作现场

本文是「每周 Signal｜AI x SE」第 16 期。本周关注：Coding Agent 的产品形态正在从 Chat 走向 Session。它不只要生成代码，还要留下可追踪、可审查、可接管的工作现场。

AI CodingCoding Agent工作现场+1

#41

2026-06-10 周三文章

第一个学会新器物的人，后来去哪里了？｜新器物志

新器物志｜第一个会用规矩匣的人永和木作来了一个会教人做活的匣子。第一个学会它的人，以为自己走在了前面，后来才知道，他只是先被推到了中间。

新器物志Agent

#40

2026-06-09 周二文章

Signal #15：Agent 开始进入团队账本

当 Agent 从个人尝鲜进入团队规模使用，AI Coding 的问题就不再只是能力问题，也开始变成成本问题、治理问题和 ROI 问题。本文尝试回答一个更现实的问题：Agent 的账，应该怎么算。

AI CodingAI AdoptionAI Metrics+2

#39

2026-06-05 周五文章

AI 写代码越来越快，为什么交付还是反复返工？

AI Coding 让代码生成越来越快，但交付中的返工，往往不是从代码阶段才开始。更早之前，产品意图、体验表达、工程约束和验证标准，已经在不同产物之间被反复交接、解释和补全。 AI 时代真正需要重构的，可能不是某一份 PRD 或设计稿，而是产设研围绕同一个交付项连续协作的方式。

AI CodingSDD(Spec-Driven Development)产品交付+3

#38

2026-06-01 周一文章

Signal #14：别只看出码率了，AI Coding 的指标正在变

代码生成越来越多，不代表研发效率一定同步提升。当 AI IDE 和 Coding Agent 开始进入真实研发流程，企业需要的，已经不只是“出码率”这一类代码层指标。

AI CodingAI AdoptionAI Metrics+2

#37

2026-05-29 周五文章

当大厂人开始等裁员补偿，组织真正失去的是什么

等裁员补偿不是错。对很多个体来说，这是不确定环境下非常现实的风险管理。但当一个组织里越来越多人开始等待裁员补偿，它就不再只是个人选择，而是一种组织信号。真正值得警惕的，不是有人在等，而是一个组织让越来越多人觉得：等待比行动更划算。

组织调整裁员补偿组织信任+2

#36

2026-05-28 周四文章

新器物志｜账户先生说省下了二十个人

《新器物志》第二篇。万色坊来了一只会算人的算盘。它算得很清楚，只是不知道颜色什么时候才算入了骨。

新器物志百工镇量工算盘

#35

2026-05-27 周三文章

新器物志｜百工镇来了会写字的笔

《新器物志》第一篇。百工镇来了一支会替人落字的笔，后来大家都学会了说体面话，却越来越说不清自己的意思。

新器物志百工镇自鸣笔

#34

2026-05-25 周一文章

Signal #13：AI Coding 的下一站，是失败与反馈链路的自动化

过去讨论 AI Coding，很多注意力都放在“AI 能不能写出第一版代码”上。但本周几个产品变化放在一起看，一个更值得记录的变化开始出现：Agent 正在进入代码生成之后的失败、反馈与返工链路。 AI Coding 的下一阶段，可能不只是继续追求首稿生成得更快，而是把 CI 失败、Review 反馈、Issue 分诊和工单状态，变成 Agent 持续推进任务的输入信号。

AI CodingCI FailureCode Review+2

#33

2026-05-24 周日文章

别让 Skill 变成新的文档债：从经验沉淀到行为回归

写给 Agent 看的经验，如果不能被测试，最后也会变成新的文档债。 Skill 的价值，不只在于它能沉淀多少经验，而在于它能否稳定影响 Agent 的行为。当 Skill 开始成为 Agent 执行链路里的核心资产，我们真正要问的就不再只是“如何写好 Skill”，而是“如何测试 Skill”。

AgentSkillRegression+1

#32

2026-05-23 周六文章

AI 让所有人都能干一点别人的活，但这不代表专业消失了

AI 正在让很多岗位获得跨职能的局部产出能力：产品能搭页面，设计能做可运行原型，业务能做数据看板，研发也能更早参与需求澄清、原型验证和交互讨论。所以，岗位边界确实变模糊了。但一旦这些产物进入真实企业系统，权限、组件、数据、仓库、环境、验证和责任这些边界会重新显现出来。这篇文章想讨论的是：AI 到底模糊了什么，又没有模糊什么。

AI ImpactProfessionalismAI Opportunity+1

#31

2026-05-21 周四文章

对话不是工作台：AI Agent 真正缺的不是聊天窗口

当 Agent 只是回答问题时，Chat 是最自然的入口。但当 Agent 开始理解目标、调用工具、修改系统、验证结果，真正需要承载的就不再是一串对话，而是一个可以被组织、跟踪、验证和接管的任务空间。真正的变化，不是 Chat 消失，而是 Chat 从工作台退回入口。

AI AgentAgent InterfaceTask Workspace+2

#30

2026-05-20 周三文章

AI 到底能不能从零写软件？ProgramBench 和 RepoZero 给出了两种答案

前段时间，我写过一篇关于 ProgramBench 的文章《Meta 做了个实验：让 AI 从零重建软件，结果全军覆没》。它讨论的是：只给一个程序和文档，AI 能不能从零重建一个真实软件？最近，RepoZero 又从另一个角度切进了同一个问题：如果给 Agent API 规格、隐藏测试和可验证的 oracle，它能不能从零复刻一个仓库的行为？这两篇论文看起来像是在给出不同答案，但我更愿意把它们放在一起看：它们不是简单的互相反驳，而是在共同说明一件事——AI Coding 的瓶颈，正在从“会不会写代码”，转向“任务能不能被表示，行为能不能被验证，系统能不能在反馈中收敛”。

AI CodingProgramBenchRepoZero+3

#29

2026-05-19 周二文章

AI 会写代码之后，企业还需要什么样的新人？

最近 HR 找我聊了一个问题：在 AI 快速发展的背景下，今年的校招生培养方案应该怎么设计？这个问题看起来是在问“新人怎么培养”，但我听到的其实是另一个问题：当 AI 已经可以写代码之后，企业还需要什么样的新人？

AI 时代招聘校招生培养AI Coding+3

#28

2026-05-18 周一文章

Signal #12：Coding Agent 正在拥有自己的运行时｜AI Coding 的界面，不再只是聊天框

最近一周，VS Code、GitHub Copilot、Cursor、OpenAI Codex 都出现了一类相似变化：它们不再只是把 Agent 放进聊天框或 IDE 插件里，而是在为 Agent 提供独立的运行空间、会话视图、远程环境和过程控制能力。这意味着，Coding Agent 正在从“被调用的功能”，变成“可运行、可观察、可恢复、可管理的执行单元”。 AI Coding 的核心界面，可能不再只是编辑器里的聊天框，而会逐渐变成一个 Agent 执行控制台。

AI CodingAgent RuntimeCoding Agent+2

#27

2026-05-15 周五文章

AI 会写 Native 之后，跨端框架还重要吗？

AI 时代，跨端框架的价值不会消失，但它的价值来源正在变化。过去，企业选择 RN、Flutter、小程序、Hybrid，很大程度上是为了“一套代码，多端运行”，本质是在降低人力成本和重复开发成本。但当 AI 开始可以生成 Swift、Kotlin、Java、Objective-C、Compose、SwiftUI 代码之后，“写两端代码”这件事的成本确实下降了。于是一个新的问题出现了：如果 AI 已经能写 Native，企业还需要跨端框架吗？我的判断是：AI 会削弱跨端框架过去“节省人力”的叙事，但不会消灭跨端。因为企业真正要优化的，从来不只是代码量，而是表达、协作、验证和长期维护的系统成本。

AI 时代跨端框架Native 开发+3

#26

2026-05-14 周四文章

AI 时代，组织最该警惕的不是人才离开

人才离开往往不是问题的开始，而是问题的结果。在更早之前，组织的反馈系统可能已经开始变慢：识别新能力变慢，授权变慢，资源配置变慢，激励兑现变慢，把个人实践转成组织资产也变慢。 AI 时代真正值得警惕的，不只是人才有没有留下来，而是组织能不能及时看见、承接并放大那些正在出现的新能力。

AI 时代人才流动组织反馈+3

#25

2026-05-10 周日文章

别急着说 AI Native 组织，先让关键链路形成闭环

AI Native 不只是用了更多 AI 工具。它更深层的变化，是公司运行方式是否开始被 AI 重新组织。对从零开始的创业公司来说，AI Native 可能是一种“出生方式”；但对大多数既有企业来说，它更可能先表现为一种“链路改造方式”。组织不是一开始就被整体重写的。它往往先从一段关键链路的信息流、执行权、验证方式和反馈闭环开始变化。

AI NativeAgent组织结构+3

#24

2026-05-08 周五文章

Meta 做了个实验：让 AI 从零重建软件，结果全军覆没

Meta 最新论文 ProgramBench 提出了一个极具挑战性的 AI Coding Benchmark：不给源码，只给程序和文档，让模型从零重建完整软件系统。结果是： 200 个真实项目、9 个顶级模型、完整解决率 0%。AI Coding 的问题，开始从“代码生成”进入“系统重建”。

AI Coding软件工程ProgramBench+3

#23

2026-05-06 周三文章

AI Coding 别等写完再测：从输入到黑盒验收的验证分层

当 AI Coding 开始从“生成代码”走向“参与交付”，验证就不能再被理解为最后加上的一道测试关卡。在端到端自动化里，验证需要被拆成一套分层系统：前面验证输入是否可执行、任务是否被稳定表达；中间验证 Agent 是否真的完成了目标变更、代码是否能进入工程体系；后面再验证交互、视觉、回归风险与人工验收点。只有当这些验证层次被组织起来，AI 研发自动化才可能从“能生成代码”，走向“能稳定交付结果”。

AI Coding验证任务表达+2

#22

2026-05-04 周一文章

AI Coding 的上半场是生成，下半场是验证？AI 代码被采纳，不代表需求可验收

AI Coding 最先降低的，是写代码的成本。但它很快带来另一个问题：代码生成得越快、越多，谁来确认这些实现结果是可接受的？很多团队最早感受到这个问题，不是在生成阶段，而是在 Review 阶段。 AI 可以很快生成一大段代码，但如果每一次都要研发人员逐行读完，再判断有没有问题、能不能合入，那种体验并不轻松，甚至有点反人性。这意味着，AI Coding 的上半场，是让代码可以被生成、被采纳。 AI Coding 的下半场，是让生成结果可以被验证、被修正，并最终进入稳定的工程闭环。

AI Coding代码生成验证+2

#21

2026-04-27 周一文章

从工单到交付：数字员工开始承接一类 L0 需求

很多 L0 需求真正耗时的，并不是编码本身，而是围绕交付产生的一整套工程动作：查工单、绑分支、拉仓库、提 PR、跑部署、做验证。数字员工的价值，也不只是帮忙改几行代码，而是开始把这类需求从工单到交付的完整链路接过去。

数字员工L0 需求工单+2

#20

2026-04-23 周四文章

AI 时代，不是所有业务诉求都该进入研发系统

AI 时代，真正变化的，不只是研发如何更快写代码，而是业务诉求不再默认都要先翻译成研发需求。有些问题应该先被澄清，有些应复用已有 Skill，有些适合由 NoCode 吸收，只有其中一部分，才真正需要进入研发系统。因此，在“需求分层”之前，实际上先出现了一层更上游的分流机制：业务诉求的路由层。

AI 时代业务诉求研发系统

#19

2026-04-18 周六文章

All You Need Is Skill：端到端自动化的 MVP 闭环是如何跑起来的

这篇文章不讨论端到端自动化的最终形态，而是回到 MVP 阶段，讲清楚我们如何用 Skill 把多源输入、项目知识、任务建模、代码生成和 Review 组织成一个真正可运行的系统。它不是终局，却第一次让闭环成立。

AI Coding端到端自动化软件研发+1

#18

2026-04-17 周五文章

当大家开始谈 Harness 时，我们真正该理解的是什么？从 Representation 到 Harness，再到 System，AI 研发正在进入新的一套系统分层

当 AI 开始真正“干活”，问题就不再只是模型够不够强，而是任务是否被稳定表达、执行是否能够持续、结果是否能够进入系统闭环。最近业界开始频繁讨论 Context、Harness、Environment Engineering，这些词看似分散，背后其实指向同一个变化： AI 落地的竞争，正在从模型能力，走向系统组织能力。

企业研发 AI 自动化软件研发研发流程+2

#17

2026-04-11 周六文章

90% 出码率是怎么来的？我们如何把研发任务组织成可运行的自动化链路

90% 出码率，不是因为 AI 已经可以直接“理解需求”，而是因为需求在进入执行前，先被组织成了系统可以接住的任务。真正开始成立的，也不是一次更成功的 AI Coding，而是一条从多源输入、任务表达、执行编排到验证闭环的自动化链路。如果说上一篇回答的是“链路开始成立了吗”，那这一篇要回答的，是“这条链路到底是怎么被搭起来的”。

AI Coding端到端自动化软件研发+2

#16

2026-04-09 周四文章

AI 正在制造一批“伪专家”｜当“会讲”变得越来越容易，组织该如何重新判断谁值得被相信

生成式 AI 放大的，不只是效率，也不只是表达能力。它真正带来的一个新问题是：当“像专家一样说话”变得越来越容易，组织必须重新判断，谁只是讲得清楚，谁真正做成过、跑通过，并且还能再做一遍。当“看起来正确”变得越来越廉价，真正跑通过的经验，反而会重新变贵。

expertiseorganizational judgmentorganizational trust

#15

2026-04-04 周六文章

出码率到 90% 之后，我们真正验证了什么？端到端自动化的第一次真实落地

端到端自动化的关键，已经不再是单点生成能力，而是研发任务能否在真实业务约束下，被稳定地表达、执行与验证。我们真正验证的，不是一段代码能不能被生成，而是一条面向真实业务研发的端到端自动化链路，是否已经开始成立。

AI Coding端到端自动化软件研发+1

#14

2026-03-27 周五文章

当网站开始为 Agent 提供接口，Web 的交互边界正在改变｜从 WebMCP 看网页如何从“界面”走向“能力入口”

当网站开始主动向 Agent 暴露可调用能力时，网页的角色就开始变化了。它不再只是一个等待人类点击的界面，也开始成为一个可以被理解、被调用、被编排的能力入口。 WebMCP 的意义，不在于它今天已经多成熟，而在于它让一件事情变得非常具体： Web，正在为 Agent 重写交互接口。

Web MCPAI Agent网页能力

#13

2026-03-25 周三文章

为什么 Spec 不是终点，而只是中间产物？软件研发正在从 Spec 驱动，走向表示驱动（RDD）

当执行不再稀缺时，软件研发的核心问题不再是“如何实现”，而是“如何让任务被系统准确表达”。 Spec 并不能解决这个问题，它只是一个开始。

企业研发 AI 自动化软件研发研发流程+1

#12

2026-03-20 周五文章

当 GUI 让位于 Agent，软件为什么走向“系统”

软件工程的变化，很少从某一个具体技术点开始显现。更多时候，是从一些具体的使用体验中，逐渐累积出来的。当这些变化被放在一起看时，软件的形态，开始呈现出不同的方向。

软件系统GUIAgent

#11

2026-03-17 周二文章

为什么 PRD + 设计稿，无法支撑 AI 时代的研发协作？当 AI 开始参与研发流程：产设研协作可能会如何变化？

随着 AI 开始参与软件研发流程，一些变化正在逐渐显现。在实际推进研发自动化的过程中，我们发现，影响并不只发生在“代码生成”这一层，更早出现在需求、设计与实现之间的协作方式上。这篇文章基于一次真实的企业实践，尝试讨论一个具体问题：当执行者开始从人扩展到系统时，产设研之间的协作，是否需要重新定义？

AI软件研发研发流程+3

#10

2026-03-16 周一文章

当 AI 开始参与开发：软件研发为何会走向 Agent 协作｜从人类协作到 Agent 协作系统

当执行者开始改变之后，软件研发的协作对象也在发生变化。从人类之间的分工，到人类与 Agent 的协同执行，一种新的研发协作结构正在逐渐形成。

企业研发 AI 自动化软件研发研发流程

2026-03-15 周日文章

信息越来越多，但我们真的更理解技术了吗？| 从信息流到主题结构

技术变化很少直接来自信息本身，它往往是在主题不断聚合之后才逐渐显现。

技术观察系统技术观察技术趋势

2026-03-10 周二文章

从设计稿到生产代码：小红书如何用多阶段流水线自动化客户端开发

从设计稿到生产代码：小红书如何用多阶段流水线自动化客户端开发 📋 论文信息 - 标题: Production-Grade AI Coding System for Client-Side Development - 作者: Ruihan Wang, Chencheng Guo,

AI Coding客户端开发多阶段流水线+2

2026-03-07 周六文章

AI 时代，重新理解成长｜一份持续 260 期技术小报背后的技术观察

从持续 260 期的技术小报，到 AI 时代的软件工程观察。这篇文章记录了一段技术人与技术变化共同成长的过程：从整理信息，到观察趋势，再到参与 AI 研发自动化实践。也是我在 AI 时代重新理解"成长"的一次回望。

AI 时代技术观察成长

2026-03-03 周二文章

当 AI 开始参与开发之后，软件工程正在重新学习“如何表达”

软件工程的下一阶段，不是更快地实现，而是让理解成为结构。 ——为什么端到端自动化最终会走向中间表示（IR）

企业研发 AI 自动化软件研发研发流程

2026-02-28 周六文章

问题也许不在 AI：软件研发开始适应新的执行者

当 AI 开始承担越来越多执行工作时，软件研发真正发生变化的，或许并不是效率本身，而是“困难出现的位置”。这篇文章尝试解释一种正在出现却尚未被明确描述的现象：研发瓶颈，正在悄然迁移。

企业研发 AI 自动化软件研发研发流程

2026-02-25 周三文章

我们可能一直误解了 AI 对软件研发的影响

当 AI 开始参与开发，真正改变的或许不是效率，而是软件研发中“谁在决定事情如何发生”。

企业研发 AI 自动化软件研发研发流程

2026-02-14 周六文章

企业研发 AI 自动化能力结构框架（v0.1）：从工具增强到端到端自动化的结构路径

写在前面：当 AI 开始进入软件研发，讨论往往集中在模型能力与生成效果上。但在企业真实环境中，自动化能否成立，更多取决于组织是否具备支撑 AI 长期运行的结构能力。本文提出一个 L1–L4 的企业研发 AI 自动化能力框架，尝试回答三个问题： + “企业当前处在哪个自动化阶段？” + “为什么多数团队难以进入下一阶段？” + “从局部提效走向端到端自动化，需要补齐哪些结构能力？” 文章结合行业趋势与实践观察，给出控制权迁移模型、自动化断点地图与能力自测视角，作为理解与讨论企业研发自动化的一种结构工具。

企业研发 AI 自动化软件研发研发流程

2025-12-22 周一文章

从 AutoGLM 到豆包手机：GUI Agent 技术探索与对比

引言这个月，AI Agent 赛道接连出现两个关键动作，引发了技术圈的密切关注：先是字节的“豆包手机”作为全球首款 AI 原生硬件亮相；紧接着，被誉为“首个具备 Phone Use 能力”的智谱 AutoGLM 模型宣布开源。它们共同指向并加速了一个超越内容生成的新趋势：AI

AI AgentGUI AgentAutoGLM+1

技术观察共 55 篇

Agent Behavior Engineering：当 Agent 的行为开始像代码一样被管理

WebMCP 之后，为什么还需要 WebSkill

WebMCP 之后，为什么还需要 WebSkill

最近，企业为什么又开始推动前后端融合？

Signal #20：当 Agent 开始塑造模型

To Run or Not to Run：AI Coding 不是多跑测试就更可靠

Signal #19：AI 工具越来越多，团队要开始管起来了

Signal #18：Coding Agent，从 IDE 走进研发系统

字节 AI Coding 到 90%，反而看清了软件工程

Figma 转代码，为什么总是差最后一公里？

Signal #17：Agent 开始进入组织系统

端到端研发自动化，为什么不能只靠 Workflow 或 SDD

AI Agent 为什么看起来很忙，却做不好真实工作

Spec 也会骗人：AI Coding 为什么一进真实仓库就翻车

Signal #16：AI Coding 的下一站，是可接管的工作现场

第一个学会新器物的人，后来去哪里了？｜新器物志

Signal #15：Agent 开始进入团队账本

AI 写代码越来越快，为什么交付还是反复返工？

Signal #14：别只看出码率了，AI Coding 的指标正在变

当大厂人开始等裁员补偿，组织真正失去的是什么

新器物志｜账户先生说省下了二十个人

新器物志｜百工镇来了会写字的笔

Signal #13：AI Coding 的下一站，是失败与反馈链路的自动化

别让 Skill 变成新的文档债：从经验沉淀到行为回归

AI 让所有人都能干一点别人的活，但这不代表专业消失了

对话不是工作台：AI Agent 真正缺的不是聊天窗口

AI 到底能不能从零写软件？ProgramBench 和 RepoZero 给出了两种答案

AI 会写代码之后，企业还需要什么样的新人？

Signal #12：Coding Agent 正在拥有自己的运行时｜AI Coding 的界面，不再只是聊天框

AI 会写 Native 之后，跨端框架还重要吗？

AI 时代，组织最该警惕的不是人才离开

别急着说 AI Native 组织，先让关键链路形成闭环

Meta 做了个实验：让 AI 从零重建软件，结果全军覆没

AI Coding 别等写完再测：从输入到黑盒验收的验证分层

AI Coding 的上半场是生成，下半场是验证？AI 代码被采纳，不代表需求可验收

从工单到交付：数字员工开始承接一类 L0 需求

AI 时代，不是所有业务诉求都该进入研发系统

All You Need Is Skill：端到端自动化的 MVP 闭环是如何跑起来的

当大家开始谈 Harness 时，我们真正该理解的是什么？从 Representation 到 Harness，再到 System，AI 研发正在进入新的一套系统分层

90% 出码率是怎么来的？我们如何把研发任务组织成可运行的自动化链路

AI 正在制造一批“伪专家”｜当“会讲”变得越来越容易，组织该如何重新判断谁值得被相信

出码率到 90% 之后，我们真正验证了什么？端到端自动化的第一次真实落地

当网站开始为 Agent 提供接口，Web 的交互边界正在改变｜从 WebMCP 看网页如何从“界面”走向“能力入口”

为什么 Spec 不是终点，而只是中间产物？软件研发正在从 Spec 驱动，走向表示驱动（RDD）

当 GUI 让位于 Agent，软件为什么走向“系统”

为什么 PRD + 设计稿，无法支撑 AI 时代的研发协作？当 AI 开始参与研发流程：产设研协作可能会如何变化？

当 AI 开始参与开发：软件研发为何会走向 Agent 协作｜从人类协作到 Agent 协作系统

信息越来越多，但我们真的更理解技术了吗？| 从信息流到主题结构

从设计稿到生产代码：小红书如何用多阶段流水线自动化客户端开发

AI 时代，重新理解成长｜一份持续 260 期技术小报背后的技术观察

当 AI 开始参与开发之后，软件工程正在重新学习“如何表达”

问题也许不在 AI：软件研发开始适应新的执行者

我们可能一直误解了 AI 对软件研发的影响

企业研发 AI 自动化能力结构框架（v0.1）：从工具增强到端到端自动化的结构路径

从 AutoGLM 到 豆包手机：GUI Agent 技术探索与对比

从 AutoGLM 到豆包手机：GUI Agent 技术探索与对比