阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选技术周刊技术周刊SignalSignal个人博客个人博客
登录注册
第 272 期

Signal #12:Coding Agent 正在拥有自己的运行时

2026.05.18

技术周刊

第 272 期
2026.05.18
Signal #12:Coding Agent 正在拥有自己的运行时
第 271 期
2026.05.11
Signal #11:Agent 的中间过程,正在被产品化
第 270 期
2026.05.04
本周 Signal:Coding Agent 正在从工具入口,走向工程基础设施
第 269 期
2026.04.27
本周 Signal:模型更新仍然重要,但不再是唯一主角
第 268 期
2026.04.20
本周 Signal:多 Agent 并行,开始从实验玩法变成产品默认交互
第 267 期
2026.04.13
本周 Signal:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
第 266 期
2026.04.06
本周 Signal:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
第 265 期
2026.03.30
本周Signal:执行开始接管软件,界面退居为观测层
第 264 期
2026.03.23
本周 Signal:复杂度开始从“人”迁移到“系统”
第 263 期
2026.03.16
本周 Signal:软件工程岗位开始 AI-native 化
第 262 期
2026.03.09
本周 Signal:AI 工具正在获得长期记忆
第 261 期
2026.03.02
本周Signal & 我们可能一直误解了AI对软件研发的影响
第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 271Signal #11:Agent 的中间过程,正在被产品化

Signal #12:Coding Agent 正在拥有自己的运行时

过去我们谈 Coding Agent,很多时候还是把它看成某个入口里的能力:IDE 里的 Agent、终端里的 Agent、网页里的 Agent,或者某个云端任务按钮。

但最近一批产品变化放在一起看,一个更清晰的方向正在出现:Agent 正在从“被调用的功能”,变成“被运行的工作单元”。

VS Code 开始提供独立的 Agents window,用来承载多个 Agent 任务;GitHub Copilot 在 JetBrains 中加入统一的 sessions view,用来观察正在运行和排队中的任务;Cursor 继续强化 Cloud Agent 的开发环境,让 Agent 可以在远程环境里跨仓库理解问题并提交修改;OpenAI 也把 Codex 接入移动端,让人可以在手机上跟进,而 Agent 在远程开发环境中继续执行。

这些变化的共同点,不是让 Agent 多一个入口,而是让 Agent 开始拥有自己的运行空间。

过去,Agent 更像是一个聊天窗口或代码生成入口。现在,它开始需要任务队列、执行环境、上下文状态、工具权限、远程机器、过程追踪、结果验证,以及人在更高层进行观察和干预的界面。

这意味着,AI Coding 的核心界面,可能不再只是编辑器里的聊天框,而是一个 Agent 执行控制台。

开发者的角色也会随之变化:不再只是和一个 Agent 一问一答,而是把任务交给多个持续运行的执行单元,再回来检查状态、收敛结果、处理异常。

Coding Agent 正在拥有自己的运行时。

它不再只是模型能力的外壳,也不只是工程系统中的一个工具入口,而开始成为一种新的研发执行单元。围绕它展开的竞争,也不再只是代码生成能力,而是运行环境、状态管理、过程可观测、权限控制和验证闭环的系统能力。

国内技术

AI 技术与算法实践

[淘宝设计] AI会场 自然语言生成 营销素材 参数化 生产链路

AI会场探索实践
淘宝设计团队探索AI会场实践并构建生产链路
文章围绕AI会场探索实践展开。AI会场是用自然语言生成符合淘天营销标准的会场视觉素材。当会场生产规模扩大,完全人工定制成本高、周期长,单纯用模板又缺乏风格和个性。AI会场需将确定性结构标准化、可变部分参数化。从运营操作看,构建了“输入 - 生成 - 交付”链路,实现聊天即创作的全链路闭环。具体流程上,系统先理解业务需求,将自然语言翻译成视觉参数,通过参数化实现丰富效果。还通过训练自动替换编辑模型解决稳定换品问题,纳入动态生成让画面更生动,并进行多行业泛化验证。AI会场核心是串起从需求到交付的生产链路,解决规模化与个性化的平衡问题,最终目标是形成可复用的系统能力。

[TRAE.ai] AI Coding 全栈开发 工作流实践

电商商家增长团队|全栈 AI Coding 工作流分享
电商商家增长团队分享全栈AI Coding工作流实践
电商-商家增长团队分享全栈AI Coding工作流。起初用Vibe Coding搭建AI短视频生成平台,后因项目复杂度上升问题频出。经探索沉淀出TRAE SOLO + 多仓库Spec模式 + 测试验证Skill的全栈开发实践,2人2周完成平台MVP,投放视频获正向收益。介绍核心工作流:Spec-First以需求为文档;前后端共享上下文,多仓库开发;测试是AI Review核心,分后端和前端测试;Skill迭代从一次性Prompt到可复用能力。还分析工作流适用性,指出AI Coding深水区挑战,强调其ROI与项目特征相关,人的判断力是核心,沉淀比使用重要。最后总结核心方法论,给不同角色提建议。

[腾讯研究院] AI 笔记工具 开发效率 团队协作

AI 让生产效率不再是瓶颈,然后呢?|AI跃迁者调研 02-flomo 少楠
flomo少楠分享AI提升开发效率及团队面临困境
这是AI透镜的深度对谈系列第二期,邀请flomo浮墨笔记和幕布联合创始人少楠分享经验。少楠从GPT - 3.5起用AI,后因Claude Code和DeepSeek V3,生产力大幅提升。工作流上,产品经理先做Demo再写PRD,证伪效率提高但产出减少,工程师开发周期缩短。少楠给公司打5分,认为速度上去但用户价值挖掘不足。推动团队用AI靠报销,不过AI也带来能力鸿沟拉大、协作方式难重构等问题。flomo新上线“认知地图”和“AI记忆”功能,源于与AI交流。少楠还探讨了笔记工具终局、“摩擦”定义等问题,建议多关注现实生活,从当下开始积累记录。

[阿里云开发者] 智能体开发 Java框架 Harness Framework 企业级应用

首个 Java Harness Framework 来了|AgentScope 把 OpenClaw 带到企业分布式场景
阿里发布 AgentScope Java 1.1.0 版实现 Harness Framework
文章宣告 AgentScope Java 1.1.0 版本发布,实现了“Harness Framework”规划。该版本交付工作区驱动的 Agent 运行环境、可插拔的抽象文件系统、开箱即用的上下文管理、子 Agent 编排与隔离执行四项核心能力。它解决了企业级智能体开发中工作区管理、工具隔离执行、分布式环境适配等问题。设计上以 Workspace 为唯一事实来源,用 AbstractFilesystem 让工作区适应不同环境,带来安全与隔离、分布式部署、Subagent 与异步任务等工程能力。还介绍了个人代理 Agent、企业级数据服务、企业在线服务三种典型使用场景及对应能力,最后从快速开始、核心概念、功能详情等方面对框架进行详解。

[WeaveFox和他的朋友们] AI全栈应用 BaaS Appwrite 数据安全

WeaveFox AI 全栈应用交付架构解析:Appwrite BaaS
WeaveFox 利用 Appwrite BaaS 实现 AI 全栈应用交付
2023 年以来,AI 辅助开发跨越到页面级生成,但仅有前端 UI 的应用不够完善。Weavefox 可通过 Vibe Coding 构建 AI 全栈应用,其背后是 BaaS。WeaveFox 接入 Appwrite 和 Supabase 服务。BaaS 能将环境配置转化为 API 调用,实现更快构建和启动应用。Appwrite 作为 AI 的工程化接口,有持久化存储、身份认证、云函数等核心能力。同时,BaaS 提供行级安全策略保障数据安全,用户可可视化管理数据表权限。未来 WeaveFox 会加入安全检测功能。不过 Vibe Coding 有局限,WeaveFox 采取影子演进策略确保系统稳定性。BaaS 是 AI 应用规模化的加速器,WeaveFox 持续优化全栈应用生成效果。

[大淘宝技术] 大模型 智能导购 Agent评测 家居搭配

面向智能导购的Agent评测实践
淘天集团团队搭建面向家居导购Agent自动化评估链路
文章围绕家居导购Agent评估展开。先介绍家居导购场景下,智能Agent虽重要但评估面临挑战,为此搭建端到端自动化评估链路。该链路含Benchmark创建、LLM模拟人工评测、人工抽样验收和自动化评测与报告产出四个模块。执行路径分五步,评测维度含两级体系,数据集经标准化构建。评估实践中,用四种模型生成搭配结果并评测,量化结果显示gpt51综合最佳,较qwen3-vl总分提升16.4%。还分析出模型三大瓶颈问题,自动评测准确率达91.9%。最后总结评估体系价值,并对未来探索方向作出规划。

[火山引擎Agent社区] Agent OpenViking VikingBot 狼人杀 多智能体博弈

Agent 也能玩狼人杀高阶博弈?一场游戏看懂 OpenViking 长程记忆的实力!
OpenViking助力VikingBot玩狼人杀,展现记忆与策略能力
文章围绕OpenViking和VikingBot展开,先指出当前多Agent系统缺乏长期协同进化记忆的问题,OpenViking将突破口放在提供可追溯记忆上。通过6个VikingBot模拟狼人杀对战,展示其记忆沉淀和跨局复用能力,随着对局增加,胜率显著提升。介绍了OpenViking的记忆高效管理,包括统一目录协议、三层结构存储、多种记忆类型抽取及增量更新机制。阐述VikingBot核心能力,如深度集成OpenViking、强大网关、多渠道接入等,还说明了记忆智能提交和渐进式记忆检索功能,评测显示其准确率高且Token成本低。此外,基于OpenViking的多租户能力保障数据安全和隔离,给出实际应用示例。最后提供VikingBot安装教程和狼人杀Demo,呼吁共建Agent上下文未来。

[阿里云云原生] AI Agent 定时调度 阿里云MSE

Agent 从一问一答到自主执行面临哪些挑战?
阿里云MSE推出AI任务调度平台并开启免费公测
随着AI发展,Agent正从答疑助手走向自动执行任务的数字人,定时调度是其自主运行的主要触发形态,很多主流产品都重视该能力。开源Agent定时任务存在无高可用、运维成本高、权限管理弱、可观测能力弱、资源利用率低等痛点。阿里云MSE AI任务调度平台应运而生,它具有高可用定时调度、统一管理、精细化权限管理、企业级可观测能力等优势,还能弹性伸缩、批处理任务、实现自进化。与开源方案相比,它能更好支撑Agent定时任务运行。目前该调度平台已开放免费公测,支持多种Agent接入。

[网易智企-CodeWave] AI Coding 规格驱动开发 企业开发体系

AI 生成的代码没人敢改,问题不在 AI,在开发范式
网易智企CodeWave提供AI Coding企业级系统性方案
在《AI如何赋能企业》活动上,网易智企刘卫林指出AI写代码快但后续难改。当前AI Coding存在质量、协作、资产失控问题,本质是AI释放生成能力与企业开发需治理的矛盾。业界关注规格驱动开发(SDD),以“规格”为中心。网易智企-CodeWave将SDD、NASL和AI Vibe Coding结合,提供完整企业开发体系,还实现全生命周期一站式管理。该体系能让AI Coding可控、可协作、可持续,如制造业企业用其可缩短迭代周期、增强系统掌控力。最后提出企业需工程体系驾驭AI生产力,并邀参加网易创新企业大会。

[网易智企-CodeWave] AI Coding SDD 马具工程 CodeWave NASL

网易智企如何驾驭 AI Coding 这匹快马?
网易智企CodeWave团队分享AI Coding平台实践方案
网易智企-CodeWave技术负责人姜天意分享智能化软件工厂思考与实践。先指出AI Coding存在代码质量不可控、难以维护、业务理解不精等问题。为此引入SDD,将需求标准化,但存在不足,引出马具工程。CodeWave以NASL为基座,结合可视化开发平台,实现Spec-Driven驱动AI生成。开发流程含上传PRD、规范拆解、技术设计、任务执行,产出沉淀复用。还提供Code2Spec逆向路径。技术上用自研wave-agent,考虑智能体架构等重点。建立Benchmark体系度量提效、优化模型。最后强调CodeWave将三者合一,是企业级开发完整答案。

[phodal] AI Agent运行 /goal 繁杂任务

AI 解决繁杂任务:从 /goal 到长时间异步 Agent 运行
作者探讨AI解决繁杂任务及长时间异步Agent运行方法
作者结合自身经历,探讨AI解决繁杂任务的方法。先介绍用Codex的/goal做试验,发现其能将聊天请求变为可接班运行对象。接着指出长时间运行AI Agent存在一次对话难承载长任务上下文的问题,Ralph Loop抓住了工作状态交接的核心。然后分析/goal任务的设计,如Office、IDA、《魂斗罗》任务的拆分与验收。强调Git、报告和失败记录是Agent的黑匣子,长时间运行需人能插手,要设置计划、验证等。最后展望未来需解决多个异步执行者在工程证据上的协作问题,关键是让工作区接得住下一轮。

[Goodme前端团队] AI Agent Skills MCP 中后台页面开发

Agent Skills 原理及其在中后台页面中的实践
文章介绍Agent Skills原理及在中后台页面的实践与优化
文章围绕Agent Skills原理及在中后台页面的实践展开。先介绍Agent Skills,它是扩展Claude能力的模块化功能,本质是带边界约束的任务执行单元。对比了它与MCP的区别,指出前者适用于知识型、经验型任务。在中后台页面实践部分,分析业务需求,发现列表页、详情页适合运用skill。以报货业务列表页为例拆解开发流程,创建skill并生成模板,虽页面还原度较高,但存在生成时间长、代码冗余、组件匹配不精确等问题。针对这些问题提出优化方案,优化后的skill生成时间减半,规范性和可拓展性显著提升。最后提出中后台skill长期建设的思考,鼓励探索Skill开发并分享交流。

[腾讯技术工程] AI工程 知识沉淀 Harness Engineering

Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践
AI工程交付团队分享知识沉淀实践及未来展望
本文是一个AI工程交付团队分享知识沉淀实践。2025年末至2026年初,Harness Engineering成热门话题,团队实践发现构建Harness工作流非最终目的,知识沉淀才是技术护城河。文章指出知识管理是Harness Engineering核心能力,知识沉淀比工作流重要,因工作流可替换,无知识沉淀的工作流是一次性的,知识是团队复利资产。团队设计了三维正交知识体系架构,包括五层存储、五种类型、三级成熟度,搭建独立Git仓库作为团队知识库,实现共享和更新。工作流各阶段与知识流动紧密关联,知识按需消费通过三级索引和查询预算实现。为突破人机交互瓶颈,引入Hapi内网版。落地经验包括历史项目冷启动、知识膨胀治理等,未来可探索知识语义检索增强等方向。

[大淘宝技术] 缓存 缓存选型 缓存安全 汇金平台

缓存使用实践总结:以淘宝交易结算场景为例
淘天集团交易结算团队分享缓存使用实践
文章以汇金平台为例,系统总结缓存使用实践。先介绍缓存理论,包括适用条件、分类与选型方法,如数据不要求强一致性、访问和更新频率等影响缓存选型;还从存储端、介质、时机三个角度对缓存分类,指导选型。接着阐述五类典型场景实践,如缓存实例型配置类数据选分布式、内存型、静态缓存;分布式锁选分布式、持久型、直写缓存等。最后分析缓存安全问题,如穿透、击穿、雪崩等风险成因及治理方案,如用布隆过滤器防穿透,合理设置过期时间防击穿。

[小红书技术REDtech] 项目管理 AI Agent OpenClaw 大模型

打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路
小红书PMO团队分享项目管理AI Agent 4次迭代成果
小红书PMO团队分享项目管理AI Agent 4次迭代探索。过去企业项目管理历经人治、机制化、工具化,AI时代需演进到AI化。团队有两个关键判断,自2025年初开启4轮迭代:1.0阶段将AI作项目管理顾问,产出评测集;2.0提出设计原则,接入内部IM,实现6个场景能力;3.0把项目管理能力打包成Skill,实现长记忆四件套,自建项目注册平台,打通多平台和7个核心功能;4.0为项目组提供共享上下文,基于OpenClaw构建PMOBP Agent,有12项落地能力和主数据底座。团队总结7条经验,展望走向AI主导项目管理阶段。

[火山引擎Agent社区] 在线教育 对话式Agent 火山Supabase BaaS平台

业务团队也能“手搓”应用?火山 Supabase 助力猿辅导对话式 Agent 落地
猿辅导Rush平台借助火山Supabase落地对话式Agent
文章介绍猿辅导Rush平台结合火山引擎Supabase实现对话式Agent落地。猿辅导因业务微需求催生Rush平台,其基于Vibe Coding理念,让员工用自然语言交互生成应用。但早期遇时效性、数据安全、版本稳定和成本控制等挑战。选择Supabase后,Rush成提效工具,在教学、运营、职能侧应用效果显著。未来二者结合将深度融合AI、连接生态、赋能外部。还介绍Supabase,它是AI原生BaaS平台,功能完善、性价比高、数据库强、交互易用,适用于多种场景。

[腾讯云开发者] AI Agent Hermes Agent 自我进化 Prompt Engineering

拆完Hermes源码,我发现Agent的"自我进化"根本不需要训练模型
作者拆解Hermes Agent源码揭示其自我进化机制
本文深入剖析了Hermes Agent的自我进化机制,并与OpenClaw对比。2026年2月Nous Research开源Hermes Agent,两月获5.2万Star。OpenClaw是全能但无状态的管家,Hermes Agent定位是自我进化。Hermes Agent有三大核心机制:四维持久记忆系统保证单次会话一致性;技能自动创造系统可自动创建/更新Skill;KEPA通过周期性回顾更新使用模型的策略。其优势是零成本进化、可解释编辑、跨模型迁移和渐进式积累,但也存在判断不准确、更新延迟和生态弱的问题。作者认为理想方案是用户驱动和Agent自驱动结合,还给出两者的选择决策表,指出Agent未来是会成长的软件。

[小红书技术REDtech] 自动化测试 AI Coding GUI Agent 测试架构

QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾
小红书质效研发部分享GUI Agent智能化测试实战经验
本文整理自小红书质效研发部在QCon北京2026的分享,聚焦小红书GUI Agent智能化测试实践。春节大促时用Agent自动跑测试,取得累计自动化执行4.3万+次等成绩。但测试面临用例稳定性和业务理解问题,单大模型难解决。为此采用分层分工思路,按上下文分层、模型分工,将测试流程分业务意图、Agent探索、可执行代码三层,各层有退回机制。还介绍意图理解、路径规划、精确执行的做法,如用Coding Agent+Skill和自研小Agent+ToolCall,构建操作图谱,用双Agent架构等。最后分享踩坑经验,强调评测集非迭代正确姿势,纯探索路线需务实回退,未来将拓展架构应用并前置质量动作。

[京东技术] 数据库 JSON字段 动态查询 重量库存管理

抽丝剥茧探穷境!一次数据库JSON字段的深度使用实践
文章分享数据库JSON字段深度使用实践案例
文章围绕数据库JSON字段深度使用实践展开。系统为满足不同业务诉求,将通用与个性字段隔离,用JSON类型字段存储。介绍常用JSON函数后,给出典型案例。扩展字段存储和查询方面,有动态扩展查询和元素包含条件使用案例,前者支持动态增减属性条件过滤库存,后者涉及设备组、批属性、序列号条件。数值管理深度剖析案例中,华冠场景用JSON字段实现重量库存管理,更新时发现诸多问题。如json_set赋值依赖字段非null,需初始化历史null值字段;批量更新时部分明细stockWeight为null会使extend_content被置为null,通过调整代码解决;所有明细stockWeight为null时SQL语法错误,将ELSE改为WHEN THEN解决。此外还提出新的批量更新思路。

[深思圈] 软件开发 AI coding agent时代 工程师角色转变

Cursor CEO 最新演讲:AI coding的下一个时代
Cursor CEO演讲揭示AI coding时代软件开发变革
文章借Cursor CEO Michael Truell演讲,探讨AI coding变革。软件开发成本高,旧代码修改难。发展分三阶段:手工、Copilot、agent时代。如今agent请求超Tab补全,Cursor 30%代码审核由agent独立完成,企业75%代码由AI生成。工程师角色转变为agent管理者,工作是描述任务、检查结果等。管理agent有本地和云端两种模式,云端可并行处理多任务。实验显示agent一周能从零开发浏览器原型。作者认为要重新校准写代码价值,建立可信度评估体系,解决组织管理挑战,软件创业门槛降低,软件教育需重构。

[PaperAgent] 多智能体系统 拓扑设计 OFA - MAS 跨域协作

WWW'26 | 跨任务自适应的Multi-Agent协作新范式
Griffith和Northwest团队提出OFA - MAS多智能体拓扑设计范式
大型语言模型驱动的多智能体系统(MAS)是解决复杂任务的重要范式,但智能体协作拓扑设计存在问题。现有自动拓扑设计多为one - for - one范式,维护成本高且难复用知识。Griffith和Northwest团队提出OFA - MAS,将拓扑设计推向one - for - all。它把拓扑设计建模为条件图生成问题,采用自回归图生成框架,设计TAGSE让拓扑生成“看懂任务”,引入MoE模块激活不同专家,通过三阶段训练解决监督数据昂贵问题。实验显示,OFA - MAS在六个基准测试中表现最优,在未见领域有良好泛化能力,关键设计不可或缺,鲁棒性好,能平衡准确率与计算开销。

[腾讯技术工程] AI工程化 Agent CLI Workflow

当我把 AI 变成一个"算法":Skill 工程化设计的心路历程
作者分享将AI工程化设计,构建执行环境的历程
作者分享将AI变成“算法”,实现Skill工程化设计的历程。最初按主流做法写规则,发现规则越多AI越不听话,问题在于结构。于是引入CLI接管确定性事务,解决Token浪费、路径不确定等痛点,还实现工具管理三层分离和热更新。Workflow机制将工具串成流水线,解决流程顺序、步间通信和中断恢复问题,具备扩展性和同构性。最后创建workflow - creator实现自举,形成闭环。作者还指出简单场景无需工程化,工程化是为AI构建适合的执行环境。

[得物技术] 实时数仓 AI工程化 BP Claw FlinkSpec

BP Claw 破解 AI 编码输入难题 ——FlinkSpec 需求智能化实践|得物技术
得物技术BP Claw破解AI编码输入难题
文章围绕BP Claw破解AI编码输入难题展开,介绍其在FlinkSpec需求智能化实践中的应用。FlinkSpec是实时数仓的AI工程化底座,BP Claw位于其上游,确保PRD文档质量。BP Claw设计贴合工作流,具备智能需求转化、PRD质量评分、自动拉群等核心能力。在技术上,采用省Token技巧、避免幻觉策略及打磨Skill的方法。与FlinkSpec联动可提升PRD质量,进而提高AI Coding效率。落地运营通过成熟度评分体系、质量趋势追踪和最佳实践沉淀推动产品落地。文章还给出快速上手方法和注意事项,并展望后续发展。

[海外独角兽] 数据库 ClickHouse AI日志分析 可观测性

AI Labs 都在用,ClickHouse 能成为 AI 日志的实时分析引擎吗?
ClickHouse在AI浪潮爆发,拓展产品线并加速商业化
本文聚焦ClickHouse,探讨其在AI浪潮中爆发的原因及发展现状。它起源于2009年Yandex内部项目,2016年开源,2021年商业化。2025年因平台化拓展、获头部AI Labs青睐、商业化加速而受关注,ARR从1500万美元增至1.6亿美元。其有ClickHouse Cloud、ClickStack、Langfuse三条产品线,分别解决海量数据实时聚合分析、可观测性、LLM工程平台问题。虽AI是业务推动力,但它不做AI,仅处理数据。销售模式正从PLG向PLG + SLG转型,按资源量收费。专家认为其性能快、成本低,但存在平台完整性缺失、企业就绪度不足等局限。目前估值150亿美元,对应94x multiple。

[搜狐技术产品] AI开发 Step Plan Claude Code 代码审查 会议转写

Step Plan + Claude Code 实战!代码审查和语音 Agent 都跑通了。
Guide用Step Plan和Claude Code完成代码审查与语音处理实战
作者Guide分享用阶跃星辰Step Plan和Claude Code实战经历。先介绍选Step Plan原因,包括同一API含多能力、费用及模型覆盖等。接着说明环境准备,如获取API Key、配置Base URL、接入Claude Code。实战方面,一是用Step 3.5 Flash 2603做代码审查Agent,审查股票项目预警模块,输出报告并人工复核后修复问题;二是用Step Plan做会议转写与播客摘要Agent,生成模拟会议录音、转写、整理纪要和语音摘要。还介绍引入Step Router V1自动分流任务,虽有黑盒切换问题但思路合理。最后总结Step Plan能进日常工作流,可省时间,但需人工兜底,适合高频跑Agent任务或有会议转写等需求的人。

[搜狐技术产品] AI辅助开发 工作流编排 Claude Code 独立验证 skill化

总觉得Claude Code 写完代码有问题?我用了一个开源 Skill 编排了 7 阶段严谨开发工作流,拦下 10 个 Critical Bug
作者编排Claude Code,沉淀7阶段开发工作流成skill
作者用Claude Code开发订单改单幂等重试特性时,靠code-reviewer skill发现10个关键bug,意识到严谨工作流的重要性。文章介绍严谨AI辅助开发7阶段工作流,从需求到交付,用4种独立视角交叉验证,还分享多义字段、并发race、RPC不幂等3个翻车案例。最后将工作流沉淀成Claude Code skill,供团队复用,还给出使用建议和常见问题解答。

[搜狐技术产品] AI 声音克隆 录音质量 三步法

只需3步,让AI克隆的声音更像你
文章介绍三步法让AI克隆声音更像本人
文章围绕AI声音克隆展开,指出效果差异80%取决于录音质量。阐述声音复刻本质是AI对人类发声器官物理特性神经建模。分析差样本三大致命伤:噪声污染使AI误编环境音;高频细节丢失让声音失真;无效片段干扰致音色跳变。提出“提取、增强、优选”三步法:用基于Transformer架构模型分离纯净人声;用DeepFilterNet3修复音质;用NISQA筛选高质量片段。还提及构建情感颗粒度、处理呼吸避免“机器人感”,推荐剪映等工具。该方案提升声音复刻相似度,降低重试率。

[腾讯云开发者] 软件开发 业务系统复杂性 代码腐化 功能耦合

只加两行代码,为什么要两天?一文深度理解业务系统的复杂性
文章深度剖析业务系统复杂性及应对策略
文章围绕业务系统复杂性展开。先指出业务规模停滞或下滑使产品侧增加需求,加重开发团队压力,但软件行业的可复用性理论上应提高开发效率,然而现实中功能成本曲线呈指数型。接着提到软件开发提效,虽有工程效能工具减少意外复杂性,但业务本身的本质复杂性不可忽视。业务系统复杂的根本原因一是功能间隐蔽增加的耦合,如名片系统和分享到微信功能引入新耦合;二是不可避免的代码腐化,因架构设计短视,“中华田园敏捷开发”使架构只能适应当下。最后强调代码腐化和文档缺失增加开发者认知负担,应对需代码防腐和知识沉淀,重构虽能解决架构腐化,但收益难量化。

[追问nextquestion] AI 科学理解 理论评估 可视化 隐喻

为什么AI的错误毫无价值?如何理解AI的理解?
哲学家Henk de Regt探讨AI理解能力及科学理解相关问题
本文重新梳理了主持人与哲学家Henk de Regt关于AI理解能力的访谈。Henk de Regt认为理解是基于技能、语境和理论可理解性的实践能力,科学理解是可错的,即使错误理论也能提供理解,如生物电和热力学两种神经信号传递理论可协同增进理解。他还提出操作性测试评估AI理解能力,设想学生与教师互动前后测试,以分数提高判断教师传递理解的能力。对于科学能否被计算机取代,需回答“什么”“为什么”及因果解释反事实三类问题。大语言模型错误无价值,因无理论支撑;人类科学理解错误可能导向新发现。此外,抽象和隐喻对理解有重要作用,可视化可辅助理解但非必需,专家和大众理解本质相同,都是推理能力。

[爱奇艺技术产品团队] AI编程 Harness Engineering 研发流程

别让AI瞎猜了:用Harness Engineering 终结无限返工
文章介绍Harness Engineering让AI融入稳定研发流程
文章围绕Harness Engineering展开,指出AI编程工具进入研发日常,但交付时遇问题,因任务依据不完整致返工。Harness Engineering旨在让AI融入稳定、可协作的研发流程。理论上,它从写代码转向跑完整链路,强调工程信息对agent的重要性,最小可用harness由任务约束、工具执行等五类组成。方法上,要固定信息落点,明确任务流转链路,模板初始化让agent先解读。实践中,前端分设计、状态、实现三层,后端分依据、验证、实现三层,工具可替换,职责分层要稳定。落地时可从轻量harness开始,分阶段推进,明确其适用边界,强调人仍需参与判断。

前端开发与工程化

[梯度不陡] 前端开发 跨端框架 Native开发 AI Coding

AI 会写 Native 之后,跨端框架还重要吗?
文章探讨AI能写Native后跨端框架价值变化及企业应对策略
文章探讨AI能写Native后跨端框架是否重要的问题。AI降低Native开发成本,引发对跨端框架必要性的思考。但AI降低的是编码成本,非系统成本,跨端框架“省人”价值减弱,不过可成企业统一业务表达层。企业应重新分层,业务表达跨端化、平台能力Native化、AI执行系统化。还指出不同场景适合不同方案,迁移回Native是组织工程,端侧工程师能力将变化,跨端框架不会消失但会被重新定义。

[墨刀] 原型设计 Vision Pro 墨刀AI

三步上手Vision Pro高保真原型!
刀刀姐介绍用墨刀AI上手Vision Pro高保真原型方法
文章围绕苹果Vision Pro新款机型展开。去年Vision Pro引发科技圈关注,今年新款搭载M4芯片,或加入眼动追踪和3D空间锚定功能。设计师和产品经理为此纠结,而墨刀AI新品上线可解决问题。首先要吃透Vision Pro交互逻辑,其操作与现实习惯一致,墨刀白板可处理需求流程。接着通过墨刀AI制作“活原型”能有效沟通,输入关键词可生成并优化高保真原型,适配设计师、产品经理等人群。最后,用户分享墨刀AI使用体验,评论区点赞前五有会员奖励,还鼓励上传素材挣零花钱。

[GSYTech] AndroidX AppState Compose状态管理

AndroidX 将引入有全新 AppState ,用于管理 Compose 状态
AndroidX 引入 AppState 管理 Compose 状态
AndroidX 为「跨组件 Compose 状态托管场景」引入 AppState,虽未完全落地,但已明确核心目的是将 Compose 可观察状态从组件生命周期中提出,放到更上层容器管理。新增 androidx.appstate 包,有 AppState、AppStateKey<T>、AppStateToken 三个公开类型及对应公开方法。AppState 是 keyed MutableState store,存的是 MutableState<>,实现读写分离,其生命周期与实例本身绑定。它不是 SavedStateHandle/ViewModel 的替代品,而是 Compose Runtime 层的状态托管基建,可解决多个 Composable 或组件间共享 Compose State 的问题,还能在关联状态变化时自动清理状态,项目处于落地阶段。

[数字生命卡兹克] 输入法 AI语音输入 豆包输入法

豆包输入法Mac版正式上线,所有人都该试试AI语音输入了。
豆包输入法Mac版上线,推荐用语音输入与AI对话
豆包输入法Mac版正式上线,作者推荐大家使用其语音输入功能与AI对话。作者曾是打字派,因打字速度拖慢与AI交互速度,开始使用语音输入,发现其速度快、能提供更多信息。此前电脑端语音输入选择少且体验差,而豆包输入法Mac版免费,体验好,功能全。它有两种输入模式,流式输出丝滑,识别精准,能自动纠错和优化输入,支持中英混说,还可学习用户用词习惯。此外,它有轻声抗噪功能,适合普通用户。

[支付宝体验科技] 前端开发 生成式UI 半监督评测体系 UI自动化生产

把 UI 生成接进流水线:基于半监督评测体系的 UI 自动化生产实践
支付宝黄兆嵩分享基于半监督评测的UI自动化生产实践
文章源于支付宝技术部黄兆嵩在QCon大会演讲。因传统UI生产流程难适应需求,基于AI的生成式UI技术兴起。作者分享实践:一是高质量UI生成,针对prompt管理难、需求描述简单、设计稿还原差、生成结果无品牌特色等问题,提出搭建prompt工作台、需求改写、训练组件检测模块、建风格管理仓库等解决办法;二是在LUI中应用AI生成,采用流式渲染和生成式UI召回方案,解决体验和成本问题;三是实现有效监督与迭代优化,用自动机审和人机协同审核解决人工质检瓶颈,还能自动迭代prompt。最后对生成式UI发展提出思考。

[搜狐技术产品] Android开发 Android CLI 智能体工作流

Android CLI 实战指南:借助任意智能体,实现 3 倍速高效开发
官方推出 Android CLI 等工具助力 3 倍速 Android 开发
文章介绍了用于智能体工作流的全新 Android 工具与资源,包括 Android CLI、Android Skills 和 Android 知识库。新的 Android CLI 作为主要接口,可减少 LLM 的 Token 使用量,提升完成速度,具备 SDK 管理、项目创建等功能。Android Skills 是模块化指令集,涵盖常见工作流,可通过 android skills 命令使用。Android 知识库可通过 android docs 命令访问,能让智能体获取最新开发者指南。此外,这些工具能让向 Android Studio 的过渡更顺畅,开发者可借助智能体在多设备上扩展应用创意。目前 Android CLI 已推出预览版,鼓励开发者下载体验。

[GSYTech] 前端开发 Flutter Skia 字体渲染

终于,Flutter 修复 Android 中文字体异常,但是很草台,不知怎么吐槽
Flutter 修复 Android 中文字体异常,依赖 Skia 两次修复
Flutter 3.38 升级 Skia 版本后,部分 Android 设备出现中文字体异常问题,字体从系统默认无衬线体变为宋体风格衬线体。问题源于 Skia 重构 Android 字体回退逻辑,改变了选择 fallback 字体顺序,忽略 fFallbackFor 匹配检查。该问题受 Flutter 版本、Skia 版本、Android 系统字体配置、系统语言、应用 locale 等多因素触发。Skia 进行两次修复,第一次未完全解决,第二次修复后逻辑为优先返回通用后备字体。目前修复的 Skia 版本已合并到 3.43.0 - 0.3.pre,3.44 稳定版可解决问题。

[大转转FE] 前端开发 自动化测试 Midscene 多模态模型

不写一行代码,用 Xmind 思维导图跑通多端自动化回归
转转B2B团队用Midscene搭建自动化测试平台并探索研发自测
转转B2B业务三端并行迭代,回归测试存在人力消耗大等痛点。因AI视觉识别和业务压力,自建自动化平台ROI正向。经对比,选Midscene为底层引擎,因其对UI变动脱敏、维护成本低、学习门槛低。将其做成智能自动化测试平台,解决环境问题,支持0代码写用例和全环境运行。平台采用分层架构,涵盖DSL输入、平台管理、核心执行和底层驱动层。使用流程包括用例管理、脚本转换、执行和查看结果。还探索将YAML生成接入AI Coding流程用于研发自测,减少重复表达等。目前平台在发版回归和巡检场景成熟,未来有望融入日常开发流程。

[墨刀] 前端开发 墨刀AI App生成 React代码

墨刀AI再进化!基于设计系统生成React代码的App应用
墨刀AI升级,可基于设计系统生成React代码的App应用
墨刀AI进行重大更新,上线AI生成App能力。它先与用户对齐需求,像产品专家一样询问核心定位等问题。内置行业标杆级设计系统,能基于选定系统生成基于React/HTML代码的App应用,代码结构清晰、遵循规范、可直接交付。生成结束后会给出智能建议,支持导出至墨刀精修。此外,墨刀AI Agent还提供AI生成原型、图片转原型等多个产品设计利器,覆盖产品经理全工作流,让想法到落地形成闭环。

[W3C资讯] 前端开发 ECMAScript国际化API Intl对象

ECMAScript国际化API指南
文章介绍ECMAScript国际化API及多方面应用
文章介绍了ECMAScript国际化API,它可通过JavaScript的Intl对象使用,能原生处理语言区域与文化敏感数据。先讲解核心概念,包括locales和options两个基础参数。接着从多方面介绍其应用:日期和时间格式化,可消除歧义,通过options精细控制;处理数字、货币和单位,能适应不同地区格式;符合语言区域习惯的排序,用Intl.Collator解决默认排序问题;相对时间,用Intl.RelativeTimeFormat生成自然语言表达。还提及API其他能力,采用该API可将本地化逻辑迁移到浏览器原生引擎,提供更好体验。

[哔哩哔哩技术] 前端开发 AI辅助开发 智能工作流

bili-fe-workflow —商业化智能开发工作流实践
bili - fe团队实践商业化智能开发工作流
文章围绕bili-fe-workflow商业化智能开发工作流展开。AI虽在开发各阶段有介入,但缺乏统一工具和标准化流程。为此,从prompt工程演进到Harness Engineering,构建了智能开发工作流。介绍了.workflow知识库,解决AI对项目整体结构化认知不足的问题,与开发流程协作紧密。还阐述了prd - preprocess命令,可将原始需求文档转换为结构化开发文档,减少理解偏差。智能开发工作流分D2C和Dev两条路径,D2C实现设计稿到UI代码的自动化,Dev动态规划执行序列。此外,介绍了自动化测试、AI Mock工作流的实现方案、使用场景和方式。最后指出AI时代前端范式变革,工作流应沉淀为团队能力。

后端与云原生架构

[海外独角兽] BaaS Postgres AI coding

Supabase:百亿美元估值,vibe coding 的默认后端?
Supabase接近完成5亿美元F轮融资,聚焦多领域发展
本文介绍了Supabase的发展情况,其以Postgres为核心,提供一站式后端服务。发展依托Postgres生态和AI coding趋势,接近完成5亿美元F轮融资,估值100亿美元,截至2026年Q1累计用户超700万。关注原因包括处于AI大势、产品路线图转变、有平台化机会和强分发优势。产品分5层,有不同定价。在agent-first、scalability、企业级方面均有布局。增长得益于初创公司和vibe coding。面临Postgres生态、BaaS架构、agent-first等竞争,存在UE、TAM和企业客户市场等挑战。团队分工明确,还解读了四次收购对解决成本问题的作用。

[字节跳动技术团队] 在线教育 对话式Agent 后端即服务 BaaS平台

业务团队也能“手搓”应用?火山 Supabase 助力猿辅导对话式 Agent 落地
猿辅导Rush平台借助火山Supabase实现对话式应用落地
文章介绍猿辅导内部“Rush”平台借助火山引擎Supabase实现对话式Agent落地。猿辅导因业务微需求多且变化快,自主研发Rush平台,通过对话式交互生成应用。但早期面临时效性、数据安全、版本稳定、成本控制等挑战。选择火山Supabase后,Rush平台在教学、运营、职能等场景发挥作用,提升效率、降低成本。未来二者结合将深度融合AI、连接生态、外部赋能。还介绍了火山Supabase,包括其特点、适用场景、产品能力和优势等。

[阿里云云原生] 云原生 LFX Mentorship 开源项目 CNCF

26 年云原生 LFX Mentorship 夏季项目开放申请,开发者不容错过的带薪实习/摸鱼机会!
Linux Foundation开放2026年LFX Mentorship夏季项目申请
Linux Foundation组织发起的LFX Mentorship计划,为CNCF托管项目提供开源贡献土壤。2026年第2期夏季项目6月至8月开放申请,开发者参与可获导师指导、提升技能、获丰厚报酬。OpenKruise和Koordinator社区带来7个课题,覆盖云原生前沿场景。参与对象为年满18周岁的开发者,5月19日前登录官网申请,6月3日起通知结果,全程线上协作,8月25日前结项。各课题有具体描述、预期成果、推荐技能、导师及报名链接。

大模型 & AIGC 前沿

[深思圈] AI Individual AI Institutional AI 组织变革

个人生产力暴增10倍,公司价值却没变:AI时代最昂贵的教训
Hebbia的George Sivulka分析AI时代个人与机构AI差异
文章围绕AI时代个人生产力与公司价值的矛盾展开。AI提升个人生产力,但公司价值未同比例增长,如同1890年代电力革命,技术升级但组织方式未变,回报有限。Hebbia的George Sivulka提出Individual AI和Institutional AI概念,指出两者有七大差异。如协调上,缺乏协调会使组织混乱,需Agent管理;信号方面,Individual AI产生噪音,Institutional AI需找信号;偏见上,Individual AI易强化用户偏见,Institutional AI应挑战偏见等。最后强调要重新设计组织,构建和部署Institutional AI,将技术与组织完美结合。

[Datawhale] AI 人工智能 职业发展 黄仁勋演讲

黄仁勋现身卡内基梅隆(CMU)大学!讲了整整18分钟
英伟达黄仁勋在CMU毕业典礼分享AI时代机遇与挑战
在卡内基梅隆大学2026届毕业典礼上,英伟达CEO黄仁勋发表了18分钟演讲。他先从自身成长经历讲起,提及9岁赴美,父母为其付出,强调机会需靠自己把握。接着讲述创办NVIDIA时的困境,称失败是学习时刻,做CEO要担起责任。随后谈到毕业生处于AI革命起点,计算模式正被重置,虽会带来焦虑但也充满机会。他承认AI有风险,科学家、工程师和政策制定者要担责,反对因害怕而退缩。还指出工作任务和目的不同,很多任务会自动化,但人的目的不会消失。他表示真正危险的是别人更会用AI,鼓励大家参与其中,最后建议毕业生跑起来,把心放进工作里。

[微软亚洲研究院] 大模型 文生音视频 评测基准 多模态

AVGen-Bench:面向下一代文生音视频模型的系统化评测框架
微软亚洲研究院推出文生音视频评测基准AVGen - Bench
随着生成模型迈向更强多模态表达能力,评测问题凸显。现有评测多关注单一模态,难以满足真实场景需求。微软亚洲研究院推出面向文本生成音视频任务的评测基准AVGen - Bench,相关论文被ICML 2026接收。现有基准多为粗粒度质量评估,而真实应用需综合建模能力。AVGen - Bench从贴近真实场景出发,提供10个核心评测维度。其prompt来自真实任务,采用“大模型生成 + 人工筛选”流程,保留现实任务隐含要求。评测采用多粒度、混合式框架,拆解为三个层次,用专家模型和多模态大模型协同评测,旨在提出诊断性评测方法论,推动社区走向能力边界诊断。

[W3C资讯] 链接数据 CBOR-LD 1.0 序列化格式

首个公开工作草案:CBOR-LD 1.0
W3C JSON - LD工作组发布CBOR - LD 1.0规范首个公开草案
W3C JSON - LD工作组发布CBOR - LD 1.0规范的首个公开工作草案。CBOR是紧凑二进制数据序列化及消息格式,CBOR - LD 1.0是基于CBOR的链接数据序列化格式,利用现有JSON - LD生态系统,采用语义压缩技术,压缩率比通用方案高60%以上。该格式适用于存储和带宽受限环境,可构建互操作协议、高效存储数据。文档面向使用CBOR编码链接数据等多种开发者,可通过GitHub反馈草案意见,还可访问JSON - LD工作组主页了解更多信息。

[梯度不陡] AI Native 企业组织 AI应用 研发链路

别急着谈 AI Native 组织,先让关键链路形成闭环
文章探讨既有企业构建AI Native链路的路径与影响
文章探讨企业迈向AI Native的路径。指出AI Native关键是公司运行方式被AI重新组织,对创业公司是“出生方式”,对既有企业是“链路改造”。既有企业难整体转型,因要在现有系统承接AI动作。AI Native先改变信息流,减少对“人肉信息路由”依赖,让管理重心转变。企业可先让关键链路具备AI Native能力,如研发链路,满足信息可查询、任务可表达等条件形成闭环。链路AI Native化会影响组织结构,信息同步减少、协调角色转变等。既有企业应先让关键链路形成智能闭环,再改变组织。

[阿里云开发者] 大模型 可观测性 GenAI语义规范

阿里巴巴 & 蚂蚁 LoongSuite GenAI 可观测语义规范:从统一数据语言到规模化落地
阿里巴巴与蚂蚁集团发布LoongSuite GenAI可观测语义规范
随着GenAI发展,OpenTelemetry推动Gen AI语义规范建设。OTel SemConv是核心,可统一数据语言、支撑治理、降低接入成本。2025年,阿里云、阿里控股与蚂蚁集团联合启动,在OTel基础上建模并落地LoongSuite GenAI SemConv。其新增Entry/Step Span、Skill语义、Token级推理观测,提升可观测性。还实现GenAI Utils,封装复杂性,已支持多个GenAI框架插桩。未来将更敏捷、高效,实现端到端追踪,与上游协同。

[极思TopMinds] AI 模型训练 行业格局 个人英雄主义 靠谱

深度丨张小珺对话姚顺宇:一个造浪者的反英雄宣言
张小珺对话姚顺宇,分享AI行业见解与个人经历
极思TopMinds的张小珺对顶尖AI研究员姚顺宇进行4小时深度访谈。姚顺宇出生宁夏,凭借“胆子大”特质,从清华到斯坦福,后从物理转行AI。他认为AI不需要天才,更看重靠谱、细致和负责,模型正商品化,核心竞争力转向定义问题和执行能力。他对比了Anthropic、Google组织形态,批评OpenAI风格,对Cursor、Meta等公司也有看法。他强调团队协同,认为个人英雄主义会破坏整体性,“靠谱”需有做事态度、系统理解和组织责任。他离开物理是因缺乏客观评价,AI更有客观标准。访谈录制后行业变化印证其“无公司地位稳固”观点,凸显“靠谱”珍贵。

[GSYTech] Android AI Gemini Googlebook

2026 Android I/O ,全新 AI 手机、 Android PC 和车载驾驶
谷歌在2026 Android I/O发布AI手机、Googlebook等更新
谷歌「Android Show | I/O Edition 2026」围绕AI展开,是“Android有史以来最大更新之一”。核心聚焦Gemini深度整合等。AI手机将Gemini升级为主动智能体式AI,有多项新功能,今年夏天在部分机型上线。Googlebook采用Android + ChromeOS融合的Aluminium OS,专为Gemini设计,今年秋季上市。Android Auto全面更新UI,新增AI功能。Android 17处于Beta 4阶段,有安全、创作、跨平台等实用功能,大部分今夏推送,稳定版预计6月左右。此次更新使Android全面AI - first化,构建统一智能生态。

[阿里云开发者] 大模型 知识工程 Agent自进化 LLM Wiki GBrain

深度解析LLM Wiki / Obsidian-Wiki / GBrain:Agent时代知识的“自组织”与“自进化”
文章深度解析LLM Wiki、Obsidian-Wiki和GBrain知识管理项目
文章围绕Agent时代知识的“自组织”与“自进化”展开。介绍了Andrej Karpathy的LLM-Wiki和Garry Tan的GBrain项目。人类不擅长组织知识,知识管理存在时效性、组织结构复杂等问题。LLM-Wiki通过Schema文件指导LLM维护结构化Wiki,实现知识“编译”,避免算力浪费。Obsidian-Wiki基于Skill,增强了架构,实现自动知识摄入和图谱化。GBrain引入中间件,采用混合检索架构和图谱实体关系,解决规模化问题,支持多模态数据。两种技术路径目标一致,企业常采用混合架构,Skill与知识动态维护是Agent进化关键。

[腾讯云开发者] 大模型 Multi - Agent Harness AI工程化

从零设计生产级 Multi-Agent Harness:架构、评估、记忆、成本与 MCP 工具接入全拆解
文章深度拆解生产级Multi - Agent Harness设计
文章指出AI Agent演示效果好,但进入生产会遇到诸多问题,真正决定Multi - Agent系统能否落地的是Multi - Agent Harness。它是Agent的“操作系统”,负责编排、调度等。文章拆解了生产级Multi - Agent Harness的设计,包括架构编排上Harness负责全局控制;工具治理要通过Tool Registry;状态与记忆需分层处理;评估体系分四层且采用混合评估;成本控制有模型路由、上下文压缩、预算分级降级策略;MCP工具接入需Harness做安全网关;还提到可观测性和分三阶段的落地路线,强调Harness对Agent系统的重要性。

[MiniMax 稀宇科技] 大模型 Agent技术 多Agent协作

一个 AI 还是不够
MiniMax升级Agent为Mavis,介绍Agent Team设计与应用
文章介绍MiniMax Agent升级为Mavis,更新包括上线Agent Teams和合并TokenPlan与Agent Plan。做Agent Team是因单Agent在复杂任务中有痛点,如意外停止、长任务变笨、难快速响应和角色分工问题。多Agent系统是需维护的基础设施,与其他方案比,MiniMax有对抗性质量门禁、确定性代码逻辑驱动和上下文隔离特点。其采用主Agent牵头,含Leader、Worker、Verifier的架构。核心落地场景有通讯软件、Coding、研究类任务、办公文档。多Agent协作有交接、共享、聚合成本,Verifier也有成本,复杂、长链路、高风险任务适合用Agent Team,简单任务单Agent或脚本即可。

[OpenBMB开源社区] 大模型 多模态模型 MiniCPM - V 4.6 ViT架构 Token压缩

新一代「小钢炮」来袭!1.3B 模型性能效率双杀,MiniCPM-V 4.6 正式开源
面壁智能等开源MiniCPM - V 4.6多模态大模型
5月11日,面壁智能联合清华大学、OpenBMB开源社区发布并开源端侧多模态大模型MiniCPM-V 4.6。它参数仅1.3B,6G内存就能端侧流畅运行。性能上,两个版本在多任务评测中表现卓越,在AA榜单超越众多模型。效率上,运行效率反超Qwen3.5 - 0.8B。技术创新方面,采用LLaVA - UHD v4重构ViT架构,图像编码计算量减50%;提供4倍/16倍混合Token压缩,可按需切换。此外,它为开发者提供便捷部署指南,适配主流框架,是垂直场景改造的优质基座,已在多终端场景落地。

[思特沃克洞见] 智能体AI 客户体验 可组合企业

智能体 AI 正在重塑客户体验:一场设计范式的永久变革
智能体AI重塑客户体验,可组合企业是重要支撑
智能体AI在客户体验领域潜力巨大,正弥合自动化与人工辅助的鸿沟,带来超个性化体验。智能体化客户体验落地需企业数据等具备可访问等特性。其应用从动态个性化开始,核心是对客户旅程编排加速,如助力保险申诉。客户体验格局因AI驱动的购买旅程改变,消费者偏好多元,需赋予选择权。可组合企业是智能体化CX的基石,打破技术孤岛,组件能灵活组装,要设定“护栏”并加强治理,为持续改进提供底层结构。

[MacTalk] 大模型 Agent DAA AI应用

DAA:李厂长在 Agent 时代给了个新坐标
百度李彦宏在Create 2026提出DAA概念
作者参加百度Create 2026,李彦宏提出DAA(日活智能体数)概念。Token是大模型行业默认计量方式,DAA则从结果视角衡量智能体有效工作。Anthropic靠高质量Agent实现营收增长,显示DAA产品优势。中国企业有技术与务实基因,复杂场景利于探索智能体应用。百度产品矩阵展示了Agent可规模性干活,如DuMate、秒哒等。百度提出“芯云模体”作为Agent时代基础设施,智能云全面升级。DAA为未来组织提供新坐标系,关注智能体数量和完成任务情况,有望成为AI新周期价值坐标轴。

[大淘宝技术] AI - Generated UI 大模型 流式输出 前端UI渲染

AI-Generated UI 技术深度解析:模型流式输出与 UI 渲染实践
淘天集团私域技术团队深度解析AI - Generated UI技术
本文深入解析AI - Generated UI技术,涵盖流式输出基础、开源项目架构、渲染挑战及未来展望。2023 - 2024年,该技术从实验室走向生产。流式输出基于SSE协议,对比了主流LLM提供商API,SSE在多数场景更具优势。核心开源项目如Vercel AI SDK、v0.dev、Bolt.new等各有特点。流式渲染面临代码解析、Markdown渲染、JSON解析等挑战,并给出对应解决方案。AI代码编辑器Cursor有独特架构,WebContainers实现浏览器内Node.js运行。生产级实践包括性能优化、错误处理等。未来,多模态流式输出、Agent驱动、边缘计算等将推动其发展。

[阿里云开发者] AI Agent 定时任务 AI任务调度

Agent从一问一答到自主执行面临哪些挑战?
阿里云MSE AI任务调度解决开源Agent痛点并开启公测
文章围绕Agent从一问一答到自主执行展开。随着AI发展,Agent向自动执行转变,定时调度是主要触发形态,主流产品重视此能力。开源Agent定时任务存在无高可用、运维成本高、权限管理弱、可观测能力弱、资源利用率低等痛点。阿里云MSE AI任务调度有诸多优势,如高可用定时调度、统一管理、精细化权限管理、企业级可观测能力等,还能弹性伸缩、任务批处理、自进化。与开源对比,它能更好支撑Agent定时任务。目前该调度已开放免费公测,支持多种Agent接入。

[搜狐技术产品] 通用人工智能 AGI AI效应 智能定义

AGI 全景图:一篇通用人工智能的综述!
文章综述通用人工智能现状、矛盾及可能形态
文章围绕通用人工智能(AGI)展开讨论。首先指出AGI定义混乱,时间表难测,人们因“AI效应”不断提高认定标准。按人类标准,当代AI已表现出通用智能,如具备心智理论、欺骗能力和迁移学习能力,但因缺乏集体共识和客观标准,难以被承认为AGI。真正的AGI可能无法被造出,存在哲学、商业和道德三重矛盾,如架构约束与自主性冲突、自主AGI有商业风险、要求AI道德完美却剥夺其选择能力。最后提出AGI可能是系统而非个体,我们需选择构建工具还是心智,AGI问题本质上反映了人类自身的焦虑与渴望。

[阿里云开发者] 大模型 技能工厂 AI coding

Skill Factory:三天手搓面向Harness设计的技能工厂(附AI coding实践)
作者分享面向Harness设计的技能工厂及AI coding实践
作者分享从产品设计到算法落地的全流程实践,介绍面向Harness设计的技能工厂。当前生成技能的人工编写和对话交互方式存在问题,技能工厂应运而生。其产品功能含技能定义、基线诊断、测试构建、多路并发生成、回归迭代和质量检查。还适配知流平台,迭代方向有统一入口、基于trace挖掘技能、功能优化。开发中用idealab、Qoderwork等编程插件辅助,最后对比三种技能生成模式优缺点。

[字节跳动技术团队] 大模型 消息中间件 RocketMQ AI通信架构

重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案
火山引擎推出 RocketMQ For AI 解决方案赋能大模型应用
AIGC 技术发展使大模型迈向企业级应用,给底层通信和调度带来挑战。火山引擎推出 RocketMQ For AI 解决方案,以轻量化通信、智能化调度、企业级可靠性为核心。传统 RocketMQ 在大模型场景有适配短板,如不能区分消息优先级、不支持海量 Queue 创建。新方案有轻量级主题(Lite Topic)和优先级消息(Priority Message)特性。在长会话链路和 Multi - Agent 协作场景中,新特性可解决传统 MQ 的问题,实现会话隔离、保证顺序性等。未来,MQ 将成 AI 系统事件总线,趋向 Serverless 化,满足复杂业务需求。

[阿里云云原生] 大模型 AgentRun 集成开发

用两行代码将 AgentRun 集成到你的应用
阿里云 AgentRun 提供五条路径助开发者集成到应用
文章介绍将 AgentRun 集成到应用的方法。前提是已有运行的 Agent。其调用端点兼容 OpenAI 协议,若项目用 OpenAI,改 base_url 即可接入。它提供五条集成路径:代码集成改两行参数调通;SDK 集成可管理资源并对接主流框架;UI 嵌入复制代码片段到网页;IM 集成控制台配置机器人,处理协议差异;事件集成接阿里云 EventBridge,自动触发 Agent。各集成方式背后共享平台基础设施,降低集成门槛。

[滴滴技术] 大模型 投机解码 EAGLE - 3 统一序列并行 长序列训练

多轮 Agent 场景下,滴滴的 EAGLE-3 训推加速实践
滴滴为 EAGLE - 3 适配 USP 实现训推加速并贡献开源社区
文章围绕多轮 Agent 场景下 EAGLE - 3 训推加速展开。先指出 Agent 场景推理延迟被放大、解码有瓶颈,投机解码需长序列训练。EAGLE - 3 训练有显存问题,源于多层特征融合和 TTT 机制。长序列训练显存瓶颈在中间状态,需序列并行,为此滴滴实现 USP。USP 将 Ulysses 和 Ring 结合,采用“先分支、再融合”解耦计算,兼顾显存、稳定性和吞吐,补齐工程地基,使单机 8 卡可稳定支持 128K 上下文训练。实测 EAGLE - 3 相比 MTP,Accept Len 约为 2.2 - 2.3 倍,P95 TPOT 降低 35% - 44%,Mean TPOT 降低约 59%。最后提出当前挑战及后续规划,相关实践已贡献至 SpecForge 开源社区。

[美团技术团队] 大模型 通用推理评测 General 365

美团 LongCat 开源 General 365:树立推理评测新标尺
美团LongCat团队开源General 365评测大模型通用推理
美团LongCat团队发布开源的General 365基准,用于评测大模型通用推理能力。当前大模型评测存在重学科推理、轻通用推理问题,现有通用推理基准有任务模板化、区分度低的瓶颈。General 365将背景知识限定在K - 12水平,具高多样性、挑战性等特征,涵盖八个推理维度。实测26款主流大模型,Gemini 3 Pro以62.8%夺冠,多数未及格。“语义干扰”与“最优策略”是性能洼地,且模型在General 365上准确率降、输出长度增,凸显其难度。项目已开源并将持续维护,还预告了5月21日的CVPR论文分享活动。

[百度地图] 地图开发 AI编程 百度地图开放平台

2026 Create大会|百度地图开放平台再添新实力:两款新品 核心能力打通开发全链路
百度地图开放平台Create大会发布三款产品助力AI地图开发
文章指出AI编程工具在地图功能开发上存在‘知识盲区’,百度地图开放平台在2026年Create大会发布脉芽MAPYA、百度地图CLI、Docs - MCP三款产品解决此问题。Docs - MCP将文档开放给AI,让其获取最新接口规范;百度地图CLI使AI编程环境便捷接入地图能力;脉芽MAPYA能理解需求转化为方案。三款产品形成闭环,大幅节省开发时间,降低开发门槛,将平台重构为‘AI能力引擎’,还让地图能力成为AI世界‘标准件’,使AI真正理解现实世界。

[百度地图] 大模型 AI汽车 百度地图 AI座舱智能体

百度 Create 2026|从单点应用到系统智能-百度地图重构 AI 汽车智能化体验
百度Create 2026大会发布AI座舱智能体平台DuDuClaw
5月13日,百度Create 2026“AI+汽车”专场,百度地图产品架构师廖龑演讲分享百度地图重构舱驾一体智能化体验实践,首次发布整车AI座舱智能体平台DuDuClaw嘟嘟虾,将底层能力开放给车企。2026年五一,百度地图AI副驾服务2亿+人次,日活峰值4倍增长,因双工语音对话和丰富语音包获认可。百度地图为AI汽车提供多领域领先方案,搭载超5000万辆车,与多家车企及服务商合作,将持续重构AI汽车智能化体验。

[浮之静] AI 软件工程 大模型 Agent

浅谈 AI 超级应用
文章探讨AI从模型神话回归软件工程秩序的趋势
文章探讨AI从模型神话到软件工程秩序回归的趋势。AI正从“回答系统”走向“行动系统”,需接入成熟软件工程结构。以Codex为例,它进入“开发任务组织”阶段,有多轨运行模式和沙盒隔离,采用浏览器双轨控制,实现控制面与执行面解耦。Agentic Web Runtime架构复刻分布式软件分层。Ralph Loop解决长周期任务上下文腐蚀问题。Markdown与HTML在AI输出格式上有争论,Google的A2UI是工程解法。Bun的Zig→Rust迁移体现复杂系统成熟后的秩序重建。AI技术演进是向标准协议回归,驯化复杂智能系统。

[海外独角兽] 大模型 AGI Coding Agent 组织文化 机器人

The Era of Agent:拾象 AGI 投资洞察
拾象团队发布AGI投资洞察,分析Agent时代趋势
文章是拾象团队的AGI投资洞察,指出2026年进入Agent时代,Coding Agent成新热点。各AI Labs重注Coding,因其是实现AGI的好环境,有飞轮效应。Anthropic靠战略聚焦在Coding领先,OpenAI虽有优势但战略失误,Google是稳定追随者但慢。市场应按To Human/To Agent划分,Agent成新消费者和生产者,相关基础设施正重构。机器人领域2026年是数据Scaling大年,技术从VLA转向World Model Policy,Neo Labs分追寻范式和专注高价值领域两类。

[Datawhale] AI AI原生公司 创业指南

Anthropic创始人手册:如何打造一家 AI Native 公司!
Anthropic发布手册指导打造AI Native公司
Anthropic发布《创始人手册:如何打造一家AI Native公司》,按2026年可实现的AI能力梳理初创公司四阶段。手册指出创始人角色向智能体编排者转变,AI降低执行门槛但非判断门槛,创意阶段应重验证。AI使小团队获大公司能力,削弱大公司组织壁垒。AI原生公司护城河是领域知识、用户数据飞轮、工作流锁定。这表明AI公司进入新阶段,AI原生是一种公司形态,正在改变公司本身。