阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选技术周刊技术周刊SignalSignal个人博客个人博客
登录注册
第 275 期

Signal #15:Agent 开始进入团队账本

2026.06.08

技术周刊

第 275 期
2026.06.08
Signal #15:Agent 开始进入团队账本
第 274 期
2026.06.01
Signal #14:AI Coding 的新指标,不再只是代码采纳率
第 273 期
2026.05.25
Signal #13:AI Coding 的下一站,是失败与反馈
第 272 期
2026.05.18
Signal #12:Coding Agent 正在拥有自己的运行时
第 271 期
2026.05.11
Signal #11:Agent 的中间过程,正在被产品化
第 270 期
2026.05.04
本周 Signal:Coding Agent 正在从工具入口,走向工程基础设施
第 269 期
2026.04.27
本周 Signal:模型更新仍然重要,但不再是唯一主角
第 268 期
2026.04.20
本周 Signal:多 Agent 并行,开始从实验玩法变成产品默认交互
第 267 期
2026.04.13
本周 Signal:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
第 266 期
2026.04.06
本周 Signal:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
第 265 期
2026.03.30
本周Signal:执行开始接管软件,界面退居为观测层
第 264 期
2026.03.23
本周 Signal:复杂度开始从“人”迁移到“系统”
第 263 期
2026.03.16
本周 Signal:软件工程岗位开始 AI-native 化
第 262 期
2026.03.09
本周 Signal:AI 工具正在获得长期记忆
第 261 期
2026.03.02
本周Signal & 我们可能一直误解了AI对软件研发的影响
第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 274Signal #14:AI Coding 的新指标,不再只是代码采纳率

Signal #15:Agent 开始进入团队账本

这周有几条新闻放在一起看,挺有意思:Uber 被曝几个月就用完了全年 AI coding 预算,随后开始给员工和各类 agentic coding tool 设置使用上限;Microsoft 也被曝开始取消大部分内部 Claude Code licenses,把开发者往 GitHub Copilot CLI 迁移。

这些新闻不一定说明 AI Coding 不划算,但至少说明一件事:当 Agent 从个人尝鲜进入团队级使用,问题就不再只是“好不好用”,而是“谁在用、用了多少、花了多少钱、产出了什么、是否值得继续投入”。

Cursor 这周调整 Teams Pricing,也是在同一个方向上。它为 Teams 引入更明确的 usage pool、Premium seat、实时用量可见性和 spend controls,本质上是在回答团队使用 Agent 后的成本管理问题。

Microsoft Foundry 这周则从平台侧给出另一种答案:Trace、Evaluate、Monitor、Optimize,把 Agent 的运行过程、质量评估、成本收益和持续优化放进同一个 Agent DevOps loop。

这个变化值得记录:Agent 正在从“工具能力”变成“生产资源”。只要它是生产资源,就需要进入团队账本。

未来 AI Coding 的竞争,不只是谁的 Agent 更会写代码,也是谁能把 Agent 的成本、质量、效率和收益算清楚。

国内技术

AI 技术与算法实践

[腾讯技术工程] AI Coding Chromium 提示词体系 技能系统 知识库

深入解析Chromium的 AI Coding 开发体系
QQ浏览器团队解析Chromium的AI Coding开发体系
QQ浏览器团队开发者解析Chromium的AI Coding开发体系。Chromium是大型开源C++项目,构建了AI Agent基础设施,支持三种AI工具。其体系包含多方面:AI Policy明确人与AI责任边界;Prompts是分层组合架构,指导AI行为;Skills有18+个专业模块,按需激活;Knowledge Base采用Agentic RAG架构,让AI基于权威文档工作;Eval有评估测试套件,确保体系稳定;Projects是AI驱动的大规模工程。最后以“实现页面分屏”为例,展示各机制协同工作。该体系文档积累超11年,对团队落地AI Coding有借鉴意义。

[阿里云云原生] AI Agent Skill SkillClaw Nacos 团队协作

SkillClaw × Nacos:从一次 Agent 会话到可治理 Skill Registry 的自动演化闭环
高德技术团队SkillClaw与Nacos联合打造Agent Skill演化闭环
文章围绕AI Agent的Skill展开,指出当前Agent虽能力渐强,但经验难以复用和共享。一是产生之困,经验难转化为可复用Skill;二是共享之困,缺乏团队级Registry承接Skill管理。SkillClaw和Nacos分别解决这两个问题。SkillClaw聚焦Agent运行时,从真实会话提炼经验生成Skill;Nacos聚焦团队资产,使Skill成为可治理资源。二者联合共建形成闭环,SkillClaw产生Skill,Nacos管理与分发。通过周报会话实例展示链路运作,还介绍多个落地场景,如新人接手项目、处理线上问题等,旨在让个人经验成为团队AI资产。

[阿里云云原生] AI Agent 可观测性 数据采集 语义规范

让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
阿里云推出Agent观测审计数据采集方案及可观测语义规范
2025年AI Agent规模化落地,但运行行为难感知追溯,阿里云打造覆盖三大类Agent的完整数据采集方案。先介绍Agent形态及可观测挑战,如执行黑盒、轨迹难追溯、成本难度量。接着给出差异化采集方案,Coding Agent用LoongSuite Pilot端侧平台,个人通用助理一行命令接入,高低代码框架Agent用LoongSuite Python Agent零代码插桩。接入后可获全链路调用链、Token消耗、会话对话、工具调用审计等视图。还基于OTel GenAI规范推出LoongSuite GenAI规范,弥补社区标准空白,通过Entry/Step Span、Skill语义等扩展,配合GenAI Utils工程化封装,实现规范落地迭代。

[数字生命卡兹克] AI 软件工程 工作原则 自动化 团队管理

分享Claude Code团队内部的5条工作原则,我觉得每一条都值得学习。
Claude Code团队工程总监分享AI时代工作原则
文章分享Claude Code团队工程总监Fiona Fung演讲内容。在AI时代,写代码不再是瓶颈,瓶颈转移到验证、评审等。Fiona指出旧流程如规划、代码所有权等领域失效,对应提出新规范。规划上采用JIT规划,先做原型再补文档;自动化方面,团队遇重复工作会追问能否自动化;代码评审是Trust but verify,Claude处理部分工作,人类负责专业判断;团队角色界限模糊,招人看重创意和系统背景;推动团队变化要保持扁平、让AI做事、主动审视流程。最后还提出三个待思考问题。

[得物技术] 大模型 LLM Agent 告警排查

用 LLM Agent 重构告警排查流程|得物技术
得物用LLM Agent重构告警排查流程,提升效率
文章介绍了得物用LLM Agent重构告警排查流程的技术方案。传统告警排查需频繁切换平台、依赖个人经验,得物开发的Troubleshooter系统,采用分层设计,核心是ReAct Agent。系统流程包括告警接入、指纹生成、知识匹配、AI排查、结论验收、报告推送和知识沉淀。AI排查中,SupervisorAgent编排操作,有四个排查工具,具备动态策略组装、工具超时隔离和AI权限安全保证等机制。还构建幻觉控制体系保障结论质量,实现排查过程可观测。真实案例显示,系统将排查耗时从10 - 30分钟降至4分钟左右。此外,文章提及技术难点、运行数据及后续迭代方向,如多Agent并行排查、自动处置等。

[阿里云云原生] 本体论 Ontology Token消耗 依赖探索 运维场景

本体论 Ontology 泛谈丨如何帮企业应对 Tokenmaxxing 困局
文章探讨本体论帮企业应对Tokenmaxxing困局
文章围绕本体论(Ontology)探讨如何帮企业应对Tokenmaxxing困局。先以Uber为例,引出企业需建立AI成本管控机制的课题。接着从三类数据源初探Token消耗分布,指出Agent的Token消耗绝大部分是Input,C2依赖探索最适合架构手段干预。然后介绍依赖探索的三个范式,Ontology能将实体和关系提升到一等公民位置。通过代码和运维场景实证,表明Ontology可降低Token消耗。判断模型变强后,Ontology在运维领域价值仍明确。最后介绍阿里云STAROps平台,展示Ontology在运维故障诊断中的应用。

[搜狐技术产品] AI Agent 图论 LangGraph 工作流编排

LangGraph:基于图的 AI Agent 编排框架深度解析
文章深度解析LangGraph AI Agent编排框架
文章围绕LangGraph展开,先介绍图论基础,包括图的定义、分类、遍历算法及在AI Agent编排中的应用。接着阐述LangGraph核心概念,如节点、边、状态管理等。对比传统Chain,LangGraph优势明显,能解决其缺乏灵活性等问题。应用场景有多Agent协作、复杂决策、数据处理和工作流自动化。最佳实践涉及状态、节点、图结构设计,性能优化及测试调试。还介绍进阶技巧,如动态图构建、中间件等。最后总结其核心价值、适用场景和学习路径。

[搜狐技术产品] 文本审核 多模式匹配 AC自动机 双数组Trie树

高效的文本内容审核系统实现
团队实现高效文本内容审核系统并介绍应用拓展
文章围绕高效文本内容审核系统展开。首先指出构建该系统对维护网络健康至关重要。接着介绍新闻客户端文本审核流程,采用机器审核为主、人工审核为辅的分层机制。然后阐述系统实现效果与核心算法,对比多模式匹配算法,重点介绍 AC 自动机算法及其优缺点,提出优化的双数组 Trie 树 AC 自动机算法并详解原理。还说明了系统核心技术实现流程,包括初始化、敏感词查找、结果过滤、审核结果返回等步骤,且系统线上运行指标优异。最后提及系统可拓展到多场景,双数组 Trie 树 AC 自动机算法也有延伸应用,并对比其与大模型的适用场景。

[字节跳动技术团队] Agent ContextBucket 上下文管理 记忆检索 工作区持久化

ContextBucket:Agent 的"无限"记忆与工作区底座
火山引擎推出ContextBucket解决Agent上下文管理难题
随着Agent进入生产环境,其上下文管理面临记忆、工作区和治理三类断层问题。火山引擎的ContextBucket是解决这些问题的托管服务,在一套服务层内提供文件存储、记忆管理等能力。它能智能提取记忆,采用多路检索精准召回,服务端存储使记忆易迁移。工作区文件可持久化,工作流能跨Agent无缝迁移,且支持多路召回。接入只需一键安装与验证插件。Locomo评测显示,接入后回答正确率大幅提升,成本下降。它适用于研发、办公、终端助手和企业Copilot平台等场景。未来将向更智能检索和更开放生态方向演进。

[火山引擎Agent社区] AI AI Profiling VKE AI Profiling 性能优化

一篇看懂 VKE AI Profiling:AI 应用性能分析优化实战
字节跳动团队推出VKE AI Profiling并展示优化实战
文章围绕VKE AI Profiling展开,介绍其价值及使用方法。先指出大模型训练和推理常遇性能问题,AI Profiling能快速定位。字节跳动将内部实践产品化封装成VKE AI Profiling并对外服务。接着结合ResNet18训练案例,阐述使用该工具做性能排查与优化的流程:先给出基础版训练代码,再进行零代码采集发现三类瓶颈。针对数据加载慢、数据拷贝低效、未用混合精度问题,分别提出提升num_workers、开启pin_memory和non_blocking、开启AMP等优化方法,优化后收益明显。最后强调AI Profiling对训练和推理都重要,是AI工程化必需能力,还提及可继续探索其他优化方向。

[微软亚洲研究院] AI 视频编解码 Agentic Media

科学匠人 | 郭宗昱:在AI时代主动“转身”,让多媒体成为会思考的“智能体”
微软郭宗昱从视频编解码转向Agentic Media研究
本文介绍微软亚洲研究院高级研究员郭宗昱的科研历程。他热爱‘构建’,选择计算机专业并深耕多媒体视频编解码领域。2019年视频流量爆发,他聚焦基于深度学习的编解码研究。2021年底实习时,接触到AI与视频编解码融合技术,毕业后正式加入研究院。他参与视频会议带宽优化研究,后因AI发展转向Agentic Media课题,探索信息表征新范式,团队提出三层架构并推进相关研究。郭宗昱经历两次AI认知‘顿悟’,认为应主动适应变革。

[腾讯云开发者] AI Agent Cube Sandbox 快照技术

Cube Sandbox v0.3.0 来了:让 AI Agent 拥有“时光机”和“分身术”
腾讯云 Cube Sandbox 发布 v0.3.0 版,升级架构添新功能
腾讯云 Cube Sandbox 发布 v0.3.0 版本,有 21 位贡献者合入 65 个 commits,实现关键架构升级。此版本在基础设施层面有重大改进,如新增引擎内核、支持 Go SDK 与上线 WebUI、优化部署与运维。其核心是“快照、回滚与克隆”体系,“快照”可存档沙箱状态,“克隆”能从一个沙箱派生多个副本,“回滚”可让沙箱恢复到之前状态。该体系能解决 AI Agent 环境复制和出错恢复的痛点,解锁多个业务场景。还介绍了快照技术实现原理和实战使用方法,同时开源了可视化 Web 管理。未来版本将加强沙箱安全管控。

[腾讯技术工程] AI编程 Skill编写 AI工程化

如何写好 Skill:一份终极实战经验手册
作者分享写好 Skill 的实战经验与方法
文章围绕如何写好 Skill 展开,介绍了 Skill 概念、结构、编写技巧等。Skill 是给 AI 编程助手加装的能力包,能解决知识分散等问题,通过渐进式加载机制运作。文章给出 Skill 结构示例,强调 Description 精准、指令明确等编写技巧,还介绍模块化拆分方法。此外,阐述了外部服务调用选择、安全注意事项,推荐使用 Skill Creator 辅助编写和评估。最后提供验证、调试、生命周期管理方法及反模式和检查清单。

[大淘宝技术] 数字人 3D建模 淘宝Vision XR技术

CCIG 2026 | TaoAvatar:3D真人数字人在淘宝Vision领域的应用
淘天Meta技术团队分享3D真人数字人在淘宝Vision应用
2026年5月29 - 31日,中国图像图形大会(CCIG 2026)在广州召开,淘天业务技术Meta技术团队受邀出席。团队展示核心技术成果,并分享3D真人数字人TaoAvatar在淘宝Vision领域的应用。TaoAvatar去年推出,今年扩充形象、服饰类型,提升动作丰富度与质量。其基于3D高斯泼溅技术,解决传统3D建模问题,集成多种能力,有高指标表现。还介绍真人体型动作捕捉、动态重建、语音驱动手势、4DGS体积视频等核心技术。此外,淘宝Vision线上线下应用成果显著,团队还探索低成本数字人生成方案,如FHAvatar。

[阿里云云原生] 云计算 AI Agent AI任务调度 Sandbox休眠唤醒

让 Agent 成本直降 90%:阿里云 MSE AI 任务调度支持Sandbox休眠唤醒
阿里云 MSE 团队推出 AI 任务调度,降 Agent 成本超 90%
随着 AI 发展,Agent 从答疑助手走向自主执行任务的个人助手,但面临资源利用率低、成本高的困境。阿里云中间件 MSE 团队推出 AI 任务调度产品,结合 Agent Sandbox 运行时,可动态休眠/唤醒 Agent,使成本下降 90%以上。AI Agent 因有状态、需安全隔离、资源利用率低,成本高于传统 Web 应用。AI 任务调度与 Agent Sandbox 结合,能实现 OpenClaw 的动态休眠/唤醒,还有任务统一管理、资源弹性伸缩等能力。以 OpenClaw 5 个定时任务为例,使用该方案一天仅工作 100 分钟,成本大幅降低。目前 AI 任务调度已开放免费公测。

[梯度不陡] AI Coding 产设研协作 产品交付 SDD

AI写代码越来越快,为什么交付还是反复返工?
作者探讨AI时代产设研协作变化并将做开源实践
文章指出AI虽让代码生成变快,但交付仍返工,原因在于需求交接断点。过去产设研协作靠人补断点,AI加入后,输入断点被放大。真实产品交付中,各角色信息分散,产物间缺乏连续关系。未来协作中心或从文档转向产品现场,围绕交付项推进,让各产物成不同视图。执行完成后证据回流形成闭环,避免局部变快而交付不顺。作者将沿此方向做开源实践。

[Datawhale] AI开发 项目改造 知识库 自动化测试

一个研究生的硬核教程:把AI真正用进真实项目!
东南大学研究生分享将AI用于真实项目的硬核教程
东南大学研究生郭子扬分享把AI用于真实项目的经验。指出当前AI写项目不确定性大,传统项目对AI不友好,原因在于AI缺乏领域知识和不会偿还技术债。提出改造项目使其对AI友好的方法:让AI反推项目行为生成草稿,经人工Review形成正式Spec;建立团队知识库,实现知识共享;装上质检关,通过标准化Spec和自动化测试降低开发者Review压力;利用AI实现软件工程自动化。最后分享个人观点,鼓励用AI提高生活效率,锻炼自动化思维。

[阿里云开发者] 大模型 Agent评测 Harness工程 Claude Code

基于顶级 Agent(Claude Code)的 Harness 工程搭建式业务 Agent 评测方案
用Claude Code搭建Harness工程实现业务Agent快速评测
文章围绕基于Claude Code的Harness工程搭建式业务Agent评测方案展开。先指出业务Agent迭代快但传统评测工程搭建慢的矛盾及痛点,提出用Claude Code作为Harness工程搭建者和运行者的解法。介绍Harness工程三层架构、搭建五步法,对比传统评测工程变化及职责分工。阐述统一评测指标框架,包括三层指标体系和新Agent接入指标选型流程。说明Harness各层搭建方法,分享关键实践经验。对比效率,显示该方案在时间投入和质量保障上优势明显。分析适用场景与局限,列举可复用资产并给出快速上手指南。最后总结核心理念、收益、适用场景,提出开放讨论问题。

前端开发与工程化

[支付宝体验科技] 前端开发 构建工具 Turbopack utoopack

@utoo/pack:基于 Turbopack 的下一代构建工具
Utoo团队发布基于Turbopack的前端构建工具utoopack
utoopack是Utoo工具链中负责前端构建的工具,是蚂蚁上一代前端Rust构建工具Mako的Next版本,基于Turbopack。它在性能上,冷启动比webpack快3到10倍,热更新速度快几百倍,大型项目热启动达毫秒级。目前已在蚂蚁内部业务及多个开源前端框架落地,npm下载量约9w。utoopack解决了Mako的一些问题,选择Turbopack是因其成熟性、掌控力和先进性。其架构复用SWC和Lightning CSS,对Turbopack进行拓展。它补齐了兼容性和通用bundler能力,还做了底层能力改造。文章还给出了在umi中、独立使用及webpack兼容模式下的使用指南。

[奇舞精选] 前端开发 AI辅助开发 Cursor工作流

我的 AI 驱动开发工作流:基于 Cursor 的全流程实战开发 SOP
作者分享基于Cursor的AI驱动开发五段式工作流
作者分享基于Cursor的AI驱动开发工作流,指出当下开发比拼业务拆解、架构把控等能力。工作流含五步:业务需求分析,借AI吃透需求、拆解任务;代码架构设计,先定架构再落地业务;业务代码编写,AI高效落地、人工严控质量;改Bug与迭代优化,智能排错、持续打磨;Token消耗治理,精准控耗、高效调度AI算力。作者认为人用结构化思维,AI高效执行,能调度AI的开发者将占优势。

[GSYTech] Flutter 自动化测试 Patrol AI

Flutter 最好的 AI 自动化测试工具:Patrol
LeanCode开发的Patrol成Flutter最佳AI自动化测试工具
Patrol是LeanCode开发维护的Flutter跨平台E2E测试开源框架,弥补官方短板,对AI友好。开发者可用Flutter风格写测试用例,操控Flutter和原生组件。它能处理权限弹窗、操作通知等,有自定义Finder系统、支持Hot Restart等优点。其项目通过Melos管理,核心是双向gRPC通信架构。原生侧Android和iOS有各自实现方式,patrol_cli负责编排。它功能丰富,涵盖Flutter UI、系统权限等多方面,还支持部分原生操作。目前支持Android、iOS、Web、macOS,但存在Web支持不完整等局限。结合AI可实现自动化测试,值得Flutter开发者尝试。

[ByteDance Web Infra] 前端开发 TanStack Start框架 Rsbuild

TanStack Start 框架正式支持 Rsbuild
TanStack Start 框架正式支持 Rsbuild v2
本文介绍 TanStack Start 框架正式支持 Rsbuild v2,用户使用该框架时可在 Vite 和 Rsbuild 两套构建工具方案中选择。适配器由与 Rspack 团队共同完成,推动了 Rspack 和 Rsbuild 改进。目前 React 和 Solid 已获支持,未来新增框架适配器可复用接入方式。为用 Rsbuild 的团队提供 Start 接入路径,方便迁移且保留原有配置,已有大公司应用。双适配器规则使构建层边界更清晰,团队可按需选构建工具,Rsbuild 适配器已可用并给出使用指南。

[大转转FE] 前端开发 验证码识别 AI辅助训练 CNN模型

验证码识别实战:前端不写页面,改训模型了?
前端团队用两种方案结合AI完成验证码识别训练
文章记录前端团队用DDDD低代码训练和PyTorch CNN两种方案搞定4位数字+字母验证码识别的过程。面对简单难度验证码,用DDDD方案,环境准备后进行数据集组织、配置文件编写和训练,能快速覆盖样本,验证集准确率超97%;对于复杂难度验证码,借助AI生成代码骨架,经数据适配和参数微调,半小时跑通训练,测试集序列准确率达99%。完成项目后,团队工作方式改变,AI承担样板代码编写,复用图像处理经验,迁移工程化思维,前端从AI消费者变为生产者。

[MacTalk] RSS阅读器 AI辅助 信息聚合

全盘托出我的一手信源。及,俺第一个 Vibe 项目上线了:重启 RSS
作者推出带知识库的现代RSS阅读器CatReader
作者分享一手信源重要性,指出应阅读AI实验室Blog等一手内容。因现有RSS阅读器存在不足,作者春节后启动带知识库的RSS阅读器项目,基于Claude Code和Codex构建。项目历经前后端分离、用户系统改造等工程迭代,最终产品发布给墨问Pro会员。该阅读器有两百多订阅源、18000多篇文章,含图文、播客和音频。有文章推荐、快捷键,AskCat智能助手可感知上下文回答问题,还具备历史会话和记忆功能,产品会持续迭代。

[前端圈] 前端开发 Vite Cloudflare 开源工具

VoidZero 宣布加入 Cloudflare
VoidZero宣布加入Cloudflare,持续支持开源项目
VoidZero宣布加入Cloudflare,Vite等项目保持开源。尤雨溪多年致力于开源开发工具,2023年创立VoidZero构建JS工具链。到2026年,团队在Vite等工具上取得进展,周下载量可观。虽工具采用率增长快,但商业化难题待解,曾尝试Vite+混合许可模式不合适,后开发Void平台又遇问题。此前VoidZero及Vite团队与Cloudflare有合作,二者协同效应明显,加入后可专注擅长之事,助力Cloudflare成更好的Vite应用部署平台,且此时AI改变行业,双方合作可打造端到端体验。

[GSYTech] Android开发 内存管理 App适配

Android 17 内存管理将严格管控,App 要注意适配
谷歌在 Android 17 加强内存管控并给出 App 适配建议
从 Android 17 起,谷歌将严格管控内存,按设备总 RAM 给 App 设内存上限,超限可能杀进程且无常规崩溃堆栈。以往 Android 靠 LMK 治理内存,新逻辑是防止单个 App 影响系统流畅度。官方给出判断 App 受内存限制的方式,还提供适配方案,如 R8 字节码优化、图片处理优化、解决内存泄漏、主动释放缓存、利用 ProfilingManager 收集数据、使用 adb shell am memory-limiter 命令等,督促开发者抓紧适配。

[谷歌开发者] Android XR SDK 跨设备开发 增强体验 沉浸式体验

Android XR SDK 最新动态: 开发者预览版 4 现已推出
谷歌发布 Android XR SDK 开发者预览版 4 并推相关计划
谷歌发布 Android XR SDK 开发者预览版 4,致力于统一跨设备开发,采用更具描述性的设备命名。此版本更新诸多,能助开发者为 XR 设备构建体验。核心库将进 Beta 版。还推出 Android XR Developer Catalyst 计划。在增强体验方面,引入新 API,如 Jetpack Projected 的设备可用性和 ProjectedTestRule API 等;显示眼镜界面库有字体和组件更新。沉浸式体验上,核心功能迁移到 Beta 版,采用现代架构;Jetpack SceneCore 扩展 3D 模型能力并引入自定义网格;Compose for XR 提供原生 glTF 支持;ARCore for Jetpack XR 提供 Geospatial API 预览版。开发者可访问官网获取资料,谷歌还添加对游戏引擎的支持,提醒申请加入相关计划。

后端与云原生架构

[腾讯云开发者] 后端开发 Django 性能优化

两个字符让Django接口快了8倍:一次险些翻车的线上性能排查实录
作者排查Django接口性能问题,加两字符使接口快8倍
本文是一次Django接口性能排查实录。5月某直播业务监控告警,get_svr_info接口抖动,成功率下降。该接口基于老技术栈,全量场景响应体大且被高频调用。作者起初认为是ORM对象构造开销问题,将ORM model改成values直出、裁剪字段,仅快1.12倍。接着怀疑JSON序列化、网络问题,分别换ujson库、开启nginx的gzip压缩,提升均不明显。通过本机回环测试排除网络问题,发现TTFB短而Total长,问题出在StreamingHttpResponse。原代码是假流式,将完整JSON字符串逐字符输出,性能差。修复时加一对方括号,或直接用HttpResponse,接口性能大幅提升,最大场景快8.21倍,整体平均快4.00倍。最后总结经验,强调性能排查不能靠直觉,数据才是答案。

工程效率 & 工具链

[转转技术] AI工作流 组织记忆 AI Agent 知识库

侠客汇 AI-Native 之路:如何打造「可自进化」的端到端 AI 工作流
侠客汇打造可自进化的端到端AI工作流提效
本文以侠客汇会员改版需求为例,介绍打造「可自进化」的端到端AI工作流的实践。此前改版需3个月,如今3周即可交付,效率大幅提升。旧流程慢源于重复劳动多、信息衰减、经验不沉淀。为此,团队秉持两个信念:AI Agent驱动各环节,人做决策审核;构建「可自进化的组织记忆」。产品线聚焦现有系统日常迭代,通过三步提效:用会议纪要替代BRD;AI分步生成PRD并人工逐段确认;AI直出UI交付物料。技术线构建「项目知识库」,先为老项目沉淀知识,再在日常需求中自进化,包括知识装载、归档、入库和淘汰。两条线内核相同,均由AI驱动、人决策、经验自进化。最后总结三条经验:立「事实来源」、设「质量闸门」、建「沉淀飞轮」,强调沉淀领域知识的重要性。

[Unity官方平台] 游戏开发 InstantAsset 资产免构建

团结 InstantAsset 资产免构建方案介绍,助力高效开发迭代
团结引擎推出InstantAsset资产免构建方案助力开发
文章介绍团结InstantAsset资产免构建方案。传统AssetBundle工作流在项目规模增大时,存在构建耗时、资产冗余、依赖管理复杂等问题。InstantAsset是团结引擎新资产管理方案,核心是复用Artifact免重复序列化,支持免构建运行。它通过复用Artifact、基于GUID的运行时资产映射、基于Accelerator的Runtime资产服务层实现。使用包含InstantAssetManager和InstantAssetTable两个类,开启免构建模式需在Project Setting窗口配置Cache Server并开启相关功能。还提供了详细技术原理、使用文档等链接。

[大转转FE] iOS开发 代理治理 测试机 星舰

星舰:iOS 测试机代理治理实践
转转团队推出星舰工具解决iOS测试机代理治理难题
文章介绍了星舰——iOS测试机代理治理内部工具。先指出研发切代理时的痛点,如操作繁琐、不知代理归属、影响三方服务、无代理状态感知等。对比市面方案后,制定快速切换、配置可见、按域名分流、链路通畅可视化等目标。具体实现包括主链路搭建、主App与扩展通信、协议翻译、快速切换代理、代理状态可视化、解决iOS路由问题及链路探活。还复盘了小程序抓包问题,最后表示星舰已在多部门使用,简化了切代理操作,欢迎有类似困扰者使用。

[TRAE.ai] 数据采集 可视化 SOLO 飞书多维表格

只需 5 步,用 SOLO 实现数据采集到可视化全流程
Damond和小阳用SOLO搭建全自动作品采集系统
本文是用SOLO实现数据采集到可视化全流程的自动化实战教程。作者因「SOLO X脉脉挑战赛」收集参赛作品时遇到难题,决定用SOLO(Work模式)和飞书多维表格搭建“全自动作品采集系统”。教程分五步:与SOLO沟通梳理方案;配置飞书应用,创建、获取凭证、开通权限、发布应用并获取多维表格信息;配置多维表格字段并添加应用;用SOLO开发采集服务,自动生成项目结构和代码,涵盖配置、数据采集、AI分析、同步等功能;部署到服务器,先准备环境,上传解压文件,配置环境变量,测试运行并设置定时任务。最终实现3400多个参赛作品自动采集、每小时同步更新等功能。此外,文章还分享了开发中的踩坑经验和核心经验。

系统性能与底层优化

[iOS新知] Mac安全 恶意软件 网络攻击 信息窃取

Mac 恶意软件 Q1 大起底:66% 用户中招,苹果修了个补丁两周就废了
2026年Q1 Mac安全报告揭示恶意软件入侵现状
2026年Q1 Mac安全报告显示,攻击者改变入侵方式,ClickFix成默认入侵手法,占2025年初始入侵手法47%,66%装特定软件的Mac用户至少遇一次威胁。诱饵难分辨,如假CAPTCHA等。苹果虽在macOS Tahoe 26.4加防御,但两周就被绕过。木马占比从2024年16.61%升至2025年50.32%,窃取器偷数据后留后门。新恶意软件难被杀毒软件检测,还针对开发者机器,iOS相对安全。

[GSYTech] Linux调度器 Android 功耗优化 PELT schedutil

一个 Linux 调度器优化,让 Android 多耗 20% 的电,传音工程师如何发现问题?
传音工程师发现 Linux 调度器优化使 Android 多耗电并提交 patch
传音控股工程师 Hongyan Xia 在 LKML 提交 patch,撤掉 cpu_util() 里基于 runnable_avg 的 boost 逻辑。此前传音工程师升级 Linux 内核后,多款 Android 手机 SoC 功耗上升,部分场景增加约 20%。经定位,问题出在 Linux CPU 调度器和 schedutil 的 boost 逻辑,该逻辑为解决 util_avg 反应慢问题引入 runnable_avg 以积极提频。但如今在 Android 上,runnable_avg 高不意味着 CPU 频率不够,且 Android 已有更直接的性能机制,厂商也有自身策略,该逻辑易导致过度提频,使功耗增加却无性能提升。这表明过去的优化在现在可能成为负担。

大模型 & AIGC 前沿

[MiniMax 稀宇科技] 大模型 MiniMax M3 多模态 长上下文 代码能力

MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你
MiniMax发布M3模型,具前沿能力且多项应用表现出色
MiniMax今日发布M3模型,它使用MSA架构支持1M超长上下文,是国内首个具备前沿Coding、1M上下文、原生多模态能力的开源模型。在多项评测中表现出色,如在SWE - Bench Pro上超GPT - 5.5等。MSA架构简洁可扩展,解决了context scaling问题,提升了计算效率。M3在Coding和Agent能力上重点提升,构建交互式用户模拟器框架缩小与真实使用体验差距。在验证论文、CUDA算子优化、模型训练等实际任务中表现优异。同时,MiniMax Code更新,Token Plan提供三档配置,M3 API开放使用并开启限时5折活动,后续将更新技术报告和开源模型权重。

[数字生命卡兹克] 芯片 统一内存 CUDA RTX Spark

英伟达发布全新RTX Spark - 个人PC的新时代。
英伟达发布RTX Spark芯片开启个人PC新时代
英伟达在NVIDIA GTC Taipei 2026发布全新消费级芯片RTX Spark,被认为将重新定义个人电脑。它基于GB10芯片,有高AI性能、多核心及大内存,能本地跑120B模型。其采用统一内存,解决传统PC内存架构数据交换慢问题,利于本地跑大模型。此外,RTX Spark结合了CUDA生态,这是苹果等平台所欠缺的。Adobe等会针对其优化软件,英伟达还将与微软重塑Windows的Agent生态,为本地运行大模型提供良好环境,开启个人电脑新时代。

[大淘宝技术] 大模型 AI Friendly架构 架构演进 业务系统落地

面向 LLM 的架构设计:什么是真正的 AI Friendly 架构?
淘天集团营销&交易技术团队探索AI Friendly架构及业务应用
2025年是AI智能体元年,传统工程架构与AI“不确定性”冲突,需向AI Friendly架构演进。该架构通过三范式转变实现升级:从确定性到概率性,收敛输出;从结构化到语义化,基于意图响应;从静态到动态,转向规划。其核心能力包括Multi - Agent系统、上下文工程等。在实际业务中,如秒杀AI审核准确率达95.7%,CogentAI问题解决准确率超98%,提升业务效率超80%。不过,并非所有系统都需架构升级,应依业务需求而定。此外,还介绍了系统核心能力实现,如从ReAct到Multi - Agent、从提示词工程到上下文工程等。

[字节跳动技术团队] AI Agent协作 扣子3.0 多端协同

扣子 3.0 正式上线:新一代 AI 团队,从扣子开始
扣子3.0上线,带来多端协作及Agent团队协作新体验
扣子3.0正式上线,三端全量更新。它带来全新电脑端,App全面升级,可创建项目,召集不同Agent协作。支持切换模型,可接入本地Agent,新建云端Agent,还有职业模板。项目空间是任务管理空间,支持多人协作完成编程、视频项目。技能商店提供专家级技能包和权威数据集。实现三端协同,任务可跨设备推进。今晚有博主直播开箱,后续还将走进书店、高校等,开展系列直播活动。

[腾讯云开发者] 软件工程 大模型 AI工程化 范式革命 隐性知识蒸馏

AI软件工程范式革命的思考
作者探讨AI时代软件工程范式革命及落地路径
文章围绕软件工程范式革命展开,指出过去五十年软件工程未真正工程化,靠人力堆,大模型出现带来转机。经典工程靠“能源换低阶智能”成功,软件因高阶认知难固化而卡壳,以往方法论未改变靠人力的本质,但留下自动化验证基础设施。大模型实现“能源换高阶智能”,却带来新不确定性,需二阶控制论应对。人在自动化时代角色转变为偏差拉回者,软件研发人力流向四个方向。“人为中心+AI辅助”模式有缺陷,应走向“AI为中心”,通过“闭环优先,节点逐步开放”落地,继承分治结构,按六阶段演进。还提到四节点重构、分层递阶控制,以及最难的场景驱动隐性知识蒸馏问题,最后指出人将从“人肉编译器”变为“产线设计师”等岗位。

[深思圈] AI医疗 医疗流程 AI渗透阶段

陪跑澳洲AI医疗一年,MRR 翻了 12 倍:我对AI医疗的三阶段认知反转
梁杰分享陪跑AI医疗一年经历及三阶段认知
作者梁杰分享陪跑澳洲AI医疗一年的经历与认知。2025年5月投资AI医疗公司Facere,至今年4月其MRR涨12倍,但增速慢于预期。美国医疗行政管理支出高,AI医疗机会在于将人力服务支出转为AI支出。医疗AI渗透分三阶段:第一阶段是单点纯线上产品,如临床循证和门诊转录,头部已现但价值待明;第二阶段是与医疗场景融合的深水区,涉及多职能、多参与方协作,摩擦大但壁垒高,包括intake、workflow、billing三个核心节点;第三阶段是谁来定义AI时代医疗流程新范式,三个节点会相互侵蚀、向中心收敛,赢家或从节点长出并降级Epic。

[MacTalk] 大模型 Flash模型 Agent场景 多模态 搜索能力

Step 3.7 Flash:为 Agent 而生的高频引擎
阶跃星辰发布 Step 3.7 Flash 模型,适用于 Agent 场景
阶跃星辰发布的 Step 3.7 Flash 模型上线,它是面向 Agent 的高效率多模态模型,推理速度快,最高 400 tokens/s。作者用它创建 “Agent Loop Analyzer” 小工具,几分钟就得到逻辑完整的 demo 页面,还拿到 Agent 实时分析并增加自定义单价功能。该模型主打“Agent 效率”,定位生产级 Agent,延续特定架构设计,优化多方面能力,已开源支持本地部署。它原生支持图像和视频理解,简化多模态处理;优化搜索能力,能融入决策。还适配主流 Coding 与 Agent 框架,接入成本低,适合高频、多步骤、工具密集的 Agent 场景。

[阿里云开发者] 大模型 多模态智能体 Qwen3.7-Plus

Qwen3.7-Plus上线千问云,多模态智能体能力再升级!
阿里云发布Qwen3.7-Plus,多模态智能体能力升级
千问3.7系列最新多模态大模型Qwen3.7-Plus正式发布并上架千问云和阿里云百炼,开发者可API调用。其文本和视觉能力大幅提升,在Vision Arena榜单跻身全球前五、中国第一。该模型实现多模态混合智能体新突破,将“看、想、写、做、验”整合进智能体工作流。在桌面端应用复刻和英语词汇学习APP开发测试中表现出色。其编程、Agent、推理等能力显著提升,视觉能力系统性增强,工具使用能力拓展。目前已上线,支持双模态输入,兼容OpenAI标准协议。

[腾讯云开发者] Vibe Coding平台 云基础设施 Agent CloudBase

为Agent重新设计云:Vibe Coding平台背后的基础设施
腾讯云CloudBase推出Vibe Coding平台基础设施解决方案
文章围绕Vibe Coding平台展开,介绍其重塑软件生产方式,用户只需输入自然语言就能快速获得在线应用。该赛道从“玩具”走向“严肃生意”,多家公司发展迅猛。Vibe Coding平台面临工程难题,如Agent运行、应用可用性、多租户处理和成本控制等。腾讯云开发CloudBase推出面向该平台的基础设施方案,包括让Agent稳定运行、使应用可用、优化Agent效率、构建多租户模型等,还开源OpenVibeCoding降低接入门槛。此外,还介绍了采用CloudBase的吐司APP和GenieAI两款产品。最后指出需为Agent重新设计云,CloudBase的方案可提供参考。

[硅星人Pro] AI硬件 Turnkey方案 供应链整合 渠道分发

京东的AI硬件野心:模型、供应链和渠道一起打包
京东推出JoyInside助力厂商做AI硬件
AI消费电子品类爆发,今年618京东展示一批AI硬件。京东推出JoyInside,类似AI时代的Turnkey方案,将大模型等能力封装成标准化组件,降低AI硬件创新门槛,帮助厂商快速将传统产品转化为AI产品。此外,京东还举办创新大赛,助力创客团队。京东的特殊性在于它站在AI底座、供应链和渠道的交汇处,想做三层Turnkey,即模型能力打包、供应链整合和渠道分发,让更多厂商能做AI硬件。

[火山引擎] AI视频创作 Vibe Creating 提示词技巧

Vibe Creating:让创作回归「表达」本身
火山引擎提出AI视频创作新范式Vibe Creating
文章介绍AI视频创作新范式Vibe Creating,旨在让创作者回归表达本位。Seedance 2.0让AI视频生成能力跃迁,模型更像创作伙伴。Vibe Creating范式下,创作者用画面感语言描述场景,模型自行诠释;不过度控制参数,信任模型自由发挥。高质量提示词应含视觉锚点、行为状态、局部调性和视频主题四层信息。它适用于氛围、情绪等表达场景,如文学作品可视化、影视探索预演、品牌视觉广告等。对于有明确工业化交付标准的场景,精细控制更可靠。文章还提供《Vibe Creating实践手册》和Prompt Skill。

[阿里云开发者] 大模型 多模态模型 视觉语言能力 智能体

Qwen3.7-Plus:想得深,看得懂,做得到
阿里云发布多模态模型Qwen3.7 - Plus,能力强且应用广
阿里云发布多模态模型Qwen3.7-Plus,在Qwen3.7基础上升级视觉 - 语言能力。其作为多模态交互混合智能体,能融合GUI与CLI交互,处理多领域任务,跨框架部署表现稳定。在全球权威视觉模型榜单中,阿里凭此跻身全球前五、中国第一。纯文本能力接近Max级别,编码、通用、推理等能力表现出色。多模态能力系统性增强,在多模态推理、视觉Agent & Coding等方面有显著提升,还增强了视频和驾驶场景理解。通过多个案例展示其能力,如构建Hybrid - Agent系统完成APP和桌面应用开发、作为视觉Agent解决视觉任务、实现视觉编程、构建浏览器智能助手、进行真实世界推理等。

[十字路口Crossing] AI 通才 AI安全 AI就业 人际技能

Anthropic 联创:文科生也能进 AI 的核心房间
Anthropic联创Daniela谈AI发展、安全及对工作影响
本文是对Anthropic联合创始人Daniela Amodei的访谈。她分享了从文科背景进入AI领域的经历,认为通才能力很重要。创立Anthropic是为实现对AI构建的愿景,注册为公益公司。公司重视AI安全,因安全评估推迟Mythos模型发布。她认为AI当下多是互补而非替代工作,不同地区对AI采用和态度有差异,全球南方更乐观。还提到AI可能导致“认知外包”,而人际技能会更被看重。最后回答学生关于AI泡沫、监管、隐私等问题,给出对下一代建设者的建议。

[微软亚洲研究院] 大模型 长期记忆评测 RHELM基准

开源上新 | 大模型是否还在"金鱼记忆"?全新基准 RHELM 测出“真实长期记忆”天花板
微软等团队提出全新基准RHELM评测大模型长期记忆能力
微软亚洲研究院等团队提出全新基准RHELM,用于评测大模型“真实、异质、动态长期记忆能力”,论文与数据已开源。现有“记忆评测”基准有语义不连贯、信息源单一、评测题目“老实”等缺陷。RHELM围绕用户画像、LOOP模块、异质外部源构建,包含多用户、多轮对话、外部材料及高难度问答题。其LOOP模块模拟用户生活,数据具偶然性与长尾性。RHELM将“记忆”考核拆为7类问题,有27项挑战性特征。研究团队用其评测三类主流长文本与记忆方案,结果显示大模型整体分数低,跨源混合题型是重灾区,幻觉与误导型题目暴露短板,强推理模型有优势。研究指出检索召回有天花板,模型在跨源信息聚合和真实情境推理方面表现差。RHELM虽有局限,但为行业研究提供启示。

[腾讯研究院] 大模型 AI组织变革 超级个体 超级团队

超级个体时代|腾讯研究院3万字报告
腾讯研究院发布报告探讨AI时代超级个体与团队组织变革
腾讯研究院AI原生小组发布《AI原生工作报告》,探讨AI时代组织变革。报告指出AI变革核心驱动力是自下而上涌现,超级个体借助AI实现工作重做,具有AI First、能力跃迁等特征。不同角色觉醒路径不同,开发者从写代码到指挥代码,非工程师跨界觉醒,创始人转化为Builder。AI重排能力序列,放大个体差距。超级个体因需承担风险、稳定注意力等聚合为超级团队,协作从按岗位切割变为按优势放大,有自下而上自发涌现等四条路径。超级团队有节点辐射型、网络协作型、AI中枢型三种形态,可并存、过渡。其运作机制包括多种决策模式、AI协调演进、技术地基、激励机制及与大组织的三种关系模式。管理者应提供合适环境,关注人才密度、AI杠杆和组织摩擦。

[大淘宝技术] 大模型 Agent记忆评测 基准数据集 评估框架 记忆系统

Agent-Memory 评测全景:基准、评估与记忆系统(理论篇)
淘天集团团队梳理Agent长期记忆能力评测全景
文章系统梳理了Agent长期记忆能力评测全景。首先指出大语言模型在多轮、跨会话交互中记忆能力不足,近年研究从基准数据集、评估框架、记忆方法与系统三条主线推进。基准方面,介绍MUSE、LOCOMO等数据集;评估上,分析MemoryAgentBench、LONGMEMEVAL及MemBench等框架;系统实现对比了THEANINE、RMM等方案。当前技术在检索准确性有进展,但跨会话推理等仍存瓶颈。未来评测需统一口径,综合考量检索正确性、使用有效性、时间维度及成本约束,以指导工程落地。

[阿里云开发者] Agent ANOLISA 安全防护 Token节省 工作区快照

Agent 越能干,你越不敢放手?ANOLISA给它穿上全套防护
阿里云ANOLISA v0.3版本上线多项功能保障Agent安全
文章介绍了ANOLISA v0.3版本的新功能,可解决用户对Agent的“放权焦虑”。它是新一代Agent操作系统,叠加在传统操作系统上。新功能亮点有三:一是AgentSecCore组件升级,从提示词到系统基线四层防护,全链路保障安全且本地完成,成本低、可见性强;二是实现Token节省可视化,实测近30个场景下Token消耗降低3% - 21%,优势场景超30%;三是工作区快照功能,关键操作前创建快照,结果不对可一键回滚,性能出色。此外,还给出使用教程和体验场景,包括节省Token、安全防护、操作回滚,并提供交流群及使用链接。

[阿里云云原生] 大模型 Cloud Agents AI Agent

Qoder 推出国内首个 Cloud Agents,Agent 上线时间从 1 个月到1天
Qoder 推出国内首个 Cloud Agents,缩短 Agent 上线时间
多数企业想用 Agent 却难全栈自研,搭建和维护技术体系耗时久。Qoder 推出国内首个 Cloud Agents,将能力与运行时托管,让企业无需重复造轮子。它是全托管 AI Agent 运行平台,由经 500 万用户验证的 Agent 引擎驱动,支持自由切换模型和接入工具生态。各 Agent 独立运行,平台自动扩缩容,企业可跳过基础设施直接业务创新。其典型场景包括定时任务和配备数字同事,目前移动端、CLI、Web 端均支持,且已开放,可前往官网体验。

[十字路口Crossing] 电商 数字人 AI直播 电商直播升级

京东618: 数字人又进化了吗?
京东618升级数字人平台JoyStreamer,提升电商直播能力
6月1日,京东举办全数字人AI购物直播晚会“京东618赛博联欢会”,多代经典IP齐聚,吸引超490万人次观看,带动品牌销售同比增长300%,背后由京东数字人平台JoyStreamer提供技术支持。过去两年,数字人从“坐着念稿”跨越到走秀级表现力。今年618,JoyStreamer围绕电商直播核心转化链路系统性升级,成为AI直播团队。播前做诊断、自动生成脚本和数字分身;播中编排上统一调度多元素,场控能主动经营直播间;播后自动生成报表并提供策略建议。京东数字人服务商家规模突破8万家,带货成交额超2.4亿元,正从“降本工具”进化为电商“经营基础设施”。

[Kimi智能助手] 大模型 本地Agent Kimi Work

Kimi Work (Beta 版) 邀你体验:你的工作,分我一半
Kimi 推出 Work Beta 版邀知识工作者体验
文章邀请体验 Kimi Work Beta 版,它是面向知识工作者的通用型本地 Agent,随 Kimi 最新测试版 Mac 和 Windows 客户端推出。其内核为 Kimi Code,继承在线版专业 Skills 和数据库,内置 Kimi WebBridge 方案,支持 Agent 集群。Kimi Work 实现从 Coding Agent 到 Working Agent 的转变,将 Agent 能力迁移到桌面交互,主要由 AI 自主生成代码开发。它能服务知识工作者,在金融、科研、办公场景发挥作用。目前 Kimi Work 正快速迭代,邀请用户参与测试,并提供下载链接。

[搜狐技术产品] 大模型 AI Agent 模型训练

一篇文章讲清楚 AI Agent 的核心概念:从 Model、Tool、Skill 到 Harness工程
Hugging Face团队发布AI Agent术语表梳理核心概念
Hugging Face团队发布AI Agent术语表,梳理核心概念。AI Agent是以大模型为核心、能调用工具完成任务的系统,与普通聊天模型不同。Model是Agent核心但非全部,Scaffolding和Harness分别管‘怎么想’和‘怎么跑’。Context Engineering管理输入,Policy定义行为。Tool、Skill、Sub - agent分别对应动作、方法和分工。训练阶段涉及Environment、Rollout、Reward和Trainer等概念,分清这些可避免对Agent相关内容的理解混乱。

[定焦One] AI Skill商店 流量入口 商业化

腾讯、阿里、字节,混战Skill商店
腾讯、阿里、字节等大厂混战AI Skill商店
Skill作为AI领域热门概念,是给AI Agent的“操作手册”。随着其数量增加,分发平台出现,今年3月腾讯、阿里、字节率先上线Skill商店,此后更多玩家入场。三类入局者各怀心思:互联网大厂用其引流在生态赚钱;大模型公司靠它留住用户,赚模型调用钱;内容平台把Skill当新内容品类,赚流量和广告钱。但当前Skill商店面临诸多问题,如难以定价、成本不透明、有安全风险、缺乏标准化协议等,离成为下一个App Store还有距离。

[腾讯研究院] 大模型 token范式 连续空间 AGI

Token必须死?
何恺明等团队论文及巨头行动引发对大模型token范式的思考
文章探讨大语言模型能否走向AGI,指出token范式有结构性天花板。2026年5月,MIT何恺明团队和字节跳动Seed实验室论文显示,语言生成可在连续空间完成。何恺明团队的ELF和字节的Cola DLM表明连续空间更优。科技巨头也有行动,Google构建统一连续坐标系,OpenAI整合多模态能力,字节有数据和研究优势,Anthropic侧重文本推理。若token范式衰退,视频tokenizer公司、多模态相关产品及按token收费模式将受影响。但连续空间模型也未脱离人类语言压缩数据,新训练信号或来自主动探索,如RSI。

[海外独角兽] AI云计算 底层infra Serverless GPU Sandbox

Modal 的 Infra 复利,从 GPU Cloud 到 Agent Sandbox
Modal构建AI runtime,Sandbox业务成增长新动力
文章介绍了AI云计算公司Modal,其2021年成立于纽约,用Rust构建AI runtime,让开发者用Python调用云端GPU。近期Sandbox业务增长快,成第二增长曲线。公司完成3.55亿美元Series C,投后估值46.5亿美元。核心壁垒是自建底层infra产生的复利,产品包括Serverless GPU compute和Agent runtime/Sandbox。Serverless适合推理场景,可将GPU抽象成计算单元;Sandbox能满足Agent工作环境需求,有生态、合规、扩展性和性价比优势。在市场竞争中,它在GPU-as-a-Service和Sandbox-as-a-Service领域有对手,采用gVisor隔离路线较均衡。其商业模式是转售GPU和按秒计费Sandbox,采用PLG策略。团队由竞赛编程背景人才组成,融资进展顺利,有望成为AI agent执行层关键基础设施。

[阿里云云原生] 智能体框架 AgentScope Java 2.0 企业级开发 分布式部署

AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope发布Java 2.0版本,打造企业级智能体底座
AgentScope是开源智能体应用开发框架,其Java 2.0版本正式发布,是迈向JVM生态与企业级生产场景的重要一步。该版本面向企业级需求系统性升级,聚焦稳定运行、安全控制等。它将分布式部署做成一等公民,实现会话与沙箱管理、多租户隔离和统一文件系统层。引入Harness抽象保障长期稳定运行,Workspace解耦执行环境与Agent逻辑,Context升级上下文管理机制。还开放模型接入并增强容错能力,重构消息模块、引入事件系统,引入权限系统和middleware机制,为企业级智能体应用提供坚实底座。

[滴滴技术] 大模型 客服质检 多语种多业务线 LLM应用

滴滴国际化客服质检智能化之路:多语种多业务线 LLM 质检系统设计与实践
滴滴国际化构建多语种多业务线 LLM 质检系统并分享实践
滴滴国际化事业群客户体验部门构建多语种多业务线智能客服质检系统。该系统有意图、评估、VOC 三条并行管线,将质检从第三方黑盒方案升级为自研 AI 架构。意图管线经架构重构与标签定义优化,准确率从不足四成提至 86%;评估管线平均准确率超 90%;VOC 管线将人工汇总时间从数小时缩至数分钟。文章还分享了系统设计思路、工程判断及对 LLM 企业落地的认知,未来计划扩展业务线和语种,探索管线数据联动。

[数字生命卡兹克] 大模型 AI开发 递归自我改进 Claude

Anthropic万字长文:当AI开始构建自己,人类该何去何从?
Anthropic发布长文探讨AI自我构建及人类应对策略
Anthropic发布万字长文《When AI builds itself》探讨AI自我构建。AI开发正从人类主导转向AI参与,未来或实现递归自我改进,虽未必然但速度可能超预期。文中展示AI加速开发的证据,包括外部基准测试和内部数据,如Claude编写大量代码、提升工作效率、代码质量接近人类、在实验执行和自主研究方面表现出色。未来人类在AI开发中角色将收窄,可能聚焦研究品味和判断力。还设想三种未来情景:趋势停滞但能力扩散、AI实验室持续增效、AI具备递归自我改进能力。最后提出应建立可信减速或暂停体系,组织多方对话探讨相关问题。

[京东技术] 大模型 长视频生成 JoyAI - Echo框架

进入全球第一梯队!京东开源JoyAI-Echo框架 长视频生成“所想即所得”时代到来
京东开源JoyAI - Echo框架突破长视频生成难题
6月3日京东推出JoyAI - Echo长音视频生成框架,解决行业长视频生成难题,实现‘对话式编辑’。此前长视频生成存在角色易崩、声音乱变、速度慢等问题。该框架有四项创新:跨模态音视频记忆库保角色一致性;记忆驱动后训练使速度提7.5倍;Director Agent实现对话式创作;轻量化实时超分保障高清输出。经测试,各项指标领先,能应用于多行业。其代码与权重已开源。

[腾讯研究院] 大模型 AI 腾讯 Agent技术 Co - Design

万字实录现场直出:汤道生、姚顺雨对谈腾讯 AI 下半场
汤道生、姚顺雨对谈腾讯AI下半场并发布相关成果
在2026腾讯云AI产业应用大会上,汤道生和姚顺雨对谈腾讯AI下半场布局。姚顺雨认为AI下半场要构建基于AGI的组织,做好基础、产品和前沿探索。模型与产品的Co - Design,要做好预训练和后训练,注重实用性,利用产品数据体系化优势。混元3重建了基础架构,优化了数据和评估。Agent技术方面,Coding Agent是重点,要注重体系全面化、利用线上回流和发挥想象力。针对Token效率问题,要提升性能和优化成本。腾讯在AI长跑中有丰富场景积累,此次大会发布效率智能体工具集,启动“腾讯AI共创营(二期)”,还将介绍20多个新产品、新能力。

[人人都是产品经理] 大模型 AI应用 幻觉风险 社会责任 AI治理

豆包不用负责
豆包3亿月活用户面临幻觉风险,责任界定待明确
本文围绕豆包这一国民级AI应用展开,通过李先生退票维权等案例,揭示其用户面临的幻觉风险与免责困境。在医疗领域,患者对豆包诊断的过度依赖引发医患冲突;餐厅预约场景中,豆包也出现信息不实问题。豆包凭借流量迁移、产品讨好设计等获3亿月活,但拟人化设计易致信任错位。目前法律未明确AI“幻觉”定性,用户损失难追责。随着AI发展,需建立适应的制度、规则等。还应考虑AI产品“适当性管理”、“幻觉致损”责任界定及全社会AI素养建设。

[WeaveFox和他的朋友们] Vibe Coding OPC创业 AI工具 WeaveFox平台

胡彦斌都在 “手搓 APP”,普通人零基础 Vibe Coding 时代真的来了
胡彦斌用Vibe Coding做出APP,WeaveFox助力创意落地
歌手胡彦斌耗时45天,用Vibe Coding氛围编程,不靠外包和专业编程,做出粉丝社区APP「彦火」,跑通OPC单人创业范本。OPC指一人加AI工具成创业主体,是2026年AI时代主流创业形态。Vibe Coding让用户用自然语言提需求生成应用,但普通人对接AI写代码有困难。WeaveFox创意AI网页应用平台零门槛,能把文字创意变网页应用,适配OPC创业需求,适用于创业者、产品经理等多类人群。