阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选技术周刊技术周刊SignalSignal个人博客个人博客
登录注册
第 273 期

Signal #13:AI Coding 的下一站,是失败与反馈

2026.05.25

技术周刊

第 273 期
2026.05.25
Signal #13:AI Coding 的下一站,是失败与反馈
第 272 期
2026.05.18
Signal #12:Coding Agent 正在拥有自己的运行时
第 271 期
2026.05.11
Signal #11:Agent 的中间过程,正在被产品化
第 270 期
2026.05.04
本周 Signal:Coding Agent 正在从工具入口,走向工程基础设施
第 269 期
2026.04.27
本周 Signal:模型更新仍然重要,但不再是唯一主角
第 268 期
2026.04.20
本周 Signal:多 Agent 并行,开始从实验玩法变成产品默认交互
第 267 期
2026.04.13
本周 Signal:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
第 266 期
2026.04.06
本周 Signal:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
第 265 期
2026.03.30
本周Signal:执行开始接管软件,界面退居为观测层
第 264 期
2026.03.23
本周 Signal:复杂度开始从“人”迁移到“系统”
第 263 期
2026.03.16
本周 Signal:软件工程岗位开始 AI-native 化
第 262 期
2026.03.09
本周 Signal:AI 工具正在获得长期记忆
第 261 期
2026.03.02
本周Signal & 我们可能一直误解了AI对软件研发的影响
第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 272Signal #12:Coding Agent 正在拥有自己的运行时

Signal #13:AI Coding 的下一站,是失败与反馈

过去讨论 AI Coding,很多注意力还放在“AI 能不能写出第一版代码”。

但本周 GitHub 和 Cursor 的几个更新放在一起看,一个更具体的方向开始出现:Agent 正在进入代码生成之后的返工环节。

GitHub Copilot cloud agent 已经可以在 GitHub Actions 失败后,一键介入,分析失败原因、推送修复,并在完成后提醒开发者 Review;它也开始支持批量处理 Copilot code review 里的多个反馈意见。

这意味着,Agent 不再只是在需求开始时生成代码,也开始进入测试失败、Lint 不过、Review 修改、PR 调整这些更碎片、更高频的研发环节。

另一个变化是任务入口也在前移。GitHub Copilot Chat 开始支持用自然语言搜索和分析 Issue;Cursor 也接入 Jira,用户可以直接把 work item 分配给 Cursor,或者在评论里 @Cursor 启动 cloud agent。

这些动作背后的共同变化是:AI Coding 正在从“生成第一版代码”,走向“处理失败与反馈”。

在真实研发里,代码写出来只是开始。大量时间其实消耗在后续的验证、修复、评审、调整和再次提交中。

未来 AI Coding 的价值,不只在于一次性生成多少代码,而在于它能不能接住研发流程里的反馈,并持续把任务推进到可合并、可验证、可交付的状态。

国内技术

AI 技术与算法实践

[梯度不陡] AI研发自动化 Skill Agent行为测试

别让 Skill 变成新的文档债:从经验沉淀到行为回归
文章强调构建测试体系避免Skill成文档债
文章围绕Skill在Agent执行链路中的应用展开,指出其虽能沉淀经验供Agent消费,但易成文档债。Skill正成Agent经验资产,可接入团队项目经验。然而,写得完整不代表能稳定影响Agent行为,存在信号稀释、边界不清等问题。测试Skill需评估Agent行为,为此应构建Skill Regression Suite,按类型拆分测试集,关注执行轨迹。随着Skill增多,需R&D Harness系统管理,确保经验可评估、回归和演化,避免成新文档债。

[AndroidPub] Agent开发 架构范式 选型思路

Agent 开发的五种架构范式及选型思路
文章解析Agent开发五大架构范式及企业级框架并给出选型思路
文章聚焦Agent开发的架构范式与选型。先指出Agent开发关键在于架构选择。接着解析五大架构范式:图状态机适合稳定业务,流程可控但设计成本高;角色驱动分工明确,易流于形式;事件驱动适合复杂异步系统,调试难;SDK封装上手快,适合单体应用;低代码平台门槛低,适合业务试验。还介绍两大企业级框架,微软的重企业衔接,Google的更灵活。最后给出选型五步法,包括技术栈、场景、云平台、模型偏好匹配及成本分析,建议先选适合业务阶段的架构。

[腾讯云开发者] 大模型 Skill训练 自进化框架

让Skill自己训练自己:8阶段Loop、3层评测、5维AND门控,从此实现自进化
作者构建Skill - Evolver实现Skill自进化与优化
文章介绍了Skill-Evolver,一个能让Skill自训练、自迭代的框架。作者起初发现Skill使用中存在稳定性、边界和规则冲突等问题,在参考Karpathy、Udit Goenka、Anthropic及斯坦福Meta - Harness等成果后,将其思想融合,构建了Skill - Evolver。该框架设计包含8阶段Loop、三层评测、5维AND门控和Trace诊断等核心机制。经19轮自进化测试,它能有效修复问题、优化代码,如增加测试用例、提高通过率、拆分主文件等。在真实业务中,也能提升客服问答skill的召回率并降低处理压力。不过,它也存在LLM评测噪声、GT质量影响及成本高等问题,但体现了人和AI互补协作的价值。

[网易智企-CodeWave] 软件开发 AI Coding CodeWave SDD AI软件工厂

1个产品+1个开发+1个测试,就能扛起一整个项目?
广东抱谷科技借CodeWave SDD构建AI软件工厂实现变革
2026年,AI对软件开发全流程产生冲击,但也带来管理难题。广东抱谷科技作为企业数智化转型综合服务商,对AI Coding演进有清晰认知,认为其经历代码补全、氛围编程、规约编程三阶段。该公司先在运营管理平台项目用各类AI工具实践,虽提效但工具管理成瓶颈。后在审计系统项目引入CodeWave SDD,效率质变,人力成本节省90%,人天工作提效10倍。CodeWave SDD有NASL、SDD、可视化开发平台三位一体能力架构。抱谷科技基于此构建AI软件工厂,制定四项原则保障落地质量,划分五个标准化阶段。实践使团队结构精简、流程管控升级、安全治理加强,实现人机协同落地。此外,还介绍了CodeWave SDD试用申请、网易智企AI Coding实战六城巡演及网易创新企业大会报名信息。

[阿里云云原生] 网关安全 指令式配置 声明式配置 WASM插件

从一个隐藏 18 年的 Nginx 漏洞,看网关安全架构的演进
从Nginx漏洞看网关安全架构从指令到代码的演进
文章围绕Nginx隐藏18年的堆溢出漏洞CVE-2026-42945展开。先介绍漏洞原理,是两阶段执行时状态不一致导致,且因触发条件苛刻、溢出无声等原因长期未被发现。指出Nginx指令式配置有状态传播不可预测问题。接着对比Envoy声明式配置,虽消除状态泄漏攻击面但灵活性不足。又介绍Higress WASM插件,用代码替代指令,无两阶段状态不一致问题,运行在沙箱中,逻辑显式。最后提出网关安全架构有三个层次,不同架构漏洞影响范围不同,并指出用代码和沙箱是网关安全演进方向,还提及Higress社区有可替换Nginx配置的插件。

[百度地图] 卫星导航 北斗高精定位 PPP - RTK 智能终端定位

【AI地图 Tech说】第十一期:北斗高精定位底座技术——星地协同的厘米级广域服务突破
北斗星地一体化实现广域厘米级定位及终端应用突破
文章聚焦北斗高精定位底座技术,解读两大关键方向。PPP - RTK融合RTK与PPP优势,实现广域厘米级定位,国内企业构建自主服务体系并规模化落地。其核心技术包括高精度服务产品处理、星地融合增强服务、星地一体化可信定位、星地协同轻量化组网定位。智能终端方面,虽有性能差和环境恶劣问题,但通过相位定位技术在数据质量、偏差校正等环节突破,实现分米/厘米级定位,还有自适应定位、高精度测速、模糊度快速固定等技术。北斗在多维度突破,未来将向全球无缝覆盖等方向演进。

[梯度不陡] AI Coding ProgramBench RepoZero 任务表示 验证闭环

AI 到底能不能从零写软件?ProgramBench 和 RepoZero 给出了两种答案
ProgramBench和RepoZero探讨AI从零写软件的不同答案
文章围绕AI能否从零写软件,介绍了ProgramBench和RepoZero两篇论文。ProgramBench让AI根据程序和文档从零重建软件,结果悲观,表明当前Agent在系统级重建上能力不足。RepoZero则让AI在API边界内复刻仓库行为,虽通过率有限但更可推进。二者并非互相反驳,而是测不同层次问题。AI Coding瓶颈正从代码生成转向任务表示、验证等方面,这两篇论文启发我们思考如何将研发任务拆分成适合Agent工作的形态,RepoZero预示着AI Coding进入新阶段,更注重系统能力。

[腾讯云开发者] 大模型 AI工程化 Prompt Engineering Context Engineering Harness Engineering

从Prompt、Context到Harness,工程的三次进化与终局之战
文章解析AI工程Prompt、Context、Harness三次进化逻辑
文章围绕AI工程的三次进化展开。Prompt Engineering解决与AI沟通问题,通过精心设计输入激发模型能力,但随模型智能化提升,其边际效益降低。Context Engineering解决模型上下文信息问题,如利用RAG按需取知识、上下文压缩对抗遗忘、遵循单一事实来源原则。但两者仍有局限,引出Harness Engineering,它为大模型设计约束机制,OpenAI百万行代码实验和Anthropic的F - Harness验证其价值。三者是嵌套关系,共同服务于让大语言模型转化为可靠生产力的目标。文章还指出工程师职责转变及成为Harness Engineering时代工程师的实践路线。

[AI大模型应用实践] AI Coding 企业软件 上下文工程 人机协作

当 AI Coding 进入复杂企业系统,为什么提效远没有宣传里那么美好 ?
文章剖析AI Coding在复杂企业系统提效不如宣传的原因
文章指出,以Claude Code、Codex为代表的自主编码智能体虽在开发者生态中发展迅速,但宣传中夸大其能力,给开发者和管理层带来负面影响。在复杂企业软件场景中,AI Coding提效远不如宣传美好。一是不同软件场景差异大,企业软件系统复杂,管理层和工程团队认知易错位;二是企业AI Coding需做上下文工程,该“前提税”常被企业忽略;三是即便有上下文,模型也会犯错,企业要验证代码是否满足业务需求;四是代码能跑不代表可上线,要关注生产级要求;五是AI让写代码变快,却使审代码变重,需自动化机制辅助;六是生成快不代表成本低,要考虑Token、返工和长期维护成本;最后建议企业分级应用AI,采用约束下的人机协作流程。

[得物技术] 数仓开发 AI Coding Harness工程

Claude Code Harness 工程:数仓侧落地方案|得物技术
得物推出Claude Code Harness工程数仓侧落地方案
文章介绍了得物Claude Code Harness工程的数仓侧落地方案。当前AI Coding虽提升效率,但存在AI失忆、规范执行不稳定、context易撑满等痛点。Harness是Claude Code的宿主运行框架,compact会丢失关键信息。文章提出五层防御体系,包括将关键信息写进CLAUDE.md、Auto Memory自动积累、hooks自动验证、subagents做上下文隔离、SKILL文件改造。还给出数仓Harness架构,按职责分层,不同工作交给合适机制。基于SKILL规范设计数仓工作流,改变SKILL调用方式减少context消耗。落地分三步:上下文持久化、配置hooks、创建subagents。该工程可解决字段口径遗忘、需求理解偏差、SQL规范执行不一致、context耗尽等问题,让数仓AI开发从对话驱动升级为规则嵌入的流水线自动化。

[阿里云云原生] AI Agent Infra 智能体工程化

阿里云的 Agent Infra 长什么样
阿里云在峰会分享Agent Infra架构及产品矩阵
在2026阿里云云峰会,阿里云智能首席技术官分享了阿里云Agent Infra的六大基础设施能力,以应对六大挑战。企业构建Agent有五大痛点,阿里云给出Agent Infra产品矩阵。该矩阵含五大平台:AgentRun是一站式开发构建平台;AgentTeams解决多智能体协作问题,处于邀测;AgentLoop覆盖可观测与评估优化,评估与优化预计6月公测;STAROps是全域智能运维平台,还开源UModel与RCA评测基准集;最后强调AI时代效果为王,Agent Infra助力企业聚焦效果。

[搜狐技术产品] AI代码工具 AST LSP 代码语义分析

一文吃透AST与LSP:为什么AI代码工具都离不开它?
文章详解AST与LSP,揭示AI代码工具依赖的核心技术
文章围绕AST与LSP展开,介绍了它们是AI代码工具的核心技术。先解释AST是代码结构化数据,LSP是通信协议,前者是后者底层依赖。通过JS代码演示两者配合过程,对比grep,突出LSP精准快速优势。阐述LSP服务器长进程、增量更新等设计保证效率,说明其按语言独立、按需启动管理多语言项目。介绍LSP标准由微软主导、社区共建,语言服务器官方与社区双驱动。还给出Cursor等工具配置LSP步骤,推荐AST Explorer等实用工具。最后总结AST和LSP核心价值,强调两者结合让AI代码工具更智能。

[搜狐技术产品] AI编程 Superpowers插件 Claude Code 工程纪律

GitHub 195K Star,它凭什么被称为Claude Code生态"最具工程价值"的编程插件?
Jesse Vincent开发Superpowers插件为Claude Code加工程纪律
文章围绕Claude Code生态中Superpowers插件展开。它由Jesse Vincent开发,在GitHub获近20万Star。Claude Code编程在项目规模大时质量差,Superpowers强制加工程纪律,用Skills规范,分平台、框架、执行、输出四层。其有三个关键设计:先问再干澄清需求、测试先写、上下文隔离。工作流分七阶段,固定顺序。安装方式因平台而异,还给出核心技能速查和常见问题解决办法。它适合长期维护项目,让编程过程可追溯。

[阿里云开发者] AI Coding Java微服务 本地环境改造

都是 AI Coding,为什么 Java 体验差了一个量级?五条方法论帮你构建自己的 Harness 环境
作者分享Java微服务项目构建AI友好本地环境方法论
文章指出Java微服务项目中AI Coding体验差,根源在于微服务架构将运行依赖置于云端,使AI无法自主验证。作者提出三条改造原则:依赖倒置,接口先行;零侵入,Profile隔离;工具AI化,CLI优先。以Agent应用改造为例,实现从“推预发验证”到“本地闭环”,提升AI自主验证能力。配合CLAUDE.md和验证脚本,还给出Harness Engineering Checklist评估项目AI友好度。总结复用方法论,如找最小可运行子集、替代而非模拟等,后续可将JVM诊断能力工具化,让AI实现本地自主开发循环。

[腾讯云开发者] AI编程 工程化 Harness Engineering 上下文质量

QQ音乐Harness Engineering实践
QQ音乐实践Harness Engineering优化AI协作工程
文章围绕QQ音乐Harness Engineering实践展开。先指出AI辅助编程从代码补全到自主式Agent的演进中,vibe coding在生产级代码库存在信息损耗、知识孤岛、验证断档问题,引出Harness Engineering,其核心理念是让AI在正确轨道高效生成。核心公式表明提升上下文质量是工程化杠杆点。介绍Harness含义及四大标准组件,阐述QQ音乐在单仓多服务与多仓协同场景下的框架实现,包括业务场景分析、复杂度拆解、自研原因、技术路线、典型链路等。还提及该框架总览、五阶段+四门禁、三层知识体系+三仓联动、Skill Agent Command三件套、Self - Refinement等内容,强调工程化能让AI协作更稳。

[梯度不陡] AI Agent 聊天窗口 任务空间 产品形态

对话不是工作台:AI Agent 真正缺的不是聊天窗口
文章探讨AI Agent从聊天窗口转向任务空间的必要性
文章指出AI Agent从回答问题走向替人做事时,聊天窗口局限性凸显。当仅回答问题,Chat是合适入口;但处理真实任务,需任务空间。聊天窗口问题包括按时间排序难呈现任务全貌、易混淆上下文、难表达执行状态和承载风险动作。多开窗口不能根本解决,关键是任务对象化。面向任务的Agent工作台应包含任务目标、输入、执行、风险、验证和交付物等区域。在研发自动化场景,聊天窗口不足更早暴露。未来Chat仍为入口,但Agent产品需从消息流走向任务空间,让人掌握关键决策点。

[phodal] 人机协作 Design System Agent输出 Canvas Agentic UI

/canvas:不止是更漂亮的输出,而是下一代人机协作
Qoder团队推出Canvas助力下一代人机协作
文章介绍了Qoder团队的Canvas项目,它是面向Coding Agent的Design System。传统Agent输出多为文本,复杂时会成负担,后开始生成HTML,但较自由。而Canvas基于代码库等生成,可让Agent理解界面设计。其结构包含Atoms、Components、Templates和Recipes,最终生成协作界面。Canvas的结构化节点可成行动入口,与普通HTML不同,它能将结果、上下文和下一步行动整合。Canvas是Agentic UI早期形态,未来界面需适应Agent。

[Gartner公司] 网络安全 生成式AI 深度伪造 物理AI

Gartner:中国AI优先型网络安全前沿治理的四大预测
Gartner发布中国AI优先型网络安全治理四大预测
商业与技术洞察公司Gartner针对中国AI优先型网络安全治理提出四大预测。到2028年,中国网络安全项目80%的AI价值将来自任务自动化和能力扩张;超80%企业将经历员工对生成式AI的无监管使用,使AI特定数据泄露控制成CISO关注重点。到2029年,50%针对中国员工的社会工程攻击将由深度伪造驱动,传统意识培训失效;超30%部署物理AI的企业将经历重大安全事件。Gartner还为各预测给出了相应建议。分析师将在5月26 - 27日上海的Gartner2026大中华区高管交流大会详细解读。

[腾讯云开发者] Harness AI工程化 知识传递

Harness落地的五大问题及其解法
介绍Harness落地五大问题及对应解决方法
Harness时代程序员从事元工程,在工程运转环境上做加法。实践中AI翻车问题归为五类并对应改进动作:编码规范违反用Rule事前提醒、Script事后检测;操作流程遗漏封装成Skill;流程交互混乱改SubAgent定义文档;外部能力缺失接入MCP;系统性流程缺失加全新组件。循环越多系统越健壮,Harness是高度压缩的知识传递,AI能秒级‘吸收’经验。还给出相关文章链接并邀读者讨论。

[蚂蚁技术AntTech] AI Agent AKernel 数据中心 openYuanrong

从 Computer Use 到 Datacenter Use:如何让 AI Agent 像调用函数一样驱动数据中心?
蚂蚁集团发布AKernel,助力AI Agent驱动数据中心
蚂蚁集团谈鉴锋与周天昱在QCon大会分享AI基础设施。当前Agent时代有Multi - Agent和Datacenter Use两大趋势,但现有云原生基础设施存在时间成本高、架构复杂、人力成本高的问题。蚂蚁团队设计AKernel,采用Monorepo + AI辅助工程模式,与openYuanrong深度整合。其架构集成三层组件,请求经多环节流转,还解决了万级并发镜像拉取问题。AKernel有openYuanrong分布式调度与数据系统、AFaaS极致冷启动沙箱、Checkpoint / Restore全链路状态持久化三大技术支柱。它部署简单,开发者10分钟左右可完成,已在蚂蚁内部落地,未来将增加硬件支持和拓展沙箱类型。

[群核科技质量技术] 客服场景 AI客服工具 MCP工作流 降本提效

降本增效实战:基于MCP工作流的客服AI工具设计与落地
技术团队落地基于MCP工作流的客服AI工具降本提效
文章围绕基于MCP工作流的客服AI工具设计与落地展开。先指出客服场景存在一线客服权限受限、工单处理链路长等痛点,引入AI客服工具。接着阐述落地全流程:明确痛点与目标,放弃传统ERP选AI方案;采用MVP模式,先搭建最小可用工具再迭代优化;运维治理解决工具使用率低问题;数据复盘显示工具使单次处理时长降97%、减少约500+工单等。最后总结4个避坑要点,强调AI是降本提效核心工具,要找准痛点、选对方案、闭环迭代。

[阿里云开发者] AI 产研效能 组织变革 软件工程

代码一旦生产出来,首先是负债 —— 一个CIO 的AI效能实践复盘
阿里云CIO蒋林泉团队复盘AI时代产研组织效能提升实践
阿里云CIO蒋林泉团队复盘AI效能实践。2026财年与2025财年相比,阿里云CIO线产研效能跃升,前端人均有效代码量提至3倍、后端2倍,千行代码缺陷率前端降30%、后端降55%。团队指出两个流行误区,AI生码率指标无实质意义,Vibe Coding在企业存量系统难落地。AI破解了“人月神话”和“左移”难题,带来质量与测试、知识工程、跨职能界面、需求澄清等环节的改变。强调用“灵魂×骨架”定义问题,放弃全栈,重构“Half - Stack”岗位,形成产品价值牵引、工程效率、组织变革三位一体框架。最后探讨AI时代工具、组织与人的问题,指出个体与组织提效不同,人需具备语文和数学基础能力及驾驭Agent能力。

[MacTalk] AI开发 Codex 功能更新

Codex 又又又更新了,这次能拍图带上下文,/goal 也正式上线了
Codex更新大版本,上线应用快照、/goal及锁屏操作
2026年4月以来Codex更新频繁。此次大版本更新有三个功能。一是应用快照,截图含视觉和文本内容及上下文,做功能或修bug时能提升准确性与效率;二是/goal正式上线,适合管理长任务,能持续推进、查看状态等,Codex和Claude Code的Harness已支持;三是锁屏操作,开启后Mac锁屏时Codex能短暂接管屏幕继续执行任务,根据使用场景开关该功能更安全。

[梯度不陡] AI 岗位边界 专业能力 企业系统

AI 让所有人都能干一点别人的活,但这不代表专业消失了
文章讨论AI模糊岗位边界但专业未消失的现象
文章探讨AI对岗位边界的影响,指出AI使岗位边界模糊,让非专业人员也能产出局部成果,如产品用NoCode搭页面、设计沉淀规范等。但产物进入企业系统时,会遇到接入、消费、上下文和验证等断点。专业不会消失,而是从产物生产能力后退到系统理解、专业转换、验证闭环和结果责任等更深层面。普通人可借助AI更早进入专业场域,组织则需重建清晰的责任结构。

前端开发与工程化

[TRAE.ai] 游戏开发 Unity AI辅助开发 TRAE Editor for Unity

TRAE Editor for Unity:让 AI 融入 Unity 开发工作流
TRAE Editor for Unity插件让AI融入Unity开发工作流
TRAE Editor for Unity是内嵌于Unity编辑器的插件,打通了与TRAE IDE的协作链路。它无缝继承TRAE IDE核心能力,支持解析外部包,内置项目级规则。使用时,先在Unity项目安装插件,将TRAE CN设为外部脚本编辑器,在TRAE IDE安装C# Dev Kit和Unity扩展。编写脚本可用SOLO模式和SOLO Agent,编写完成后在Unity编辑器预览。若用Unity 6.0及以上版本,可安装Unity AI,完成Unity MCP Server配置,添加到TRAE IDE后,智能体执行任务时会自动调用其工具。

[Unity官方平台] 游戏开发 动漫卡通着色器 Unity

Unity 中国资源商店推荐系列 | RealToon专业动漫/卡通着色器
Unity中国推荐RealToon专业动漫/卡通着色器
文章介绍了RealToon专业动漫/卡通着色器,它是一套完整动漫视觉表达体系,能让开发者构建多类作品。该着色器在Unity国际资源商店获4.7星,有众多好评。其特点包括:对轮廓线精妙掌控,有多层级线条控制、动态线条优化和艺术化断线处理;采用色阶化光影,有可调节色阶层级、智能阴影分界等;高光系统具叙事能力,有风格化高光形状、情绪响应系统等。此外,它与Unity渲染管线深度融合,全管线、全路径兼容,率先支持硬件光线追踪,适配现代技术栈。

[iOS新知] iOS开发 SwiftUI 列表分页加载

SwiftUI List 分页加载的正确姿势!一个 loading row 搞定无限滚动
文章介绍 SwiftUI List 分页加载用 loading row 的实现方法
文章介绍 SwiftUI List 分页加载的正确方法。传统 UIKit 用 tableView(_:willDisplay:forRowAt:) 判断最后一行触发请求,SwiftUI 用 .onAppear 不够稳。更优做法是在列表末尾加专用 loading row,负责触发加载和展示状态。文章给出 ArticleListView 代码示例,介绍 ArticleListViewModel 管理分页状态,强调 isLoadingPage 防重入、hasMorePages 控制显示、PaginationState 与首屏加载状态分开。还提及 onAppear 触发时机、首屏数据不足及失败重试等问题的处理。

[W3C资讯] Web开发 AI 意图导向 Agentic Web

[视频] Web与AI:意图导向范式下的Web未来发展之路
W3C中国举办论坛探讨Web与AI发展新机遇
今年4月W3C中国在杭州举办“W3C开放日暨Web标准国际论坛”,主题为「Web与AI:意图导向的下一代Web」,汇聚各方人士探讨Agentic Web时代技术演进与标准化机遇。论坛围绕“前端开发的未来”与“Agentic Web”展开。W3C董事会成员胡春明教授致开幕词,指出AI重塑软件开发,开发范式转向“以意图为导向”,开发者角色转变,人类提供意图由AI生成应用,同时W3C关注用户代理演变,Web正迈向开放Agentic Web。

[Unity官方平台] 前端开发 Shader Graph 模板功能

团结引擎 Shader Graph Template |为 Shader 创作提供更高效的起点
团结引擎推出 Shader Graph Template 并预告 1.9.0 版本直播
文章介绍团结引擎 Shader Graph Template,其可让用户基于预定义模板创建 Shader Graph,提高创作效率、统一团队风格和复用知识。在 URP 与 HDRP 下新增多组模板,覆盖粒子、Decal、VFX 等场景。文中说明了使用流程,包括从模板创建 Shader Graph 的步骤及界面区域划分,还介绍创建自定义模板的操作和信息配置。详细展示多种模板,如 Particle Unlit、Partical Lit 等。此外,预告团结引擎 1.9.0 上线,本周五团结引擎核心研发团队将在直播解读版本更新,包括核心图形能力和新增动画示例,并解答技术问题。

[GSYTech] Flutter 移动开发 AI集成 多平台适配

Flutter 3.44 发布啦,超级大版本更新!!!
Flutter 3.44 发布,带来多方面重大更新
Flutter 3.44 正式发布,是超级大版本更新。此次更新核心包括 Android HC++ 功能落地、iOS/MacOS 默认用 Swift PM、多窗口功能落地等。工具上,Widget Previewer 优化,降低内存占用;macOS 命令行工具支持双架构。AI 方面,推出 Agentic Hot Reload 功能,支持多种 AI 技能和模型。Android 适配 Googlebook 和 Android 17,Hybrid Composition++ 落地,支持显示屏圆角等。iOS 以 Swift PM 为默认包管理器,新增 UIScene 适配和 predictive text 实验性支持。Web 有简单优化,Desktop 由 Canonical 维护,多窗口功能未合并到 stable。嵌入式介绍丰田车机和 LG WebOS SDK 案例。Impeller 有 Vulkan 优化,Framework 完成 Material 和 Cupertino 解耦,新增多种组件和功能,无障碍方面也有改进。

[GSYTech] Android 性能分析器 Perfetto 性能优化

Android 发布全新性能分析器,实用性和性能大升级
Android发布全新性能分析器APA,实用性和性能升级
Android发布全新性能分析器APA,由SARC和LunarG合作开发,依靠Perfetto进行系统跟踪。它有独立桌面App和Android Studio Panda 4 canary及更高版本两个渠道。独立App无需Android Studio项目和Gradle构建,支持多系统。APA可捕获跟踪数据,能分析系统运行情况、提供GPU性能计数器数据、跟踪电池功耗等。它采用项目模型,支持渲染通道Vulkan Debug Markers、利用AI构建SQL查询等。与旧工具相比,APA渲染跟踪速度更快、处理大型跟踪时更稳定,多个团队已用其优化性能。APA包装了Perfetto能力,覆盖GPU Inspector,将作为新版System Trace Viewer集成进Android Studio。

[大淘宝技术] 浏览器自动化 OpenCLI API解析

浏览器自动化:从GUI到OpenCLI
OpenCLI方案解决浏览器自动化效率与稳定性难题
文章围绕浏览器自动化展开,指出传统前端UI自动化操作不稳定,提出采用解析并复现底层API请求的OpenCLI方案。介绍了OpenCLI思路,包括抓包和复现API。阐述其使用方法,如快速上手命令、原理分析(AI Agent探索工作流、懒加载机制、五级认证策略、适配器、外部CLI集成、CLI执行流程)。还提及自动生成CLI的方式,如AI原生生成和Record操作录制,同时指出Record操作录制存在请求体缺失、生成能力受限问题。最后给出使用案例,如内部会画平台CLI化、BOSS招聘自动化,并探讨未来软件竞争维度从界面转向可调用性。

[Unity官方平台] 小游戏开发 Burst编译器 性能优化 包体裁剪

团结引擎小游戏平台 Burst 编译器支持 —— 提升小游戏运行性能与控制包体大小
团结引擎小游戏平台支持Burst编译器提升性能控包体
团结引擎小游戏平台支持Burst编译器,可提升小游戏运行性能、控制包体大小。Burst基于LLVM,能将C#高性能计算子集编译为优化机器码,绕过IL2CPP模拟,独立于Job/ECS。其1.8.21及以上版本支持基本编译优化,1.8.27及以上支持Managed回退分支裁剪功能。测试显示,在不同场景中开启Burst后帧率大幅提升,如Infinity粒子系统场景中提升超1400%。同时,引入裁剪功能后,wasm包体相比不裁剪可减少0.3% - 6.6%,帧率几乎不变。开发者可通过Job.Run或静态函数调用使用Burst,还介绍了最佳实践和注意事项。未来计划将HPC# + Burst实践转化为可复用开发Skill。

后端与云原生架构

[搜狐技术产品] 抽奖系统 分布式系统 Redis Lua脚本

高性能抽奖系统如何设计
作者分享体彩抽奖系统设计难点及解决方案
文章围绕高性能抽奖系统设计展开,先点明设计分布式抽奖系统是面试常见问题,接着指出抽奖系统的三个核心难点。一是均匀消耗,要保证运营周期内奖品均匀发放,满足不同流量下的发奖需求;二是防止超卖,避免同一奖品发给多个用户;三是避免少卖,防止奖品未全部送出。针对这些问题,提出解决方案:采用固定定速率发放算法或改进版按需配置,用Redis+Lua脚本避免超卖,引入Redis分布式锁防止用户重复中奖,利用定时任务回溯历史奖品避免少卖。通过这些方案可保障抽奖系统奖品安全、稳定、可控发放。

[阿里云云原生] 云计算 智能运维 大模型 Agentic Ops

阿里云 STAROps 全域智能运维平台发布!从“被动救火”到“主动自治”
阿里云发布STAROps全域智能运维平台推动落地
5月20日,阿里云发布AI原生全域智能运维平台STAROps。它以大模型与智能体技术为核心,融合跨域可观测数据与大语言模型推理能力。平台围绕四大能力维度设计,提供智能助手、长期任务机制、数字员工三大核心功能。技术架构在统一可观测数据、运维数字孪生、AI分析算子、持续进化飞轮四个维度有竞争力。STAROps将云计算编排原则延伸到运维领域,提供多种接入方案,内置人工审批机制。同时,阿里云开源UModel与评测基准集,发起行业倡议,该平台已在官网上线,推动Agentic Ops落地。

[阿里云云原生] 云原生 API网关 Gateway API Ingress

告别 Ingress Nginx:云原生 API 网关 Gateway API 使用指引
云原生API网关提供Gateway API使用指引,替代Ingress Nginx
2026年3月Ingress Nginx将停止维护,Kubernetes官方建议用户拥抱Gateway API或选择其他Ingress控制器。云原生API网关覆盖两条路径,本文介绍Gateway API。Ingress概念简单、生态成熟,但随着企业容器化加深,其表达能力不足、缺乏角色分层、扩展性差。Gateway API由Kubernetes SIG - Network主导设计,有清晰资源模型、丰富流量管理能力和面向未来的可扩展性。云原生API网关支持Gateway API,具备双模并行、迁移工具完善等优势。文章还给出在云原生API网关上使用Gateway API暴露服务的实战示例。

大模型 & AIGC 前沿

[腾讯技术工程] 大模型 Agent架构 控制流设计

从0开发大模型的17种Agent架构演进详细拆解
作者拆解17种Agent架构演进并强调控制流设计
作者拆解了17种Agent架构演进。先介绍从github项目获得灵感,用agno框架重写17种控制流,强调Agent架构本质是控制流设计。接着阐述统一分析框架,用六个固定问题拆解每种架构。随后依次介绍各架构:Reflection实现最小质量闭环;Tool Use突破知识边界;ReAct形成观察 - 行动闭环;Planning显式控制流;PEV将验证纳入主回路;Multi - Agent实现认知分工;Blackboard基于共享状态动态调度;Meta - Controller进行入口分诊;Ensemble用冗余增强可靠性;Episodic + Semantic Memory扩展记忆;Graph Memory实现关系推理;ToT将推理转为搜索;Mental Loop模拟试错;Dry - Run控制副作用;Metacognitive感知自身边界;Self - Improvement形成进化回路;Cellular Automata实现分布式涌现。最后指出架构选择应根据所需控制能力,Agent架构演化本质是设计更好的控制流。

[大淘宝技术] 大模型 RAG AI工程化

RAG 全链路技术详解
淘天集团团队发布RAG全链路技术实战指南
本文是RAG技术实战指南,旨在解决Agent开发中知识库构建、检索召回和量化评测的问题。先介绍RAG可减少大模型“幻觉”,其工作原理是检索信息辅助大模型生成答案。接着阐述核心技术,包括文档加载、切分、索引构建、检索、生成答案等环节,还介绍了Graph RAG解决复杂问题的优势和工作原理。最后介绍Ragas评估框架,包含检索和生成的评估指标及测试集生成方法。

[谷歌开发者] 大模型 Gemma 4 MTP草稿模型 推理加速 推测性解码

Gemma 4 性能跃迁: 借助 MTP 草稿模型实现高达 3 倍的推理加速
谷歌为Gemma 4发布MTP草稿模型实现推理加速
谷歌推出Gemma 4,发布多Token预测(MTP)草稿模型,借助推测性解码架构实现高达3倍推理加速。标准大语言模型推理受内存带宽限制,存在延迟瓶颈。推测性解码将Token生成与验证解耦,草稿模型提前预测多个Token,目标模型并行验证。开发者将Gemma 4与草稿模型配对,可实现更快响应、提升本地开发效能、增强设备端性能且无损质量。谷歌还在底层架构做改进,发布深度技术解析。MTP草稿模型已发布,采用开源协议,可在多平台下载使用。

[百度地图] 智能体 记忆能力 大语言模型 数据安全

【AI地图 Tech说】第九期:让智能体拥有记忆——打造千人千面的小度想想
百度小度想想2.0构建跨端记忆体提升智能服务
文章围绕智能体记忆能力建设展开。传统智能体缺乏记忆,难以提供个性化服务。智能体架构以LLM为核心,还需搭配感知、决策、记忆等能力。记忆分短期和长期,长期记忆包含原始对话、用户行为等多种类型。记忆存储架构分API、操作、基础设施三层,各有功能。记忆写入要提取有价值内容,同时需应对信息过载进行遗忘。检索用向量数据库。数据安全方面,百度采取加密、访问控制等措施。小度想想2.0构建跨端记忆体,让百度地图智能体实现从工具到伙伴的跨越,未来智能体记忆能力将有更大价值。

[腾讯云开发者] 大模型 AI Agent 分层记忆引擎 TencentDB Agent Memory

TencentDB Agent Memory 全球正式开源:让 Agent 沉淀经验,让人专注创造
腾讯云数据库团队全球正式开源 TencentDB Agent Memory
今天腾讯云数据库团队全球正式开源 TencentDB Agent Memory,它是面向 AI Agent 的分层记忆引擎,采用 MIT 协议,开箱即用。当前主流 Agent 架构中 Memory 成标配,该项目旨在让 Agent 学会工作流程、保留任务上下文等。在超长 session 评测中,它作为 OpenClaw 插件接入后,有显著效果,如节省 Token、提升通过率等。它解决了主流 AI Agent 记忆方案在长周期任务中的问题,具备准确、效率、稳定等优势,还提供 OpenClaw 、Hermes Gateway 接入方案。最后预告了 5 月 29 日腾讯云「数据库 + AI」发布会。

[字节跳动技术团队] Agent Uni - Agent 强化学习 开源框架

veRL 推出开源 Uni-Agent:为通用 Agent 训练打造统一框架
veRL开源团队推出通用Agent统一训练框架Uni - Agent
veRL开源团队推出为通用Agent打造的统一训练框架Uni - Agent。当前开源Agent项目爆火,但支撑复杂通用场景的开源基础设施稀缺。Uni - Agent核心目标是贯通构建、运行与训练流程,“Uni”有统一和通用两层含义。构建上,将Agent核心能力拆为三个模块,各层保留扩展能力;运行层基于火山引擎veFaaS Sandbox提供远程沙盒执行方案,还提供实时仪表盘;训练方面,可接入verl训练引擎,支持前沿训练技术,实验显示模型能力能沿真实任务增长,异步训练效率提升。团队希望未来Agent能在复杂世界感知、行动、探索和进化。

[腾讯设计族] 大模型 AIGC AI开发 设计 艺术展览

[A's周刊 26] 不那么喧哗的声音
A's周刊26期涵盖Google I/O、Code Wiki等科技及艺术资讯
这是A's周刊26期内容,涵盖科技与艺术领域。科技方面,Google I/O 2026于5月19 - 20日在线举行,聚焦AI,重点展示新一代Google AI能力等。会前举办Android Show,发布“Gemini Intelligence”,有跨App自动执行任务等功能,还展示生成式Widget,设计语言升级。Googlebooks有“Magic Pointer”功能,支持自然语言生成桌面Widget。此外,推出全新3D Noto Emoji。Google还发布Code Wiki,用AI帮开发者理解代码库。艺术方面,第61届威尼斯艺术双年展于5月9日开幕,展期至11月22日,主题为“In Minor Keys”,关注“不那么喧哗”的声音。荷兰Studio Dumbar与OpenAI深度合作,将AI特性转化为动态品牌影片。

[十字路口Crossing] 办公协同 CLI AI Native工作流 飞书

飞书 CLI 被开发者热捧的背后,我们看到了这几点
飞书CLI开源受开发者热捧,展现AI办公新可能
文章围绕飞书CLI展开,介绍其受欢迎原因及CLI潮流兴起背景。2026年众多厂商做CLI,飞书CLI开源不到两月GitHub达1万星。创业者用它构建AI Native工作流,如张昊的NoteLoom以飞书为数据底座,Daniel的Pokoclaw以飞书为交互入口。飞书CLI受捧原因有三:底座大,提供自然交互、完整业务环境和语境;更新快,开源40多天迭代新增100多项能力;对Agent友好,分三层设计且有Skills。2026年CLI成潮流,因MCP在长任务中成本高、成功率低,CLI是人与模型、系统的最小公约数,使Agent进入真实工作区。

[百度地图] 地图搜索 大模型 Agent技术 上下文工程 强化学习

【AI地图 Tech说】第十期:从“搜地点”到“做决策”,深度解析百度地图搜索 Agent架构进化论
百度地图重构底层架构,用技术成出行与生活决策助手
随着LLM与Agent技术发展,搜索引擎向生成式AI搜索跃迁,地图场景需满足用户决策需求。百度地图深度整合大模型,重构底层架构。构建LBS原生多Agent体系,含Master、Planner、Executor、Writer四个核心角色。Master按任务复杂度智能路由,将传统搜索接口重构成扁平化工具流。采用ACE框架,构建“知识生产线”让知识库进化,引入机制防止AI陷入错误循环。还引入强化学习,重塑LBS专属奖励模型,落地DPO范式,提升模型专业能力和回答转化率。未来百度地图将成全能出行与生活决策主理人。

[OpenBMB开源社区] 大模型 MiniCPM - V 4.6 多模态模型

MiniCPM‑V 4.6 开源即爆火!登顶 Hugging Face Trending Top 2,免费 API 开放
面壁智能等发布开源MiniCPM - V 4.6并开放免费API
5月11日,面壁智能联合清华大学、OpenBMB发布并开源MiniCPM - V 4.6,开源后迅速登顶Hugging Face趋势榜单Top 2,首周各平台总下载量突破25w + 。截至5月19日,Hugging Face和ModelScope合计约27.4万次下载。该模型正式开放免费API。它参数规模小,亮点为更小、更强、更快,重新定义1B级模型的“智能密度”,性能超越同级,推理效率高,架构创新。目前面壁智能“小钢炮”系列模型累计开源总下载量已突破3000万次。

[Web3天空之城] 人工智能 大语言模型 智能体工程 AI教育

重磅分析| Andrej Karpathy 加入OpenAI死对头Anthropic
AI大神Andrej Karpathy加入OpenAI死对头Anthropic
本文围绕AI大神Andrej Karpathy加入Anthropic展开。他履历丰富,曾在多机构任职。2024年创立Eureka Labs开展AI教育,2026年搁置投身Anthropic。此前“直觉编程”有局限,他提出“智能体工程”,Anthropic的Claude Code和Claude Managed Agents与之契合。OpenAI面临人才流失、财务危机和战略摇摆,开发者倾向Anthropic的Claude,Karpathy的加入将加速资源向Anthropic靠拢。

[货拉拉技术] 私域营销 多模态Agent AIGC

私域转化率翻倍的秘密:我们把多模态Agent融进了私域营销
货拉拉将多模态Agent融入私域营销实现智能化升级
文章结合货拉拉经验,介绍多模态Agent在私域营销的应用。传统营销内容生产有高度人工依赖等痛点,多模态Agent可实现人机协同,提升效率。私域转化面临流量质量、客户心智等挑战。Multi - Agent系统采用三层解耦架构,包含业务应用、核心智能体、基础支撑层。三大专属Agent各有优势:AI质检Agent实现质检全量实时检测;多模态营销素材生成Agent实现素材规模化精准输出;问答交互Agent实现AI自主承接全量交互。该系统让私域运营自动化、智能化,降本提效,沉淀的框架可适配不同场景。

[微软亚洲研究院] 大模型 AI工程化 代码仓库 结构化图表示

RPG 与 RPG-Encoder:为仓库级 AI 工程,量身打造一种中间表示
微软亚洲研究院提出RPG与RPG - Encoder用于仓库级AI工程
文章介绍微软亚洲研究院提出的RPG与RPG - Encoder。当前大模型在仓库级应用缺合适中间表示,主流AI智能体框架代偿性表示有局限。RPG正向生成完整仓库,将规划载体换为结构化图,用ZeroRepo流水线生成,实验效果好。RPG - Encoder反向理解已有仓库,通过Encoding三阶段反推RPG,信息保留能力强。还设计差分维护机制降本,开放为推理基底,代码定位表现优。二者构成推理闭环,类似编译器中间表示,实现仓库级工程降维,代码、论文等已开放。

[海外独角兽] AI Anthropic 战略聚焦 组织文化

拆解 Anthropic:最好的 AI 公司,可能也是一种组织发明
Anthropic靠战略聚焦和独特文化在AI领域后来居上
文章深入剖析了Anthropic公司后来居上的原因,核心在于战略判断与组织文化。战略上,OpenAI业务多元,Anthropic则聚焦coding方向,这一选择源于早期融资困境及对AGI的探索,后因ChatGPT爆火转向toB,强化coding能力。创始人Dario的性格和出身使Anthropic在关键方向决策果断、保持定力。组织文化方面,Anthropic人才流失率低,其文化有使命导向、高信任低自我、人文底色强三个特质。通过特殊招聘标准、信息共享文化、同股同权结构和强调团队合作等方式维持文化。文化形成与业务要求和创始团队出身有关。最后指出Anthropic和OpenAI底色不同,虽Anthropic有优势,但难以判断未来战局。

[京东技术] 跨境电商 AI技术 套图生成 多语言适配

AI助力跨境增长:京点点Oxygen Vision跨境套图AI生成技术实践与展望
京东京点点Oxygen Vision推出跨境套图AI生成功能
跨境电商中商品视觉很关键,但传统视觉生产模式成本高、周期长、适配难、合规弱。京东零售“京点点Oxygen Vision”推出跨境电商商品套图智能生成功能。该功能面临商品信息抓取、多平台适配、多语言本地化、效率画质平衡等挑战。其有极简操作、多平台适配、多语言本地化等优势,以一款宠物喂食器为例,3步即可完成素材生成。技术突破源于技术、数据、业务深度融合。未来将深化多模态融合、提升个性化智能化、拓展适配范围、构建优化体系、推动技术普惠与生态融合,助力商家降本增效。

[大转转FE] 大模型 AI工程化 提示词工程 上下文工程 Harness工程

AI新名词比我头发掉得还快
文章梳理AI应用开发三代工程化跃迁及相关名词
文章介绍AI应用开发三代工程化跃迁,梳理相关名词。第一代提示词工程,目标是让模型听懂人话,如Prompt、CoT等技术,如今已成基础。第二代上下文工程,要精准塞信息到模型上下文,包括RAG、Function Calling等,解决模型获取资料问题。第三代Harness工程,建立评测体系确保AI可靠,有Eval Harness、Benchmark等评测手段。文末给出踩坑指南,如Function Calling和MCP不竞争等,还总结应对新名词方法,按三代工程核心问题判断。

[阿里云开发者] Agent技术 技术演变 大模型

Agent核心技术概念与范式发生了哪些演变以及背后的思考
作者梳理Agent技术演变范式及核心技术概念变化
文章围绕Agent技术演变展开。近几年,Agent领域爆发式增长,新旧技术概念易混淆,作者有必要梳理其演化范式。Agent发展历经四阶段:2023年早期Agent是被动式ReAct,交互类似增强版Chatbot;2024年工作流Agent用工程化约束弥补模型不确定性,在to B领域受欢迎;2025年自主Agent具备复杂规划和长程任务能力;2026年自进化Agent能自我沉淀和升级。核心技术概念也有变化,Prompt从深耦合到渐进式加载;Planning从思维链到复杂长程任务;Memory从检索增强到文件系统化;Tools从Function Call到CLI/Script;Workflow从刚性编排到动态混合封装;Environment从无状态到运行时环境。总之,Agent内核重构,正从“魔法调优”走向“系统工程”。

[美团技术团队] 数字人视频模型 LongCat-Video-Avatar 1.5 开源 音频编码器升级 数据处理

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源
美团技术团队开源 LongCat-Video-Avatar 1.5 数字人模型
美团技术团队正式开源数字人视频模型 LongCat-Video-Avatar 1.5,其在多方面实现升级。能力上,基础体验全面商用化、支持场景更丰富、推理部署更高效;技术层面,音频特征提取编码器升级,构建多阶段数据处理流程和三类增强数据;还针对手部专项优化。推理上采用 DMD 蒸馏,效率提升约 15 倍。评测显示,该模型在自然度、真实感和稳定性上优于部分头部闭源模型,在多个维度表现均衡且领先,单人、多人场景得分高,物理合理性、长时序稳定性和音视频协调表现佳。开源旨在邀请开发者和创作者探索数字人视频真实应用边界。

[腾讯技术工程] 大模型 Agent Memory 短期记忆压缩 Mermaid无限画布 上下文卸载

腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载
腾讯云发布Agent Memory短期记忆压缩方案并将开源
文章介绍腾讯云Agent Memory短期记忆压缩方案,结合上下文卸载与Mermaid无限画布。先阐述语言压缩概念,引出大模型压缩本质及符号设计原则。Mermaid无限画布可组织任务结构,Flowchart更适合Agent执行过程。该方案将信息分层存储,实验表明能降Token消耗、提任务完成率。产品分短期和长期记忆模块,短期适合长任务,长期可复用用户偏好,且即将开源。

[腾讯研究院] AI 文化产业 人机共创 Harness时代

腾讯司晓:AI内容时代,人应该成为技术的“掌舵者”|万字实录
腾讯司晓演讲谈AI时代文化产业变革及腾讯AI观
在2026年文化强国建设高峰论坛“人工智能驱动文化产业创新发展”分论坛上,腾讯司晓演讲指出,AI带来“充裕时代”,也让文化产业面临变革。从媒介传播史看,AI是认知延伸。技术加速发展,AI进入Harness时代。文化产业有三个巨变:河道变宽,创作门槛降低,产能暴增但质量参差不齐;水流速度加快,Token像里程计价器,是智力文明计量单位;航程变远,AI助力内容出海。因内容质量问题,需“掌舵者”把关,腾讯提出“人要成为AI的尺度”的AI观。

[谷歌开发者] 大模型 Gemini 3.5 智能体开发 Android开发 Web开发

Google I/O 2026 | 开发者主题演讲精华集锦
Google I/O团队在2026大会发布Gemini 3.5及多项开发工具
Google I/O 2026大会上,Google I/O团队发布Gemini 3.5系列模型,升级“智能体优先”开发平台Antigravity。Antigravity 2.0等提升编排智能体效率,保障开发安全;Google AI Studio原生支持Kotlin,方便构建全栈应用。Gemini API提供托管式智能体,还有Antigravity SDK可自定义部署。在Android开发方面,稳定版Android CLI及开源技能助力应用构建,Android Bench可评估LLM表现,迁移智能体可缩短代码迁移时间。Web开发上,WebMCP、Modern Web Guidance等工具提升开发效率和体验。此外,大会还有主题演讲揭示更多更新,谷歌正招募开发者分享技术内容。

泛技术视野与跨界实践

[硅星人Pro] AI 操作系统 Windows Mac

为什么说Windows在AI时代变成了落后生产力?
文章分析Windows在AI时代落后于Mac的多方面原因
文章从多方面分析为何Windows在AI时代成落后生产力。开发工具天然偏向Unix系,Windows路径分隔符、语法与开源工具默认设置差异大,需装WSL,且跨文件系统操作有问题。开源AI生态多源于Unix环境,Windows融入需翻译。硬件上,苹果芯片统一内存架构有优势。AI产品多Mac优先,因开发者多用Mac。Windows系统AI功能有问题,微软存在云计算与桌面系统的利益冲突。虽Windows市场份额高,但Mac出货量增速快,苹果还推出低价MacBook Neo吸引用户。

[硅星人Pro] AI Token 公司考核

一个月烧掉 930 万元 Token 的人,也没烧出个答案
亚马逊、Meta等公司考核Token消耗,引发员工滥用问题
文章围绕Token在AI时代的应用展开,讲述其身份从技术术语转变为KPI、话费套餐、捐赠货币等。亚马逊、Meta等公司将Token消耗作为考核指标,导致员工为刷排名滥用Token。00后校友捐20亿Token,龙虾之父一个月消耗6030亿Token花费930万人民币,但未得出有价值成果。目前公司考核Token消耗量而非产出,造成资源浪费,人们应思考Token使用的必要性。

[美团技术团队] 美团 跑腿Skill AI应用

美团跑腿 Skill:一句话,骑手来帮忙
美团推出跑腿 Skill,用自然语言即可下单跑腿服务
文章介绍了美团跑腿 Skill。它是接入 Claw 的「跑腿管家」,能将六步下单流程压缩成一步,用户用自然语言提需求,就能生成美团跑腿订单。该 Skill 支持所有 Claw 客户端,可通过发链接或 zip 包给 Claw 安装,首次使用跳转美团 App 授权,之后无需重复。其有多项安全与技术保障,如智能地址匹配、预览确认、安全门控、订单查询等。安装体验并填问卷有机会获 50 元无门槛美团红包,还提醒用户注意使用风险。