阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选技术周刊技术周刊SignalSignal个人博客个人博客
登录注册
第 274 期

Signal #14:AI Coding 的新指标,不再只是代码采纳率

2026.06.01

技术周刊

第 274 期
2026.06.01
Signal #14:AI Coding 的新指标,不再只是代码采纳率
第 273 期
2026.05.25
Signal #13:AI Coding 的下一站,是失败与反馈
第 272 期
2026.05.18
Signal #12:Coding Agent 正在拥有自己的运行时
第 271 期
2026.05.11
Signal #11:Agent 的中间过程,正在被产品化
第 270 期
2026.05.04
本周 Signal:Coding Agent 正在从工具入口,走向工程基础设施
第 269 期
2026.04.27
本周 Signal:模型更新仍然重要,但不再是唯一主角
第 268 期
2026.04.20
本周 Signal:多 Agent 并行,开始从实验玩法变成产品默认交互
第 267 期
2026.04.13
本周 Signal:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
第 266 期
2026.04.06
本周 Signal:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
第 265 期
2026.03.30
本周Signal:执行开始接管软件,界面退居为观测层
第 264 期
2026.03.23
本周 Signal:复杂度开始从“人”迁移到“系统”
第 263 期
2026.03.16
本周 Signal:软件工程岗位开始 AI-native 化
第 262 期
2026.03.09
本周 Signal:AI 工具正在获得长期记忆
第 261 期
2026.03.02
本周Signal & 我们可能一直误解了AI对软件研发的影响
第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 273Signal #13:AI Coding 的下一站,是失败与反馈

Signal #14|AI Coding 的新指标,不再只是代码采纳率

这周 GitHub Copilot usage metrics API 新增了 ai_adoption_phase,把用户按 Copilot 使用方式分成 Code first、Agent first、Multi-agent。

这个变化值得记录:平台已经不再只统计“有没有用 AI”,而是开始区分开发者到底停留在代码生成阶段,还是已经让 Agent 进入任务执行、多入口协作的阶段。

这里说的代码采纳率,不只是早期 Copilot 的补全采纳率,而是更宽泛的一类代码层指标:AI 生成代码占比、出码率、代码被接受和保留的比例。这些指标仍然重要,但它们只能说明 AI 参与了编码过程,不一定说明研发流程真的被改变了。

类似的变化也出现在 Cursor 的客户案例里。Faire 使用 Cursor Cloud Agents 后,官方强调的是 weekly PR throughput 翻倍、每周 2000+ 次 automated agent runs,而不是单纯强调生成了多少代码。

这说明 AI Coding 的评价口径正在变化:过去更多看“AI 写了多少代码”,下一阶段会越来越看“AI 承接了多少真实研发工作”。真正进入企业研发流程后,更关键的指标会是任务承接率、PR 吞吐、返工轮次、验证通过率,以及人工介入次数。

AI Coding 的核心问题,正在从“能不能写代码”,转向“能不能稳定参与研发流程”。

国内技术( 64 篇)

AI 技术与算法实践

[字节跳动技术团队] 搜索推荐 AI Agent 智能问答 数据激活

Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐
Viking发布SearchCLI,可激活数据实现搜推问一体化
Viking AI搜索CLI(SearchCLI)正式发布,可将企业数据资产转化为智能服务。它通过IaC范式,整合复杂任务为简洁命令,借助Agent完成操作。以独立设计师小V为例,展示其使用过程:安装与初始化时,利用AI Agent自动下载配置、获取AK/SK授权;智能数据预处理和导入,自动整理素材成结构化数据并入库;能自动生成搜索、推荐、问答策略,实现多模态检索、个性化推荐等;还可进行数据验证,通过自动化测试与调优闭环提升效果。SearchCLI价值在于激活数据,实现数据入库、搜推问一体化及AI驱动调优,还能赋能多行业场景。

[大淘宝技术] 大模型 AI自主决策 DeepAgent模式 架构改版

从定制Workflow到AI自主决策的架构演进——以TMIC AI小新为例
TMIC AI小新从定制Workflow升级到DeepAgent模式
本文分享了TMIC AI小新从定制化workflow到DeepAgent模式的架构改版实践。AI小新是TMIC平台核心AI问答产品,当前定制化workflow虽稳定但缺乏灵活性,难以应对复杂问题。改版借鉴DeepAgent思路,采用TodoList、SubAgent、Summary、FileSystem等组件,解决了标准ReAct模式的问题。同时针对业务场景优化,如Tree Action模式、SubAgent提速、异步Summary等,提升了系统性能和效率。架构由加载上下文模块和DeepAgent模块组成,前者提前准备上下文信息,后者负责核心推理。此外,还介绍了各组件功能、设计要点及遇到的问题与解决方案,最后通过评估指标对比定制版Workflow和DeepAgent模式,展示了后者的优势,并对未来架构优化进行了展望。

[微软亚洲研究院] 大模型 智能体 SkillOpt 深度学习 过程性知识

SkillOpt:把智能体的“技能”当作可训练的外部参数
微软亚洲研究院推出SkillOpt优化智能体技能
文章介绍微软亚洲研究院推出的SkillOpt,它是首个系统化的可控文本空间优化框架。当前大语言模型智能体技能优化存在问题,缺乏训练纪律。SkillOpt把智能体技能定义为可优化问题,将技能文档视为可训练参数。其编辑分前向、反向、更新三步循环,受文本学习率约束,有验证门控机制。该框架设计了ZeroRepo流水线,引入深度学习训练控制机制。实证显示,SkillOpt在52个评测单元全胜,提升模型性能,缩小大小模型性能差距。组件消融实验证明其收益源于机制协同,技能文件可跨场景迁移,具有可读性与精简优势,为智能体工程落地提供新思路。

[与数据同行] AI Agent OpenClaw 场景选择 企业授权

大多企业选的 OpenClaw 场景,活不过三个月
文章剖析企业选OpenClaw场景误区及正确方法
本文围绕企业选择OpenClaw场景展开探讨。指出多数企业所选场景易成演示项目,原因是选场景思路有误,应关注“能被授权做什么”。还分析五个思维陷阱,如选高影响力场景易因权限和责任问题被毙,简单场景普通AI助手即可,个人场景不能直推企业等。强调应按授权等级选场景,分只读、整理、建议、代写、执行五级,第一批慎入高风险执行。提出选场景三问,通过后也别一步到位,应分只读观察员、草稿助手、受控执行者三阶段推进。最后指出企业底座成熟度影响Agent落地,上线需兼顾能力与治理。

[阿里云开发者] 数据开发 数据验数 Agent Skill

verify-data:一个端到端的数据验数 Agent Skill
阿里推出 verify-data 端到端数据验数 Agent Skill
文章介绍了面向数据开发团队的端到端数据验证 Agent Skill——verify-data。先阐述传统手工验数痛点,引出 verify-data。它通过自然语言交互自动完成验数全流程,有效率提升、覆盖度高、智能决策等优势。核心能力包括基准表自动发现、10 类验数 SQL 模板等。通过 4 个实战案例展示其应用,还介绍设计原则、红线、踩坑经验、架构协同。同时指出当前存在执行效率、权限依赖等挑战。最后总结核心经验,提出未来演进方向,如极致体验、平台融合、智能进化。

[微软亚洲研究院] 计算机视觉 图像压缩 视频压缩 3D空间理解 扩散模型

CVPR 上新 | 从生成式压缩到3D空间智能,七项前沿突破洞悉计算机视觉未来方向
微软亚洲研究院发布CVPR 2026多项计算机视觉成果
6月3日至7日CVPR在美国举行,本文介绍微软亚洲研究院入选CVPR 2026的七篇精选论文。包括引入面向图像压缩的扩散基础模型CoD,实现压缩与生成联合优化;提出基于一维隐表示的生成式视频压缩方法GVC1D,减少冗余;构建分层三维空间理解框架HiSpatial,增强视觉 - 语言大模型3D空间认知;设计面向3D生成的原生紧凑结构化隐表示;提出面向扩散Transformer模型的区域自适应采样策略RAS;构建可流式传输实时说话人像视频生成框架;引入语义优先扩散潜在扩散范式SFD,异步融合语义与纹理建模。

[搜狐技术产品] Android 自动化引擎 端侧自动化 AI融合

破局与重构:纯端侧 Android 自动化引擎的尝试与未来推演
开发者探索纯端侧Android自动化引擎并推演未来
文章围绕纯端侧Android自动化引擎展开。先指出传统移动端自动化方案痛点,提出端侧自动化思路。介绍架构,分控制调度、动作引擎、视觉感知、解耦消息总线四层。阐述动作引擎手势注入与降级策略,UI树元素搜索算法和WebView穿透方法,以及截屏内存对齐问题。还提及工程化的异步重试和跨组件解耦机制。分析当前架构存在截屏授权、WebView黑盒等缺陷及合规监管问题,给出转向B端和权限沙箱化两条出路。最后探讨其商业应用和与AI视觉大模型融合的未来发展方向。

[AndroidPub] 企业内部机器人 Skill 飞书CLI MCP

MCP 的时代已经过去了:做企业内部机器人,我只用 Skill + 飞书CLI
作者弃用MCP,选用Skill+飞书CLI做企业内部机器人
作者认为在企业内部做群聊问答机器人,MCP时代已过去。最初作者选MCP,因其概念体验好,但落地时发现它运维负担重、链路复杂、绕开平台能力。作者最终采用AI平台Skill+飞书官方CLI方案,该方案轻且稳、无需维护底层细节。飞书官方CLI有内置鉴权、封装API、部署链路短等优势。最终架构是Skill触发CLI读取飞书文档。运行后效率提升,系统更可持续。作者认为MCP在跨平台接入有价值,但企业内部首选Skill+飞书官方CLI。

[搜狐技术产品] AI技术 视频制作 Agent Skin Harness

Harness 实践:让 Agent 自动制作知识讲解视频
花园老师分享Harness实践,用Skill让Agent制作知识讲解视频
作者将制作技术讲解视频流程封装成Skill,分享让Agent自动制作知识讲解视频的方法。首先介绍视频制作,用网页而非视频生成模型,因网页可控性强、成本低。关键流程包括将文章变口播稿、拆成开发大纲、做视觉演示及让步骤和口播对齐。做成Skill是为让Agent稳定产出。接着从执行编排、上下文管理等六方面拆解Skill设计,还介绍搭建环境所需工具及安装方法。最后以文章为例演示实战流程,从启动Claude Code到生成脚本和大纲、人工确认、开发章节、确认网页、合成音频、选择播放模式及归档。本质上这是一次Harness实践,为Agent搭建可重复执行轨道。

[搜狐技术产品] 客户端开发 VibeCoding 安全 成本 合规

别被 AI 带进坑里:写给客户端开发者的 VibeCoding 避坑指南
作者为客户端开发者给出VibeCoding避坑指南
文章介绍了客户端开发中VibeCoding的使用及避坑指南。VibeCoding能快速生成代码,但不能直接用于发版。作者给出多方面底线规则:安全上,要注意权限校验、数据处理、依赖选择等;成本方面,需弄清计费、试算并设置“刹车”;合规要上线前检查;数据结构、失败恢复、测试和可维护性要提前规划;性能上要预估目标机型情况;提前准备事故止血手段。最后强调用问题引导AI,守住发版底线。

[PaperAgent] AI 办公助手 OPC 商汤办公小浣熊

把Harness搬到桌面,这款Agent打通了我的办公OPC
商汤发布办公小浣熊桌面端2.0并开启300万挑战赛
文章介绍商汤办公小浣熊桌面端2.0,它能操控本地文件、浏览器,连接企业系统,打通办公OPC。传统AI助手多局限于聊天框,而办公小浣熊可直接处理本地文件,如分析Excel数据、生成HTML数据看板;能操控浏览器采集网页信息;可与飞书协作,还支持定时任务。商汤还开启真实任务挑战季,总奖池超300万,包括OPC能力挑战赛和21天真实任务打卡挑战,鼓励用AI解决实际工作问题。目前该桌面端Mac和Windows版已上线。

[腾讯技术工程] AI 显形运动 软件开发 判断力

Harness 的尽头不是缰绳,是镜子:AI 时代最沉默的那场革命
文章探讨AI时代人类知识“显形”革命及应对策略
文章围绕AI时代的“显形”革命展开。AI促使人们将工作中的隐性知识写成文本,这是人类历史上第三次显形运动,此次是审视自身。显形运动分三层穿透研发:意图层让意图文本化,暴露诸多未想清之事;执行层使老师傅经验显形,改变其价值定位;判断层因AI速度和趋同压力需显形,但面临Goodhart定律及“综合评价”数学难题,存在不可能三角。以18世纪德国科学林业悲剧为鉴,提醒显形可能忽略关键因素。为此提出立三块石碑:验收标准即代码、对抗性审查网络、品味作为资产,同时要留出战略、价值观等不刻之处。最后指出这场运动躲不过,人应转身探索新的“看不见之地”。

[TRAE.ai] AI Agent Skill 渐进式加载

看了很多文章依旧不会写 Skill ? 保姆级攻略请查收!
作者分享Agent Skill创作攻略及应用方法
文章围绕Agent的Skill展开,介绍其概念、价值、写作方法与管理策略。Skill是给Agent用的可复用工作能力包,能解决重复解释问题。其采用渐进式加载,把“写流程”和“跑流程”分开。适合Skill化的任务需重复出现、易跑偏且有明确交付物。写Skill可先找现成的复用或改造,也可从零开始,先写description和SKILL.md骨架,把确定动作脚本化。写完后用Evals验证,持续迭代改进,还可让AI辅助。最后给出将重复任务变成Skill的6个建议动作。

[转转QA] AI测试 意图驱动测试 业务视角Code Review 自动化基建

AI Coding 时代下的 QA 破局之道:上门回收团队的 AI 测试探索
上门回收团队探索AI测试,从执行者变身副驾驶
AI编程普及冲击传统质量保障体系,上门回收团队发现AI编码有“盲目自信”“局部视角”缺陷。团队尝试破局:一是用“意图驱动测试”取代传统用例,定义“需求意图文档”,实现人机协作;二是升级提测质量门禁,用大模型做业务视角Code Review,前置拦截隐患;三是打通自动化基建,让AI负责基础验证,人类专家聚焦高风险、AI难处理的测试“深水区”。团队正从“测试执行者”转变为“AI测试副驾驶”。

[阿里云云原生] 运维 本体论 大模型 AIOps UModel STAROps

本体论又火了,他能优化我的 Agent 效果么?
阿里云可观测团队发布UModel及基于其构建的STAROps
文章介绍本体论从哲学概念演变为数字化转型底层方法论,在人工智能领域用于规范特定领域概念等。在运维领域,大模型面临认知和数据难题,本体论可解决。基础模型和个人技能在特定场景有局限,而有本体论支撑的AIOps系统更优。阿里云可观测团队发布基于本体论的UModel,推动可观测体系转变,采用图建模、统一查询语言、多模数据融合和知识分层设计。基于UModel构建的STAROps已在阿里云上线,可实现智能查数、故障定位和主动运维。

[黑夜路人技术] AI开发 PDCA Harness 大模型

用 PDCA 驯服 AI 开发:让 Codex 和 Claude Code 从“会写”变成“可靠交付”
文章介绍用PDCA和Harness让AI开发实现可靠交付
文章围绕用PDCA驯服AI开发展开。先介绍PDCA,它是“计划—执行—检查—改进”闭环,能让工作持续变好。AI开发因大模型易出错、Prompt无法解决所有问题,更需PDCA。将PDCA映射到AI开发,Plan要明确需求,Do让AI小步执行,Check验证产物,Act沉淀经验。还需Harness作为运行控制系统,让PDCA稳定执行。文中给出三个实战案例,包括Claude Code生成Golang代码、Codex撰写技术文档、Codex做页面自动化测试链路,并提供可复制的PDCA Prompt模板,指出常见错误及避坑方法,最后给出落地建议,强调AI开发需PDCA和Harness,让AI成为可靠工作伙伴。

[腾讯云开发者] AI Agentic Engineering 软件工程 研发效能

Agentic Engineering六条最佳实践
文章介绍Agentic Engineering六条最佳实践
文章介绍了Agentic Engineering六条最佳实践,这是一套AI协作方法论,核心是将AI Agent作为软件工程协作者提升研发效能。阐述了三条公理,包括意图转化链信息损耗、LLM本质特征、人类认知稀缺。审视了五个假设,如代码喂给AI就能理解项目等误区。六条实践为Context Engineering、人机分工、AI全链条参与、小任务+多层验证、Knowledge as Code、Error-Driven反馈闭环,最后给出更多细节链接。

[浮之静] AI编程 软件工程 AI生产系统 规格约束

浅谈 AI 编程
文章探讨AI编程发展及人类在其中的角色转变
文章探讨AI编程,指出代码生产边际成本趋近零,软件工程核心矛盾转变。早期AI编程工具提升局部编码效率,Agent编程虽推进任务但带来新瓶颈。Codex Goal和Claude Dynamic Workflows是关键原语,前者解决目标持续问题,后者解决大规模任务编排。还介绍了Agent相关概念,分析AI生成与人类审查的非对称问题,提出构建harness工程系统。强调代码是负债,规格约束是资产,AI接管老代码库需先测绘系统、沉淀文档。最后指出未来软件工程向AI生产系统工程转变,人类应提升定义系统等能力。

[阿里云云原生] 混沌工程 Blade AI 故障演练

【重磅】 Blade AI 自主韧性测试智能体正式开源
Blade AI自主韧性测试智能体正式开源,降低故障演练成本
文章介绍了开源的Blade AI自主韧性测试智能体。混沌工程因门槛高、流程碎难落地,Blade AI要降低故障演练成本。它是ChaosBlade生态智能代理层,用户用自然语言描述故障场景,它自动完成后续操作。其有七大核心特点,如自然语言驱动、多层安全纵深等。架构上基于LangGraph构建多阶段状态机,能自动感知注入方式,有19种内置场景且可插件式扩展。界面体验丰富,有实时进度条、压力指示器等。还给出真实交互示例,包括TUI对话、CLI Direct、Dry - Run模式。最后说明快速开始步骤,如安装、配置及常用命令,强调它能让SRE聚焦关键判断,推动混沌工程成为日常习惯。

[火山引擎Agent社区] AI Agent 企业级记忆 火山Mem0 飞书妙搭OpenClaw

让 Agent 真正“记得住”:飞书妙搭 OpenClaw × 火山 Mem0 的企业级记忆升级
飞书妙搭OpenClaw接入火山Mem0实现企业级记忆升级
文章介绍飞书妙搭OpenClaw与火山Mem0合作实现企业级记忆升级。妙搭OpenClaw是飞书AI助手,原生记忆架构在企业级办公有局限,如记忆易丢失、抽取覆盖有限等。火山Mem0是面向Agent场景的长效记忆系统,适配性强,接入简单,突破本地记忆架构限制。接入后,OpenClaw体验升级,记忆不丢失、能自动沉淀和唤起。评测显示,Mem0提升了QA准确性、节省Token等。双方差异体现在记忆设计、写入、压缩、检索和性能扩展性等方面。未来,记忆图谱和终身学习能力将完善,助力OpenClaw成长。

前端开发与工程化

[AndroidPub] Android开发 Compose 内存管理 AI辅助开发 多设备协同

Google I/O 2026 | Android 全面进化:从操作系统到“智能中枢”
Google I/O 2026大会宣布Android全面进化成“智能中枢”
2026年Google I/O开发者大会上,Android正从“应用启动器”向“智能系统”跨越。官方宣布UI进入Compose First时代,Jetpack Compose成开发标准。Android 17在内存管理上引入更严格限制,改进底层基建。媒体体验上全面拥抱下一代标准,采用Vulkan API,开发AI增强库。还补齐AI辅助开发链路。此外,Android向智能体系统进化,可跨App编排任务。其野心是多设备协同,涵盖大屏、折叠屏、电视、穿戴、汽车和Googlebook等设备。开发者需适应新变化,做好基本功把握机会。

[TRAE.ai] 新媒体 公众号排版 SOLO 设计工具

新媒体人看过来:用 SOLO 快速设计公众号视觉模板
TRAE SOLO助力新媒体人搭建公众号内容组件库
文章介绍用TRAE SOLO快速设计公众号视觉模板的方法。做公众号排版常遇样式同质化、难成稳定风格、需重复排版等问题。SOLO可将公众号内容拆成小模块,构建可复用的视觉组件库。先确定整体风格,再逐步扩展组件,通过自然语言反馈调整。最后汇总成可翻页图册,使用时复制替换内容。还给出解决排版坑点的方法,如用内联样式、调整图片布局等。使用SOLO能提高效率、统一风格、沉淀长期组件。

[W3C资讯] 前端开发 大模型 智能化IDE UI转译器

[视频] 前端开发中的大模型应用:现状、局限与可能的应对
夏鑫解析前端开发大模型应用现状及应对方案
W3C中国今年4月在杭州举办论坛,探讨Agentic Web时代技术演进与标准化机遇。夏鑫解析大模型在前端开发应用现状等,指出智能化IDE与AI编码工具成开发者标配,分开源与闭源阵营。工业界编程趋势转变,学术界关注多方面研究。但面临生产力幻觉、领域知识缺失等挑战。夏鑫团队针对复杂移动端界面开发提出语义保持的UI转译器,实验效果好且基本实现该方案。

[W3C资讯] 浏览器 AI Web标准 Agent

[视频] 企业浏览器观察:重塑Web体验的机遇与挑战
360企业浏览器团队分享浏览器重塑Web体验机遇与挑战
W3C中国4月举办“Web进化论”论坛,360企业浏览器团队叶家明分享《企业浏览器观察:重塑Web体验的机遇与挑战》。2025年以来,模型层迭代、智能体增长、AI浏览器涌现,让浏览器从信息入口变为任务执行者,人机关系转变。360团队认为浏览器是AI的消费者和提供者,实现双向闭环。实践中存在Web不知Agent存在等问题,根因是桥梁缺失和Web业务无Agent位置。讲者提出给Agent身份的思考,还指出此次与以往不同,最后强调需共同探讨Web如何为Agent时代做准备。

[TripDesign] 前端开发 团队游详情页 重构设计 AI融合

从迷宫到航图,团队游详情页重构
团队对团队游详情页进行重构,适配多场景并融合AI
文章围绕团队游详情页重构展开。因用户旅游诉求多元、AI重塑行为模式,旧的堆叠式框架存在内容多、页面长、阅读耗时等痛点。团队提出意图驱动式框架,从高效、高质、易用三方面优化:高效是将亮点、行程、价格前置首屏,提炼高价值信息;高质是借助AI重写行程等信息,使其易懂;易用是通过多屏设计让操作更顺畅。框架具备场景适配能力,可针对不同人群突出不同特点。此外,引入旅行管家角色,将人工服务转化为AI智能助手,为AI融合奠定基础,助用户从容决策。

[数据可视化 AntV] 前端 React GPT - Vis 图表可视化

一行命令,把 AI 图表装进你的项目
GPT - Vis支持多方式安装,可将AI图表装进项目
文章介绍了GPT - Vis在项目中的使用。它现支持Shadcn/ui分发,通过一行命令可将封装好的React可视化组件复制到项目源码。以前在React项目用GPT - Vis需自行封装,现在简化了操作。可安装通用的GPTVis组件,也能按需安装26种类型化图表组件。GPT - Vis支持多种安装使用方式,包括Shadcn/ui组件分发、NPM包安装、AI Skill安装,覆盖从传统前端项目到AI Agent的场景,还给出了各方式的安装和使用示例,最后提供了相关文档、GitHub等链接。

[Lynx Family] 前端 lynx-ui 组件库

lynx-ui 正式发布
lynx-ui 正式发布,具备多特性且支持多系统
lynx-ui 去年 12 月首次亮相并开源,经打磨完善后正式发布。它采用分层架构,保留原生体验,提供 Web 开发速度。是 unstyled 组件库,组件为可组合的 primitive,为设计系统奠定基础。LUNA 是基于此的参考设计语言。Lynx 采用双线程模型,使交互可编程,动效成组件行为一部分,还将 Motion 动画库搬到 Lynx 上。目前支持 iOS、Android 和 HarmonyOS,Web 和 Desktop 支持在推进,可下载 Lynx Explorer 体验,也可集成到 Lynx 应用试用,开发者可在 GitHub 反馈。

[WeaveFox和他的朋友们] Markdown编辑器 AI创作 WeaveFox

我用 Vibe Coding 做了个 AI 驱动的 Markdown 编辑器
作者用WeaveFox制作AI驱动的Markdown编辑器
作者因现有Markdown编辑器存在不足,用WeaveFox制作了AI驱动的Markdown编辑器。该编辑器功能丰富,支持Markdown编辑与实时预览,有AI标题润色、排版、生图等功能,还能进行图片和文章的云端存储。其背后由WeaveFox的云端服务支撑,包括LLM服务、图像生成、OSS存储和OAuth登录。作者与WeaveFox沟通需求后,10分钟就得到可用工具。相比自己搭建,使用WeaveFox更高效,能做出完整可用的应用。

[淘宝闪购设计] 淘宝 营销会场 体验优化 设计规范 模块治理

淘宝闪购营销会场体验优化
淘宝对闪购营销会场进行系统性体验优化
淘宝闪购营销会场因多年演进积累了体验问题,且活动新阶段推动双端体验一致性优化。优化围绕三方面进行:一是底层规范统一,对双端现行设计规范差异盘点,按三层框架重新定义部分规则,输出新规范;二是推进线上模块治理,以“保业务可用、控投入成本、提治理效率”为原则,通过三级漏斗筛选机制锁定高价值模块,提出“以信息内容为优先”设计主张;三是长期保障机制建设,重构会场模块准入审核流程,建立全链路审核机制,建设三位一体线上设计资产。未来将持续优化,打造更好体验。

后端与云原生架构

[得物技术] 分布式存储 HorizonVault Kafka远程存储

HorizonVault 技术深潜:如何在 HDD 上做出 100GB/s+ 级大吞吐分布式存储|得物技术
得物中间件团队自研HorizonVault实现高效分布式存储
HorizonVault是得物中间件团队自研的高吞吐分布式存储引擎,面向Kafka远程存储等场景。随着Kafka集群数据增长,其本地磁盘面临容量和成本压力,HorizonVault用HDD承接冷/温数据,解决吞吐、抖动和恢复问题。文章介绍了其性能架构,如集群写入吞吐与单盘顺序写、资源池并行、有效利用率有关;存储结构包括DiskStore、Replica等各司其职;写入和读取时Log顺序追加、Index承接随机;还阐述了磁盘治理、线程隔离、网络背压,以及Broker和Meta的资源调度、HA复制解耦、Kafka插件接入等机制。最终实现性能、成本和稳定性的统一,将HDD组织成可调度的远程存储资源池。

[小红书技术REDtech] 多媒体 任务调度系统 架构优化

小红书多媒体任务调度系统的演进优化
小红书多媒体任务调度系统从 RedProcess 演进到 DES
文章介绍小红书多媒体任务调度系统从 RedProcess 到 DES 的演进优化。视频媒体处理采用异步范式,业务流程复杂,要求调度系统具备多种能力。RedProcess 基于 Netflix Conductor 改造,后成为核心调度基建,但随业务增长出现性能、可用性、功能和运维等方面瓶颈。DES 做了系统性重设计,分 Gateway、Dispatcher、Worker SDK 和 Console 四个核心服务,在性能、可用性、功能和维护上优化,还有容灾设计。从 RedProcess 到 DES,实现从“能用”到“好用”的跃升,包括存储分层与读写收口、调度范式升级和容灾体系设计。

[京东技术] 数据库 DongSQL 内核优化

DongSQL V1.2.0发布:持续深耕零售数据库内核,性能与稳定性双重跃升
京东零售数据库团队发布DongSQL V1.2.0版本,性能显著提升
京东零售数据库团队发布DongSQL V1.2.0版本,在多个维度实现重大突破。组提交单播通知减少锁竞争,半同步复制优化提升效率,执行计划缓存避免重复生成计划。单点查询优化扩展支持范围,海量表极速启动缩短时间,SIMD优化提升摘要转换性能。还移植Statement Outline功能到5.7版本,热点行更新优化打破串行瓶颈,带量压测支持保障业务SQL优先执行。此外,还有监控表增强、Jemalloc Profiling、fdatasync优化等。性能基准测试显示,相比V1.1.x版本,各场景均有显著提升。未来将持续优化性能、增强智能运维、推进云原生演进。

大模型 & AIGC 前沿

[大淘宝技术] 电商 大模型 商品领域Agent 实时推理

万级实时推理的商品领域Agent实践思考和总结
淘天集团商品中心构建商品领域Agent提升电商业务
本文围绕商品领域Agent实践展开。商品域为应对AI化挑战,构建“事件驱动的Function - Centric Agent架构”。过去几年已实现离线业务流程统一和实时推理,在核心场景落地,提升信息完整性和转化率,缩短开发周期。文中探讨了选择商品Agent的原因,它整合多种技术,解决复杂业务场景短板。架构建设方面,框架选型轻度“耦合”spring - ai - alibaba;架构设计为两层结构,上层编排,下层供给。还介绍了AIFunction规范、知识库构建、提示词工程、AIWorkflow统一、评测体系、数据投放链路等。事务型商品领域事件是实时推理关键,系统采用分层解耦架构和特定部署架构。目前商品Agent已在多场景落地,提升业务效果和研发效能,未来将融合前沿技术推动电商导购体验升级。

[深思圈] 大模型 AIGC AI创作 OmniWork

当AI创作真的开始"干活",你还需要几个人的团队?
OmniWork推出面向创作的AI操作系统助力创作
文章围绕OmniWork展开,指出当前使用AI是问答模式,存在效率低、难完成完整项目等问题。OmniWork定位为面向创作工作的Agent OS,其Expert可完成具体任务,Expert Teams能分工协作,Skills沉淀复用专家经验。Autowork可自动执行任务,解决创作持续性问题。持久记忆系统能记住用户创作风格。它还在短剧影视、音乐创作、互动影游等场景有应用,降低创作门槛,适合独立创作者等人群,目前处于内测阶段。

[腾讯技术工程] 大模型 推理流程 vLLM 连续批处理 Paged Attention

AI Infra入门干货总结:大模型是如何高效推理的
作者研读vLLM源码总结大模型高效推理流程
作者花2个月业余时间研读vLLM源码,以Llama 3为例介绍大模型推理流程。首先提到连续批处理和Paged Attention是高性能运行关键。连续批处理从token level调度,Paged Attention解决显存碎片问题,但引入离散访存。推理流程包括Tokenize、Embedding Lookup、Transformer Block、LM Head和Sampling。Tokenize用BPE分词;Embedding Lookup将Token ID转特征矩阵;Transformer Block含Attention和FFN模块,Attention计算复杂,用FlashAttention打破内存墙;LM Head映射到词表空间;Sampling经Logits处理和采样选Next Token ID。最后总结推理流程,还提及相关原理和概念及模型配置、运行时变量、vLLM调度流程等。

[蚂蚁技术AntTech] 大模型 智能体安全评测 Agent3σ

蚂蚁集团联合五所高校推出智能体安全评测平台
蚂蚁集团联合五所高校推出智能体安全评测平台 Agent3σ
AI Agent 接入真实系统后安全风险增大,蚂蚁集团联合五所高校推出智能体安全评测平台 Agent3σ 并已开源。该平台评测视角升级为系统级,归纳 7 大类、30 + 典型场景风险,构建递进式三级评测体系。统一使用 ASR、Sec Awareness 等核心指标,首批榜单揭示模型真实安全差异。通过典型案例展示递进式验证方法,能区分模型回答与实际执行的安全性。其发布推动 AI Agent 安全评测进入新阶段,为模型厂商、应用开发者和监管提供支持,未来将持续完善。

[海外独角兽] 开发者文档 AI-native agent-readable 文档生产线

Mintlify 做的开发者文档,如何成为 Coding Agent 生产和消费的第一波内容?
Mintlify提供AI开发者文档服务,获融资并面临竞争
本文围绕Mintlify展开,该公司提供AI-native开发者文档服务。随着开发者文档读者从人类向agent转变,其价值从提升开发者体验变为提供知识入口,错误影响也被放大。Mintlify是Git-backed的托管文档生产线,提供美观文档门面、GitHub原生工作流和agent-readable能力,今年3月发布Workflows新功能。判断文档是否agent-readable可用Agent Score,Mintlify可将相关默认项产品化。在商业化上,虽定价高,但因能替代人力、提供品牌确定性和创新保险,客户超2万家。团队方面,CEO和CTO有丰富实习和创业经验。其面临客户自建、传统文档平台、API-first玩家等竞争,也存在安全问题。短期市场或支撑其发展,长期需进入企业产品知识层提升估值。

[腾讯云开发者] 大模型 Agent Memory 短期记忆压缩 上下文卸载 Mermaid无限画布

腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载
腾讯云发布TencentDB Agent Memory短期记忆压缩方案
文章介绍腾讯云TencentDB Agent Memory短期记忆压缩方案,结合上下文卸载与Mermaid无限画布。日常语言压缩启示信息应提炼关键结构,大模型压缩需通用、可推理的结构化符号。Mermaid无限画布能组织任务结构,Flowchart更适合描述Agent执行过程。上下文卸载将信息放外部,索引找回;两者结合避免单独使用的不足。实验表明,该方案在多评测中降低Token消耗、提升任务完成率。产品分短期和长期记忆两层,短期适合长任务场景,长期可复用用户偏好,方案即将开源。

[与数据同行] 报表开发 AI技术 润乾报表

AI编程热潮下的报表开发探索
润乾报表将AI嵌入报表开发多环节探索创新
AI编程浪潮提升了软件开发效率,但报表开发未享红利。润乾报表将AI嵌入开发环节:一是装“AI Copilot”,用自然语言生成报表,从GUI到LUI;二是让AI制作复杂Echarts统计图,减轻人工调试;三是引入自然语言筛选数据,替代参数模板;四是提供AI自助报表,业务人员可控操作。其采用“规则引擎主导+LLM辅助”架构,成本低、结果可信,提供实用AI报表方案。

[腾讯技术工程] AI 桌面Agent Marvis 多Agent协同

Marvis 实测:6 个 AI“牛马”扎根桌面之后
作者实测腾讯Marvis,展现其能力及优缺点
本文是对Marvis的实测分享。作者被推文吸引,赶在Mac正式版发布前拿到安装包。测试发现,Marvis终端调度能力强,20秒内完成从语音落音到任务执行闭环,还能穿透本地资源;自主规划与多Agent协同执行能力出色,能自行拆解任务;跨模态任务链端到端执行顶级,能从用户交互中即时学习并长期记忆;Agent Workspace设计可爱且体现工程自信。不过,其Vibecoding和设计审美方面表现一般,整理桌面偶有遗漏。此外,作者期待的手机端连接功能iOS端即将上线。Marvis定位安全实用,适合普通用户,验证了AI助手从“对话工具”向“执行系统”转变的方向。

[甲子光年] AI产业 词元经济 代理式AI 智能编排

AI产业的新胜负手:词元的生产与编排|甲子光年智库
甲子光年智库分析AI产业词元生产与编排竞争趋势
文章指出AI产业正步入“词元驱动”的代理式AI阶段,核心生产逻辑从“数据驱动”转向“词元驱动”。数字经济走向“词元经济”,因AI参与生产使生产对象和要素变化。数据不能直接进入代理式AI生产系统,词元才是标准化材料。代理式AI生产类似工业体系,分从数据到词元、词元到代劳能力两个阶段。围绕词元的经济系统形成,含生产、调度、流通、消费环节。词元经济生产函数为Y=O·F(T),AI竞争转向词元生产与智能编排的双轨竞争。

[火山引擎Agent社区] 漫剧创作 AI创作 火山引擎ArkClaw

ArkClaw 漫剧虾工作流实测:从一个主题到爆款漫剧成片
火山引擎ArkClaw「漫剧创作专家」实现主题到漫剧成片
文章介绍火山引擎ArkClaw内容生产Agent「漫剧创作专家」,它基于火山方舟AI图像和视频生成能力,有端到端和多集续写链路。使用时,先在ArkClaw界面创建Agent,准备好相关ApiKey。以“觉醒仪式少年逆袭”主题为例,展示创作流程:Agent先梳理剧本信息,写出可执行分镜剧本,生成角色、场景和道具参考图,编写分镜方案,最后生成视频片段并合成成片。后续将基于AI MediaKit打磨后期处理工作流,提升创作质量。此外还有7日效率提升活动及相关福利。

[职场Bonus] AI写作 去AI味 提示词 Skill

消除“罪证”:给写作去除“AI味”的不完全手册(2026版)
文章发布去除写作“AI味”的不完全手册
文章围绕AI写作“AI味”展开。先是提到网友对AI味写作的调侃出圈,说明“AI味”易被感知,也让人不必担心被AI完全替代。接着指出当前AI检测工具易误伤,网友自发分享“鉴AI”攻略。分析文章有AI味的原因,如过度拔高、否定式煽情句式等,RLHF技术是“元凶”。还给出《去“AI味”不完全手册》,包括注入肉身(投喂文本、标注风格锚点等)、活用提示词(CREATE框架等)、巧妙利用Skill(从官方市场、社区网站等获取)、人工检验(核查数据、引语等)等方法,并提供了相关弹药库,强调AI是工具,要发挥其优势,不被其淹没创意。

[阿里云云原生] 智能体开发 AgentScope Java Harness 企业自进化智能体

AgentScope Builder 快速体验:用 Harness 框架快速构建企业自进化智能体
AgentScope发布Claw和Builder构建企业自进化智能体
文章介绍了AgentScope Java Harness框架下的Agentcope Claw和Agentcope Builder。Claw是“单人本机”示例,可快速做出轻量QwenPaw示例“MinQwenPaw”,有工作区驱动自我进化、操作本机文件系统、接入常用APP三个核心能力,但用于团队会有问题。Builder是“多人企业”平台,是QwenPaw分布式版本,支持多租户、分布式,是零代码智能体开发平台,Agent可自动进化。其基于HarnessAgent和CompositeFilesystem,通过Channel路由组件分配实例,CompositeFilesystem实现工作区隔离和存储,还可加沙箱和换分布式后端。最后给出两者运行示例,开发者可按需选择。

[Datawhale] 大模型 Agent Harness 工程化

刚刚,一篇最全Agent Harness综述来了!
CMU等联合发布Agent Harness工程综述
本文介绍了CMU等联合出品的《Agent Harness Engineering: A Survey》综述。论文用ETCLOVG七层框架拆解Agent Harness,梳理170+开源项目。指出光换模型不是Agent最有效升级方式,同一个模型换执行外壳表现不同。Agent工程经历Prompt、Context、Harness Engineering三阶段。阐述Harness七层含义,强调可观测性和治理重要性。主张Agent评估要trace - native。还提到生产Agent存在成本质量速度、能力控制、外壳耦合等矛盾,Agent从framework走向platform,且随着模型变强,Harness应重新评估,Agent竞争关键在于模型外工程外壳。

[阿里云开发者] 大模型 Claude Code 云端部署 HTTP流式调用 多用户隔离

Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程
作者分享Claude Code云端部署及HTTP流式调用方案
文章围绕Claude Code云端部署及实现HTTP流式调用展开。背景上,因Harness Engineering概念提出,传统开发思路难以适配新设计要求,当前最快路径是部署现有产品。方案分四层:离线部署解决闭源产品安装问题;HTTP流式服务化将SDK调用模式封装为RESTful接口;构建基础镜像实现一次构建处处部署;沙箱多实例隔离为用户分配独立沙箱并进行文件版本化存储。具体步骤包括确认环境、获取离线包、离线安装Claude Code;基于FastAPI重写SDK,支持单次查询和多轮会话,还有高级功能;构建基础镜像并启动服务;沙箱隔离解决多用户问题,实现彻底隔离、状态持久、资源弹性伸缩和版本回溯。最后总结方案优势,强调借助AI提效需个人有工程设计能力。

[腾讯云开发者] 大模型 Agent Skill HTTP交互 OpenAI协议

大模型的Agent Skill功能,在LLM HTTP底层交互流中是怎么承载的?
作者解析大模型Agent Skill功能在HTTP底层交互原理
本文围绕大模型的Agent Skill功能在LLM HTTP底层交互流的承载方式展开。先指出Skills是应用层抽象,被编译成三种协议原语组合。以Cursor和mp - read为例,阐述Skill实现流程:启动时扫描目录提取摘要注入system prompt;用户发问触发Skill,LLM匹配后先读SKILL.md;Cursor执行tool call返回结果;LLM前置检查、执行核心命令;最后Shell执行完毕回传结果,LLM整理呈现给用户。还给出协议交互时序图和Skill协议映射表,强调其复用OpenAI协议,靠prompt engineering和文件系统实现。

[GSYTech] Android AI支持 AppFunctions Gemma 4 A2UI ADK

AI 时代,谷歌都在 Android 官方做了哪些支持?
谷歌在 Android 官方提供 AppFunctions 等多项 AI 支持
文章介绍了 Android 官方在 AI 时代的多项支持。一是 AppFunctions,可让 App 给 AI 提供 MCP 调用服务,被 AI 当成工具调用完成跨 App 任务。二是 Gemma 4,Gemini Nano(Nano 4)端侧能力往可生产推进,通过 Prefix Caching 优化推理性能。三是 A2UI Jetpack Compose Renderer,支持 AI Agent 动态生成 UI,A2UI 协议输出结构化 UI 描述,适配 SDK 就能实现 Agent 生成能力。四是 ADK for Android,用于开发和运行 AI 代理,支持构建多代理工作流,主打混合编排能力。目前 Android 已全面跟上 AI 开发时代,缺有效的 Android MCP 提供更好 AI 调试能力。

[大转转FE] 大模型 MCP AI集成

MCP 解析:给 AI 装上“万能充电口”,打通连接世界的“最后一公里”
团队介绍 MCP 标准,分享 hal900-mcp 实战与应用趋势
本文从前端开发者视角解析 MCP(模型上下文协议)。2024 年 11 月 Anthropic 开源 MCP,旨在让 AI 像插 USB-C 接口一样接入系统。此前 AI 接入企业系统是 N×M 的集成地狱,MCP 实现 N+M 的极简集成。MCP 有 Resources、Tools、Prompts 三大原语,通过 Host、Client、Server 三个角色协作流转。传输协议可选择 stdio 或 HTTP/SSE,hal900-mcp 选 stdio 连 Cursor、HTTP 连 HAL。实战中,hal900-mcp 解决 AI 生成用例平台跑不起来的问题,有 PRD 变可执行用例、改存量用例等丝滑体验。MCP 内置多层防护保障安全,截至 2026 年初发展迅速,未来将成行业标准,推动 TaaS、多模态与自动化发展。

[硅星人Pro] AI 数据中心 投资 产品市场匹配 Agent

硅谷知名AI投资人Tomasz Tunguz:AI公司赚1块烧12块,旧的商业逻辑正在失效
硅谷投资人Tomasz Tunguz剖析AI投资现状与趋势
这期播客中,Theory Ventures合伙人Tomasz Tunguz与GTMfund团队探讨AI投资与发展。今年数据中心支出成史上第五大基建项目,每赚1美元AI需先花12美元建基础设施。到2030年,数据中心资本开支或占美国GDP 5% - 7%,AI竞赛瓶颈转向电力、芯片和推理成本。AI与数据栈融合,改写企业组织架构,产品 - 市场匹配需持续重建。Agent进入采购委员会,营销要面对人和机器。个人层面,AI可拓宽知识边界;公司层面,图像和视频领域机会大,成功公司重视行业历史、人脉和PR。Tomasz认为AI影响被低估,会变革组织设计,建议创始人积极尝试。

[OpenBMB开源社区] 大模型 智能体操作系统 PilotDeck 端云协同

PilotDeck 开源:一人,一桌面,有序管理一支 AI 智能体团队
清华等团队联合开源智能体操作系统PilotDeck
5月25 - 29日面壁智能与OpenBMB联合举办「端侧大模型开源周」,第四弹是智能体操作系统PilotDeck。它由清华THUNLP实验室等联合研发并开源,能根据指令生成3D塞尔达世界,还可与语音大模型联动生成多语种播客,也能完成多种任务。PilotDeck以「WorkSpace」为核心,可同时操作多任务、方便长周期创作、成本可控。当前多数AI Agent工具以「对话」为中心,有记忆黑盒、成本失供、任务被动等问题。PilotDeck用「工作舱」取代「对话框」,有记忆白盒化、智能路由、Always - on三大核心能力,实现端云协同和端侧模型自动部署,项目已开源。

[十字路口Crossing] AI短剧 小云雀短剧Agent 2.0 AI创作工具

实测小云雀短剧 Agent 2.0:真的可以告别抽卡了吗?
实测小云雀短剧Agent 2.0,展示AI短剧创作全链路
本文围绕小云雀短剧Agent 2.0展开。先介绍两部靠其制作的热门AI短剧,《丧尸清道夫》和《聚宝仙盆之杂灵根才是真BOSS》。5月下旬该工具更新到2.0,关键词为“可控”“专业”。作者实测其全链路,从输入两句话生成《不要开门》剧本,风格库升级支持100+影视级画风;资产库自动解析拆出角色场景,角色图质量好且可精修,有角色三视图、光影控制、镜头控制等工具;用“@”串联分镜,分镜脚本详细,成片有电影感,还可去除字幕、打通剪映。最后分析得出AI短剧创作者缺画面控制力,有控制力才能关注故事创作,且AI短剧正走向工业化,该工具沉淀可复用资产体系,平台还对创作者有扶持计划。

[腾讯研究院] 文化产业 生成式AI 产业变革 版权问题

AI破晓:生成式AI时代文化产业的重塑、跃迁与守望|4万字报告
腾讯研究院等发布生成式AI重塑文化产业报告
2026年5月23日,腾讯研究院与中国传媒大学联合课题组发布《AI破晓:生成式AI时代文化产业的重塑、跃迁与守望》报告。报告指出生成式AI正重塑文化产业,虽带来机遇,但也存在隐形成本增加、内容同质化等问题。报告提出“破晓十问”剖析产业现象;通过问卷总结创作者与消费者对AI内容的洞察;阐述传统、数字、AI原生三类业态主体与AI的融合路径;指出文化产业新生态正形成,呈现五方共生格局;点明产业重构的结构性迁移,强调三种价值守望,让技术服务文化。

[数字生命卡兹克] 大模型 Claude Opus 4.8 模型更新

实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。
作者实测Claude Opus 4.8并分享体验及更新特性
本文作者实测Claude Opus 4.8,该模型在Opus 4.7上线42天后推出。其参数和价格与4.7相近,可能顶掉4.6。跑分多数赢GPT-5.5,但Terminal-Bench 2.1跑不过。更新特性包括开放思考强度控制;更精确但主动性弱,对开发者精准,对非专业者可能不便;更诚实,偷懒不良率为0,开发有进步;创作能力比4.7好但不如4.6。此外,fast模式提速且降价,Claude Code新增动态工作流。作者开发体验好,但创作方面因4.6被顶掉而失落。Anthropic还将推出更高智能的Mythos模型。

[阿里云开发者] 大模型 DeepSeek V4 分层缓存架构

Tair 联手 SGLang 共建 DeepSeekV4 分层缓存架构
阿里云Tair KVCache团队与SGLang社区共建DeepSeek V4分层缓存架构
文章围绕阿里云Tair KVCache团队与SGLang社区为DeepSeek V4构建的分层缓存架构展开。DeepSeek V4采用CSA + HCA混合注意力结构,对推理系统提出挑战。该架构包含Shadow Radix、V4 HiCache和V4 HiSparse。Shadow Radix让不同物理池共用逻辑坐标;V4 HiCache用于Prefill阶段,基于UnifiedRadixTree扩展前缀复用能力,多轮对话吞吐提升近3倍;V4 HiSparse用于Decode阶段,减少C4压缩KV在GPU的常驻占用,并发越大收益越明显。此架构解决了长上下文推理的计算和显存压力问题。

[硅星人Pro] AI编码工具 OpenCode 开源 推理服务 工程文化

爆了的AI编码工具,联合创始人亲口说工程师还有救
OpenCode联合创始人谈AI编码工具现状与发展
文章围绕OpenCode联合创始人Dax Raad展开,探讨AI编码工具。过去一年,AI编码工具发展迅速,OpenCode月活从65万飙升至近800万。Dax指出AI编码工具存在核心错觉,如代码产出量涨但质量未必好、消音工程师‘愧疚感’、未达‘生产力倍增’。他分享成长经历,从编程起步,历经创业失败、开源工作。OpenCode于2025年2月开始筹备,定位开源,因市场定位准确和用户体验好快速增长。其商业模式有推理服务和企业控制面两条线,推理业务或成核心收入。当前行业GPU紧缺,AI虽让执行层稍快但未大幅提升效率,企业面临成本和激励难题。Dax发内部信提醒团队克制堆功能、重视代码清理。他反AI预测‘泼冷水’,强调产品要注重用户体验、提升‘产品sense’,AI时代工程领导者角色有变化,资深工程师可结合行业成专家。

[十字路口Crossing] Agent OS Marvis AI助手 多Agent调度

实测腾讯新产品 Marvis | 你说你是新一代 Agent OS?
腾讯PCG应用宝团队推出Marvis并进行多方面实测
文章围绕腾讯PCG应用宝团队推出的Marvis展开,它定位为“操作系统层级AI助手”,有1个调度Agent和5个子Agent,支持多系统且有免费Token。实测中,Computer Agent有预建工具时操作便捷,无则需临场写脚本;App Agent受macOS安全机制限制,操控能力取决于目标app是否暴露接口;Browser Agent技术路径成熟,降低了使用成本。Marvis展示了依赖识别和并行调度能力,自动处理任务依赖。但它未做到任务状态管理、按任务授权等,市面上“Agent OS”产品多运行在其他OS上,期待Agent的Android时代到来。

[腾讯研究院] 大模型 AI故障 分词器 灾难性遗忘 舌尖现象

AI为什么会“失语”?
腾讯研究院解析MiniMax AI“失语”现象及修复方案
文章以MiniMax回答时代少年团队长名字出错为例,介绍AI“失语”现象。先指出这是训练不足词元问题,主流开源模型词表中普遍存在“没真正学会”的token。分词器按词元处理文本,不同语言分词颗粒度差异大,影响费用、上下文长度和理解质量。大模型训练分预训练和后训练,后训练中高频token挤压低频token,导致“嘉祺”向量偏离,出现灾难性遗忘和对齐税。借人类舌尖现象分析,AI失语不等于失忆,频率与连接强度更关键,替代输出可诊断故障。AI错误研究“边用边发现”,此次事件为AI错误图谱添新位置,MiniMax通过给词表token安排训练机会修复问题。

[深思圈] AI Voice AI 界面革命 行业应用 创业建议

Voice AI 为什么是 AI 时代最被低估的界面革命
贝塞麦合伙人分享Voice AI赛道核心观点与创业建议
文章围绕Voice AI展开,指出它是界面级革命。语音能提高数据流入AI的带宽,带来输出质量的质变,是软件系统的基础设施。监管严的医疗、保险等行业采用Voice AI速度快,因其对“控制”要求与平台能力契合。它还重写软件经济学,能替代人工,预算来自人力成本。其护城河在于开发者社区和评估飞轮。当前瓶颈是信任,需治理框架等建立。每通电话都是产品数据,评估体系是核心竞争力。人机交接设计好能建立信任。行业中预约排程等方向竞争激烈,法律案件受理等是蓝海。最后给创业者建议,要端到端拥有工作流,定价采用平台费加用量,团队要有飞轮理论和速度优势。

系统性能与底层优化

[Unity官方平台] 动画系统 CodeGen 运行时性能提升

团结引擎动画系统|Event Graph CodeGen:一键编译图逻辑,提升运行时性能
团结引擎Event Graph CodeGen提升动画系统运行性能
团结引擎的CodeGen功能可将EventGraph与Functions从图的解释执行切换为编译后的C#代码运行,释放运行时性能。其核心优势包括降低CPU开销与内存分配、零破坏性接入、无感知切换、安全可追溯。使用时在AnimGraph编辑器打开图,确保逻辑完成且测试通过后点击Compile按钮,生成的代码存入指定文件夹,运行时自动加载。适用高频逻辑、角色多性能需求高及连线复杂工程。使用时要确保图逻辑无编译错误,避免手动编辑生成脚本等。测试显示,编译后可提升运行速度和减少开销。

职业成长 & 技术认知

[数字生命卡兹克] AI 人才特质 好奇心 靠谱 事实洁癖

AI时代的人才,我觉得最重要的是这6点特质。
作者分享AI时代人才应具备的六点特质
作者因招聘文章爆火,收到众多关于AI人才的咨询。结合自身创业经历,分享AI时代招人看重的六个特质。一是好奇心,知识贬值快,需好奇心驱动持续学习;二是靠谱,AI让包装易,靠谱难以伪造;三是有事实洁癖,AI有幻觉,需验证信息;四是多元化思维,AI缺跨领域能力,人可弥补;五是能忍受不确定性,AI变化快,要在不确定中行动;六是低ego高自驱,低ego接纳变化,高自驱主动探索。作者认为特质比技能、学历更重要,应认识自己,保持好奇。

[梯度不陡] 职场 组织管理 裁员补偿

当大厂人开始等“礼包”,组织失去的不只是人
大厂人等“礼包”,组织和个人或失主动前行能力
文章探讨大厂人等“礼包”(裁员补偿)现象。个人等补偿是基于现金流、家庭等现实考虑的风险管理。但从组织角度看,当多人都等,会导致长期投入、主动性、信任感和未来感流失。大家不再做需长期投入之事,组织进入低信任、低能量循环,影响新陈代谢,真正要关注的是留下的人是否愿意往前走。对个人而言,久等会失去主动选择能力。集体等待表明组织无法给人清晰未来预期,真正值得警惕的是组织让等待比行动更划算。