阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选技术周刊技术周刊SignalSignal个人博客个人博客
登录注册
第 277 期

Signal #17:Agent 开始进入组织系统

2026.06.22

技术周刊

第 277 期
2026.06.22
Signal #17:Agent 开始进入组织系统
第 276 期
2026.06.15
Signal #16:Coding Agent 开始有了工作现场
第 275 期
2026.06.08
Signal #15:Agent 开始进入团队账本
第 274 期
2026.06.01
Signal #14:AI Coding 的新指标,不再只是代码采纳率
第 273 期
2026.05.25
Signal #13:AI Coding 的下一站,是失败与反馈
第 272 期
2026.05.18
Signal #12:Coding Agent 正在拥有自己的运行时
第 271 期
2026.05.11
Signal #11:Agent 的中间过程,正在被产品化
第 270 期
2026.05.04
本周 Signal:Coding Agent 正在从工具入口,走向工程基础设施
第 269 期
2026.04.27
本周 Signal:模型更新仍然重要,但不再是唯一主角
第 268 期
2026.04.20
本周 Signal:多 Agent 并行,开始从实验玩法变成产品默认交互
第 267 期
2026.04.13
本周 Signal:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
第 266 期
2026.04.06
本周 Signal:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
第 265 期
2026.03.30
本周Signal:执行开始接管软件,界面退居为观测层
第 264 期
2026.03.23
本周 Signal:复杂度开始从“人”迁移到“系统”
第 263 期
2026.03.16
本周 Signal:软件工程岗位开始 AI-native 化
第 262 期
2026.03.09
本周 Signal:AI 工具正在获得长期记忆
第 261 期
2026.03.02
本周Signal & 我们可能一直误解了AI对软件研发的影响
第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 276Signal #16:Coding Agent 开始有了工作现场

Signal #17:Agent 开始进入组织系统

Agent 正在从工具入口,变成组织系统里的行动者。

当 Agent 只是帮开发者补一段代码、解释一个问题时,它更像一个助手。但当它开始访问 GitHub、Slack、Linear、云端环境和企业知识库,开始提交 PR、触发流程、调用工具、消耗预算、留下产物时,它就不能再只是一个 prompt 驱动的工具。

这周多个产品变化都指向同一个方向:Agent 开始进入组织已有的权限、凭证、审批、日志、成本和责任体系。它以谁的身份访问系统?能拿到什么凭证?哪些动作需要人确认?执行过程如何记录?产物最后算谁的?运行成本归到哪里?

这些问题听起来不像模型能力,但会决定 Agent 能不能真正进入真实研发组织。

过去一段时间,AI Coding 的重点是让 Agent 能完成任务;接下来,更关键的是让 Agent 能被组织稳定地使用和管理。Agent 越能行动,越需要边界。AI Coding 的下一阶段,不只是更强的 Agent,而是能被授权、被审计、被归因、被纳入工作流的 Agent。

国内技术

AI 技术与算法实践

[阿里云开发者] 数据处理 零ETL Kafka Iceberg 实时入湖

AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
阿里云分享Kafka×Table Bucket零ETL入湖架构方案
文章围绕AI时代流数据入湖架构减法展开。AI时代企业需兼具实时消费、历史沉淀与多引擎复用的数据底座,Kafka、Iceberg与对象存储组合成重要方向,但传统ETL方式有链路长等问题。实时入湖呈现开放格式优先、零ETL诉求等趋势,Kafka入湖分原生集成、Connector/ETL、生态平台三大阵营。‘零ETL’减掉额外数据搬运链路等,Kafka×Table Bucket零ETL入湖路径分三层,消息入湖经记录转换、Schema感知与演进、Iceberg写入与事务提交三阶段,具备稳定性、一致性与可治理性等关键能力。该架构融合协议与格式,成本低、稳定性强、场景覆盖能力完整。实时日志分析、数据库变更实时入湖等四类场景优先受益。‘零ETL’收敛通用入湖能力,减少系统复杂性,未来将朝三方向演进,阿里云ApsaraMQ for Kafka×OSS Tables已实现该能力并开启邀测。

[阿里云开发者] 大模型 Agent Harness工程 主播场景

更可靠的主播助理:淘宝主播Agent的Harness工程实战
淘宝分享主播Agent的Harness工程实战经验
本文围绕淘宝主播Agent的Harness工程实战展开。首先阐述主播Agent需Harness的原因,因其应用场景比多数公开实践更苛刻。接着介绍Harness建设思想,包括基础定义、分层结构和工程载体,分层结构使业务方和框架层责任清晰,工程载体采用逻辑统一、物理分治模式。然后介绍八项实战,如上下文工程通过分层压缩、Reducer模式更新和大上下文卸载解决上下文问题;工具调用从能力边界、约束和错误恢复三方面强化;生命周期Hook在关键时机插入规则;沙箱执行防护隔离不可信代码;五层安全防护体系构建纵深防御;还有异常处理、DAG全局规划和评测体系。最后介绍Harness记忆,从与通用系统差异、三层记忆模型、记忆对账与信任度进化、多因子遗忘等方面提升主播记忆可靠性。

[阿里云开发者] AI工程化 harness AI Coding 流程工程

AI 不缺智商缺纪律:我的 Harness 工程化实践
作者分享Harness工程化实践及AI Coding流程框架
作者分享Harness工程化实践,指出AI Coding瓶颈从“模型能力”转向“流程工程”。harness是把“AI该怎么干活”固化的工程框架,能解决工序随机、上下文污染、坑反复踩等痛点。其采用三层加载模型,各层有不同作用和代价,贯穿19节点链、G1 - G8门禁和意图×风险动态裁剪。演进历经四个阶段,从拿来开源规范,到自建重prompt约束,再到减负分层加载,最终实现Agent调度编排。还构建了评测平台,从7个维度给harness执行打分,推动自进化闭环。最后作者坦诚系统存在不足,如产物质量判不了深度等,并提及业界前沿方向,强调该模式适用于过程可观测的AI工作流。

[梯度不陡] AI Coding Spec-Driven Development 真实仓库验证

Spec 也会骗人:AI Coding 为什么一进真实仓库就翻车
文章借论文探讨AI Coding工程化进入真实仓库的难点与解决思路
文章借论文《Spec Kit Agents: Context-Grounded Agentic Workflows》探讨AI Coding工程化难点。AI Coding进入真实仓库易“上下文失明”,如引用不存在API、错判仓库结构等。“先明确规格,再推进实现”工作流虽重要,但Spec本身可能有误。AI Coding失败常因读错仓库,错误会被流程放大。Spec-Driven Development有价值,但需验证。论文提出在各阶段前后进行只读探测和验证,将AI Coding推进到生成能被仓库承认的方案。未来AI Coding竞争关键在于恢复真实仓库上下文、绑定需求等到仓库事实、阶段发现偏差。AI研发自动化要将隐性判断环节显性化,AI Coding需打通需求、方案、任务、代码和验证闭环。

[梯度不陡] AI Agent 工作空间理解 Workspace - Bench 1.0 RAG进化

AI Agent 为什么看起来很忙,却做不好真实工作
上海交通大学等机构论文揭示AI Agent难胜任真实工作原因
文章围绕AI Agent在真实工作场景的表现展开。指出很多AI Agent虽忙碌,但难做好真实工作,因其难以理解工作空间。真实工作非单文件问答,是上下文恢复,核心是关系判断。上海交通大学等机构论文《Workspace - Bench 1.0》将Agent置于接近真实工作的环境评测,结果显示Agent在复杂任务等方面表现不佳。完成任务关键是理解文件关系,更多工具调用不代表可靠。对研发组织,真实上下文不止代码仓库。RAG正从检索片段向理解关系进化。AI Agent进入工作,需读懂工作空间。

[梯度不陡] 研发自动化 AI Coding Workflow SDD 研发运行承载能力

端到端研发自动化,为什么不能只靠 Workflow 或 SDD
文章阐述端到端研发自动化不能仅依赖 Workflow 或 SDD
文章指出端到端研发自动化不能只靠 Workflow 或 SDD。AI Coding 正从单点生成走向系统化执行,有以规格为中心的工具链出现和 Coding Agent 长时运行两类信号。Workflow 让流程可见,SDD 让任务可表达,但二者只解决局部问题,无法形成完整闭环。端到端研发自动化还需研发运行承载能力,包括输入组织、任务表示、Agent 执行等六方面。落地可从把真实交付项做成可回放样本开始,形成最小闭环。Workflow 和 SDD 应融入更大运行系统,端到端研发自动化核心是面向真实研发现场的运行承载能力。

[大淘宝技术] AI辅助开发 代码迁移 AI+Skills 知识工程

用 AI Skills 打通中间件迁移:定位服务从 Android 到鸿蒙的完整实践
淘天集团团队提出“AI+Skills”解决代码迁移问题
本文以 Android 到鸿蒙的定位服务迁移为案例,剖析 AI 辅助开发中通用智能与领域知识断层的矛盾,提出“AI+Skills”方案。该方案把隐性知识转化为 AI 可读的 Skills 文档,明确分工模型。实践表明,相比纯 AI 翻译和人工查源码,此模式将单服务迁移时间缩至 30 分钟且零编译错误,154 个服务迁移节省 25 小时。该模式适用于需领域知识的 AI 辅助开发场景,未来有望向知识图谱、主动建议、动态生成及组织级知识平台发展。

[京东零售技术] AI3D 三维几何生成 稀疏体素

ICASSP 2026|Sparse-Up:高精三维几何生成技术与应用前沿
京东XR团队提出三维几何生成算法并在“妙搭”落地
AI生成技术向3D领域渗透,催生AI3D革命,市场发展迅猛。京东零售产研中心XR产品研发团队提出基于稀疏体素的高精度三维几何生成算法。当前AI3D生成技术有基于体素表征和基于点云和3DShape2VecSet两条路线。团队论文Sparse - Up被ICASSP 2026接收,提出表面锚定上采样和视域分区渲染优化。实验表明该方法提升纹理重建质量、生成效果佳、降低显存消耗。新算法在商品几何重建上性能跃升,已在京东“妙搭”产品落地,未来将持续创新提升AI3D生成精度。

[WeaveFox和他的朋友们] AI编程 Vibe Coding 应用安全 WeaveFox OAuth2

Vibe Coding 很爽,但你的应用安全吗?
WeaveFox推出OAuth2服务解决Vibe Coding应用安全问题
Vibe Coding(氛围编程)爆火,歌手胡彦斌用其做出粉丝应用“彦火”,但该应用被爆存在严重安全漏洞,尤其登录与认证环节。AI 写登录逻辑易因只求“能跑通”、难搞定加密与校验、维护成本高而翻车。WeaveFox 提供 OAuth2 用户认证授权服务,可一键安全接入,实现“一次接入,无限升级”,还能数据脱敏。用户只需给 AI 发送“帮我加上 WeaveFox OAuth2 登录”提示词,就能自动接入认证体系体验一键安全登录。

[36氪Pro] 游戏行业 AI Agent 业务流程优化

从研发到数据复盘,AI正在改写游戏公司
游族网络引入AI Agent,全面推进业务流程智能化转型
文章以游族网络为例,介绍AI改写游戏公司的情况。游族为提升出海效率,自2023年起引入AI工具,2026年初全员使用Agent,成本公司买单,目前渗透率超75%。Agent在游族业务中应用于三场景:资讯上自动获取、汇总、分析信息;广告素材方面压缩创意到初稿周期,但投放仍需人工判断;运营数据复盘可让业务人员按需查数据。此外,游族将经验封装成Skill,腾讯云沉淀最佳实践进专家团。不过,Agent使用仍需人工验收,其价值在于进入公司高频耗时流程,改写工作方式。

[36氪Pro] 制造业 AI 企业Agent OS

制造业AI落地,海尔智家先做了一个企业Agent OS
海尔智家推出企业Agent OS,与腾讯云合作推动制造业AI落地
海尔智家以智小能为企业Agent OS,打通研产供销服,推动全员自建Agent。腾讯云提供模型、算力等支撑。制造业面临产品难契合用户需求问题,AI需嵌入业务流程。智小能让员工通过一个入口调用智能体,在多业务场景应用,提升研发、采购等环节效率。海尔智家推出“全民开发者”,员工可自建智能体和轻应用。腾讯云与海尔智家共创保障Agent安全运行,海尔智家还将AI能力向上下游开放,推动行业发展。

[DAMO开发者矩阵] 大模型 LLM agent 主动推理 强化学习 T3方法

ICLR'26 Oral | 当 LLM Agent 在多轮推理中迷失时:T3 如何让强化学习重新学会主动推理
港中大等团队提出T3方法解决LLM agent推理训练问题
随着大语言模型走向真实环境交互,LLM agent需具备主动推理能力,但用强化学习训练时,随交互轮次增加,模型易偏离正确判断。香港中文大学等研究者提出论文,从belief tracking角度分析训练失败机制,提出T3方法。T3通过截断belief-trapped轨迹尾部,避免低信息量尾部污染前缀动作的advantage estimation。论文在多个主动推理任务上评测T3,结果显示其稳定提升性能、减少无效token,对不同RL算法有效,在OOD场景也表现良好,且较强模型收益更显著。该工作为多轮主动推理问题提供理论刻画,T3解决思路轻量,有较强可集成性。

[字节跳动技术团队] 办公安全 飞连智能体 AI安全运营

飞连智能体:用 Agent 实现 Agent 办公安全
字节跳动飞连智能体助力企业办公安全运营
随着办公环境复杂化,企业面临 Agent 新风险与传统账号、权限风险。飞连办公安全智能体借助 AI 赋能,适配新办公安全环境。文章通过三个场景展示其作用:一是应对 Agent 使用恶意 Skill 致数据泄露风险,能快速判断、解释和推动处置;二是处理合法账号异常使用问题,从身份认证到可信分析,识别异常行为;三是解决权限长期累积的隐性越权风险,从访问控制升级到持续治理。多个飞连子智能体协同形成办公安全闭环,沉淀安全专家经验,助力企业高效应对风险。

[腾讯云开发者] AI编程 Token经济学 成本控制

一文搞懂Token经济学:同样额度多干3倍活,只需理解消耗机制
文章介绍AI编程Token经济学及成本降低策略
文章围绕Token经济学展开,旨在帮助读者理解Token消耗机制以降低成本。首先介绍Token概念及API调用结构,指出用户输入仅占小部分。接着阐述缓存机制,无缓存成本呈指数增长,KV缓存可节省成本且能覆盖更多对话,不过缓存只能从头匹配。还讲述四类配置加载机制,不同配置适合不同内容。Sub-Agent虽不能省Token,但可防主上下文膨胀。最后提出优化策略,配置侧要精简,对话侧要保护缓存减少无效Token,并纠正了常见误区。

[哔哩哔哩技术] 深度学习 特征选择 LeAP算法

B站特征选择算法LeAP:模型的“精准瘦身”实践
B站搜索团队发布特征选择算法LeAP实现降本增效
文章介绍B站搜索团队的特征选择算法LeAP。先指出现有特征选择方法在工业场景面临维度异构、稀疏特征、算力、掩码门控及超参调节等挑战。LeAP将特征打散做成端到端可学,采用自适应梯度去偏的正则稀疏。在模型特征拼接层后插入轻量级门控模块,通过算法在batch内对特征洗牌生成噪声,与原始特征融合,加入正则项约束。还提出基于特征打散差异的自适应正则化,解决异构与稀疏难题,使特征重要性两极分化。在公开数据集上表现达SOTA水平,已在B站多核心业务场景落地,能识别冗余特征,实现推理提效、降本增效,加速特征迭代。

[大淘宝技术] 大模型 面向Skills编程 AI研发提效

面向Skills编程-淘宝企业购端对端研发提效实践
淘宝企业购团队实践“面向Skills编程”提效研发
文章围绕淘宝企业购端对端研发提效实践展开。提出“面向Skills编程”范式,将领域知识等封装为Skills单元,让AI写代码。核心理念是从“配置化编程”升级,解决传统范式重复编码问题。以企业购客户对接为实战,该业务面临对接高频、需求碎片化等痛点。团队历经五阶段探索:从对话驱动到Prompt模板,再到SDD、Skill沉淀,最终迈向云端集成。通过分层架构设计,将系统拆分为三层,减少适配层代码量。构建垂直领域Skill,解决接口提取、逻辑输出等问题,代码生成成功率从50%提至90%。还建设知识库,实现知识管理和分发。当前虽验证了链路,但仍有提升空间,未来将推进端到端研发闭环,重构研发范式。

[小红书技术REDtech] 自然语言数据分析 NL - to - DSL 查询语义缓存 RedParrot

小红书数据平台部 ICDE 2026 新成果:RedParrot 以语义缓存加速企业级自然语言数据分析
小红书数据平台部联合浙大发布RedParrot加速数据分析
小红书数据平台部联合浙江大学在ICDE 2026发表论文,提出面向企业级商业分析的RedParrot框架。该框架针对传统NL - to - DSL长链路工作流的问题,构建查询语义缓存,将其压缩为短链路生成流程。其核心贡献包括提出查询语义缓存框架、混合式查询骨架构建与实体无关表示学习方法、多源异构RAG增强的DSL生成机制。实验表明,在小红书真实业务数据集上,RedParrot平均实现3.6x推理加速,执行准确率提升8.26%;在开放NL - to - DSL基准上,整体准确率显著提升。此外,文章还介绍了框架各模块的设计与实验效果,以及小红书企业智能部的岗位招聘信息。

[36氪Pro] 企业服务 AI应用 Agent流程

21年老牌企服公司的AI实验:让Agent跑一遍流程
司盟企服将 AI 应用写进规划并落地多流程提效
司盟企服是中港星集团旗下综合企服平台,2018 年起做数字化转型。2026 财年,司盟将 AI 应用写进年度规划,目标是各岗位在 AI 加持下增强、用 Agent 代理工作流程、改造现有流程。司盟总结出让 Agent 发挥作用的标准,即流程清晰、环节标准,据此找到了邮件分类、审计、全球公司注册审核等场景应用 Agent,效率大幅提升。袁林认为企业应用 AI 最大的坑是浅尝辄止,应持续使用,让 Agent 更贴合业务需求。司盟员工深度使用 AI,AI 未替代员工,而是让他们处理更需经验和判断的事。

[火山引擎Agent社区] 可观测体系 自动化 ArkClaw 工程实践

当 Agent 自己做 SRE:详解 ArkClaw 自动化可观测体系的工程实践
火山引擎ArkClaw实践自动化可观测体系工程
文章介绍火山引擎ArkClaw自动化可观测体系工程实践。当前可观测体系缺工程化主线,存在观测对象不完整等五类问题。ArkClaw将体系划分为8个核心Skill模块,包括SLI建模、架构链路建模等。各模块有明确输入输出和规范,如SLI建模从多来源生成结构化SLI Spec,架构链路建模输出三类链路。文章还给出各模块实跑案例,最后阐述其核心价值,能跨语义对齐、跨系统编排、跨时间演进和跨组织复用,是稳定性工程智能化关键一步。

[得物技术] 数据研发 Hermes Agent 数仓工作流重构

从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
得物用Hermes Agent重构数仓工作流并强调证据口径
文章介绍Hermes Agent重构得物数仓工作流。因埋点和指标需求分散信息拼接难,选择Hermes Agent,因其有分层持久记忆、技能自动沉淀等能力。它让流程可控,承担判断前工程化准备,把需求拆成可检查追踪之事。采用单Agent串流程、多能力模块沉淀复用能力,固化流程契约,模块可迁移到更多数据研发场景。总体工作流从对话变为可回放链路,将需求各环节串联。能力底座把规则、上下文和命令资产化,实现协作可见、明确事实源等。风险治理强调上线前需三类硬证据,过三道门。最后指出应跑实证据口径,为扩大使用打基础。

[字节跳动技术团队] AI-Infra 服务器固件安全 威胁建模 安全架构 漏洞修复

初探 AI-Infra 下的服务器固件安全实践
火山云与字节跳动团队分享AI服务器固件安全实践
随着AI - Infra升温,服务器固件安全问题严峻。文章先分析服务器业务特点,从整机视角进行威胁建模,指出需整机视角、重视BMC和BIOS边界、缩小信任锚点。火山引擎给出服务器安全最佳实践,包括构建安全架构(签名与密钥管理、安全启动、可信度量)和进行全生命周期管理(需求、设计、开发、测试、部署、漏洞管理)。以BMC固件漏洞修复为例,介绍修复难点、流程及成果,还提及短期演进(服务器BOM与资产监控、BMC固件Nday扫描工具BoardSentinel)和中长期目标,即形成体系化架构,实现默认安全能力。

[搜狐技术产品] AI Loop Engineering 人机协作

提示词工程已死,Loop Engineering来了!
谷歌云AI总监提出Loop Engineering新协作模式
谷歌云AI总监Addy Osmani称Loop Engineering比写提示词难。Loop Engineering是将‘发现问题、执行、检查、记录、继续下一步’做成自动运转小系统,重点在‘闭环’。一个完整的loop要回答六个问题,包括启动、并行、知识、资料、验收、记忆方面。同时需注意其成本和边界,如token消耗大、不能担责等。代码是其最先爆发的领域,也适用于内容选题等重复、流程稳定且结果可检查的工作。未来人和AI协作会升级成闭环模式。

[人人都是产品经理] 软件工程 AI开发 管理理论变革

记录一次完整的vibe coding项目,花费8小时和30块钱的西瓜
作者用AI 8小时和124.8元完成研发排期工具开发
文章以研发排期工具开发为例,展现AI对软件工程的变革。作者用8小时和124.8元完成工具开发,具备智能排期等核心功能。对比传统开发,AI极大降低成本。同时分享用AI开发踩的坑,如单文件过大和登录无反应问题。最后指出AI使软件工程稀缺资源转变,未来管理重结果验收等,产品经理和开发者边界消失,应向‘问题解决者’方向发展。

[PaperAgent] 大模型 RAG FlowRAG 多跳推理

GraphRAG还在持续进化,FlowRAG让证据链自己流起来
上海AI Lab与华东师大提出FlowRAG优化RAG检索
上海AI Lab和华东师大论文提出FlowRAG,是GraphRAG变体。传统RAG在多跳推理易出错,存在entity sparsity和noise propagation问题。FlowRAG核心设计分三步:建四层图,做双粒度实体激活,做频率感知加权流,旨在让证据连成可解释路径。实验显示,FlowRAG在四个数据集平均GPT - Acc达58.89%,平均Recall达92.90%,但平均Relevance为69.82%。其在效率上表现较好,消融实验表明两模块各解决不同问题,不过在专业领域使用需谨慎设计。

[支付宝体验科技] AI 智能体记忆 大脑记忆机制 Hebb Mind

仿照大脑记忆机制,给 AI 装了一个海马体,拿到了 SOTA
支付宝体验技术部开源智能体记忆项目 Hebb Mind
支付宝体验技术部开源智能体记忆项目 Hebb Mind,它将大脑完整记忆环路引入工程。当前 AI 记忆常见做法有借助文件和 grep 检索、向量库 + 语义检索,但都缺乏大脑记忆的巩固、激活、遗忘环节。Hebb Mind 参考大脑记忆机制,实现编码、巩固、激活、遗忘四步。编码时新记忆存入工作记忆缓冲区;巩固通过后台任务重放记录给大模型;激活时三路同时召回;遗忘由使用频率等动态决定。其在 LongMemEval 和 LoCoMo 数据集表现出色,与其他记忆框架相比,本地优先、多智能体兼容。安装简单,可本地运行,还能接入 Claude Code 和 Codex,提供 WEB 控制台方便管理。

[MacTalk] 生成式推荐 推荐系统 快手技术沙龙 大模型 算力优化

看完快手这场沙龙,我对生成式推荐的判断变了
快手在生成式推荐领域体系化演进并开放挑战赛
作者参加快手技术沙龙,其已走向“生成式推荐系统专场”。快手在生成式推荐领域体系化演进,从 OneRec 到 OneReason,从 OneSearch 到 OneSearch V2,还有 GR4AD、Pool - Rec 等。OneReason 让模型学会思考,解决传统推荐系统边界问题,在实验中效果良好;Pool - Rec 解决生成式推荐算力利用问题;OneSearch V2 用于搜索,GR4AD 针对广告,二者使生成式推荐进入业务主流程;LLM - Rec 挑战赛开放资源。快手在生成式推荐上形成持续演化路径。

前端开发与工程化

[AndroidPub] Android开发 MemoryLimiter Bitmap优化

Google I/O 2026:Android 17 MemoryLimiter 来了,你的 Bitmap 优化做好了吗?
Google I/O 2026介绍Android 17 MemoryLimiter及Bitmap优化策略
文章围绕Android 17的MemoryLimiter展开。它基于设备总RAM限制应用内存,超上限会静默终止进程,目的是防止内存泄漏影响多任务体验。Bitmap是内存占用大户,易触发限制。文中给出Bitmap优化策略,如缩放、裁剪、选择像素格式、用矢量图替代、复用等。还介绍Android Studio新工具,可检测重复Bitmap、集成LeakCanary排查泄漏、用ProfilingManager捕获线上事件。此外,提出onTrimMemory主动释放内存、R8优化字节码等策略,并给出行动清单。

[货拉拉技术] 前端开发 设计稿转码 多模态大模型 UI代码生成

Huolala Figma MCP 原理与实践
货拉拉发布Huolala Figma MCP服务转换设计稿为UI代码
文章介绍货拉拉自研的Huolala Figma MCP服务,可将Figma设计稿自动转为高还原度UI代码。先阐述背景,指出UI编程痛点及AI技术发展促使变革;分析现有方案不足,明确产品定位。接着说明原理,含MCP整体架构、功能、产物及Skills机制,还解析AI算法服务重点算法。实践部分对比同类方案,展示业务应用案例及多语言转码效果。最后总结成果,指出经验与不足并给出后续优化方向,如自动分析工程组件、界面自动定位等。

[GSYTech] Android开发 AI升级 系统更新 App适配

Android 17 正式版发布,全新 AI 和各种破坏性更新
Google发布Android 17正式版,带来多项更新及适配要求
Android 17正式版发布,是首个AI升级且隐私收紧的版本。对开发者而言,有App被AI Agent调用等诸多行为变化。更新重点是向“智能系统”转变,支持AppFunctions。官方明确adaptive - first开发标准,App要适配大屏。新增多任务形态,修改Activity处理配置变化方式,有Continue On跨设备任务接续功能。官方强调Compose - first。性能上,有内存限制、GC改进等变化;隐私安全方面,权限更细化;本地网络访问、SMS OTP保护等有新限制;还加入PQC能力,扩展动态代码保护等。官方提醒开发者尽快适配。

[数据可视化 AntV] 数据可视化 Sive平台 AntV技术栈

一句话搞定数据可视化,你需要这个 AntV 新成员
AntV 发布数据可视化创作平台 Sive
文章介绍了 AntV 出品的 AI Native 数据可视化创作平台 Sive。它能解决数据可视化的难题,面向不同用户有不同功能。对开发者,可答疑并生成可预览图表代码;对业务创作者,能一句话出应用;对数据分析用户,可解析数据结构并持续建设进阶分析能力。Sive 内置 10+ 公开数据源 Skill,支持联网搜索和自定义数据源;支持多种数据格式上传,采用严格私有数据隔离机制;内置 50+ 设计风格 Skill,可复刻网站视觉语言;沉淀多种社区可视化 Skills;还能一键复刻精品应用。未来,Sive 将持续迭代,如接入更多资源、深化 AI 分析能力、探索新调用形式等。

[AndroidPub] 跨平台开发 Kotlin KMP iOS开发

Kotlin 跨平台(KMP)在 iOS 端的实践与挑战
Kotlin跨平台KMP在iOS端实践遇挑战但仍适合生产
文章围绕Kotlin跨平台(KMP)在iOS端的实践与挑战展开。先介绍KMP已投入生产,其能降低开发成本,有质量提升、技术栈统一等优势,在安卓团队接受度高,近半数用户代码复用率超50%,99%用户对性能等方面满意。但iOS端使用KMP面临诸多难题,如调试难、Objective - C互操作性限制、部分iOS API不支持、原生依赖支持有限、并发模型复杂等。最后指出KMP适合投入生产,但使用时要谨慎,可先小模块试点、从共享组件入手,并关注版本兼容性。

[GSYTech] 鸿蒙开发 KMP/CMP适配 Kotlin/Native

KMP / CMP 鸿蒙版本 Beta 发布,他有什么特别之处?
华为发布 KMP/CMP 鸿蒙版本 Beta 适配有亮点
华为官方发布 KMP/CMP 鸿蒙适配版本 Beta。适配门槛高,需将鸿蒙作为 Kotlin/Native 新 Target 实现,代码核心实现和 UI 统一渲染分别来自腾讯 KuiklyBase 和 ovCompose。KMP 适配鸿蒙要在 KonanTarget.kt 新增 OHOS 平台,让 LLVM 后端产出二进制,工具链接通后有多种产物,还支持缓存和 DFX。CMP 在鸿蒙上有自渲染和统一渲染两条 Skia 绘制路线。目前鸿蒙社区版本继承了 KuiklyBase 和 ovCompose 实现,已合入 JetBrains 上游版本,也有算法调整。未来 KMP 和 CMP 在鸿蒙可能多分叉,开发者选择待明确。

[iOS新知] iOS开发 Xcode27 @State改动

一行代码没改,Xcode 27 帮你省掉了 ViewModel 的重复初始化开销
Xcode 27 改进 @State 底层,省掉 ViewModel 重复初始化开销
Xcode 27 beta 中,@State 从 property wrapper 变为 Swift macro,解决了 @Observable 用户的性能问题。以前父 View 重新evaluate,CounterView 的struct重建会让 CounterViewModel() 初始化逻辑多次运行,存在开销。Xcode 27 后,初始值表达式只在 View 首次插入 hierarchy 时求值一次,后续 View struct 重建不再触发 init()。不过,@State 的懒加载只对属性默认值生效,在 init() 里赋值不受影响,若 ViewModel 依赖父 View 参数,用 init() 赋值会有更新问题,应把初始化放属性默认值里,用 task(id:) 响应变化。

[Android 开发者] Android开发 Android CLI 智能体开发

Android CLI 1.0 稳定版现已推出|随时随地实现高质量的 Android 开发
Google 推出 Android CLI 1.0 稳定版助力 Android 开发
本文介绍 Android CLI 1.0 稳定版推出。开发者选开发工具自由度高,Google 使命是确保高质量 Android 开发。在 2026 Google I/O 大会展示其新功能,已发布稳定版。Antigravity 可安装 Android 资源包获开发能力。新版引入 android studio 命令,智能体可利用 Android Studio 功能,还介绍相关命令。可通过多种包管理器安装,更新了安装路径。支持 Journeys,智能体可用其测试应用。还扩展 Android Skills 库,推出新 Skills,可通过命令添加到工作流。最后邀请开发者体验,关注相关资讯。

[搜狐技术产品] Kotlin inline 性能优化 泛型 reified

Kotlin inline:你以为它只是个性能优化?
文章系统介绍Kotlin inline关键字的特性及使用场景
文章围绕Kotlin的inline关键字展开。它用于优化接受lambda参数的高阶函数,减少运行时开销。编译器会将内联函数体替换到调用处,消除对象分配和虚方法调用。其好处有提升性能、支持非局部返回、保留运行时泛型类型信息。但它也有局限,如代码体积膨胀、不适合大型函数等。此外,还介绍了inline属性,可内联getter/setter,减少方法调用开销,适合简单逻辑属性。标准库中的repeat()等inline函数能接受挂起lambda,让挂起调用在协程中正常执行。

后端与云原生架构

[搜狐技术产品] 云原生 Web VNC 动态路由 会话保持 OpenResty

突破云原生网关局限:面向海量 AI 沙箱的 Web VNC 动态路由与会话保持深度实践
团队构建AI沙箱可观测基础设施,解决动态路由难题
文章围绕海量AI沙箱的Web VNC动态路由与会话保持展开。AI发展到自主智能体阶段,运行安全和可观测性成挑战。为解决运行安全问题,采用隔离沙箱;为实现可观测性,选用Web VNC技术。但系统规模扩大后,动态路由难题凸显。传统云原生网关处理复合会话有短板,如静态Upstream配置失效、基于源IP的会话保持脆弱、现代API网关插件有上下文缺失问题。团队重新设计架构,控制面由Sandbox Manager负责拓扑同步,数据面通过自研Lua脚本实现“首包驱动 + 状态寄存”决策树。在工程落地中,解决了阻塞、内存、连接池等问题。生产部署时遭遇多种故障并解决,还进行了生产级调优和安全防御,最终利用HTTP Cookie寄存会话状态,构建了支撑AI Agent观测需求的基础设施。

[搜狐技术产品] 鸿蒙生态 广告跳转 DeepLink 路由组件

鸿蒙生态下广告统一跳转能力的探索与工程实践
团队完成鸿蒙生态下广告统一跳转能力三阶段实践
文章围绕鸿蒙生态下广告 SDK 统一跳转能力展开三阶段实践。因鸿蒙与 iOS/Android 架构差异,传统广告跳转方案无法复用。第一阶段基于 @ohos.router 实现 H5 落地页基础跳转,完成路由组件封装与 Web 页面权限适配,但面临 DeepLink 未支持和接口废弃风险;第二阶段因 @ohos.router 接口废弃,重构为 HMRouter 组件实现无界面依赖的页面跳转,保障了落地页跳转稳定性;第三阶段适配 DeepLink 直呼能力,通过 openLink 接口、页内拦截、白名单机制实现应用间安全跳转。最终形成标准化、可扩展方案,实现架构统一、能力闭环和可扩展性,提升了广告点击转化率,后续将拓展生态能力和优化用户体验。

[前端充电宝] 后端开发 Node.js Nub工具

Node.js Plus 来了!
colinhacks开发Nub为Node.js提供增强开发体验
尽管Bun和Deno发展良好,但多数团队因Node.js生态等因素难以更换。新开源工具Nub由colinhacks开发,定位是增强版Node.js,将分散工具能力整合。它不修改Node源码,在启动前布置运行环境,处理开发细节,提升工具链速度,最高快24倍。还收紧安全策略,与现有包管理器共存,为依赖Node的项目提供现实升级路线。

大模型 & AIGC 前沿

[阿里云开发者] 大模型 AIGC 业务需求专家 Agent 研发闭环

如何搭建一个端到端业务需求专家 Agent
作者分享搭建端到端业务需求专家 Agent 的实践经验
文章分享搭建端到端业务需求专家 Agent 的经验。指出代码外串联成本是瓶颈,要解决上下文组织、工具串联、反馈复利三个工程化问题。系统分四层架构,从输入到反馈形成闭环。纵向流程含需求进入、澄清、方案、实现、协同、验收、发布、结项等阶段,各阶段按需调用架构能力。当前存在接入成本高、缺度量体系等问题,后续规划从单 Agent 扩展到 Agent Team,共享长期 wiki 并各自维护视角。

[阿里云开发者] 大模型 AIGC eBPF 可观测性 OpenTelemetry

装在内核里的透视镜:云监控 2.0不改一行代码实现全栈可观测
云监控2.0的OBI利用eBPF技术实现全栈可观测
文章介绍云监控2.0的OpenTelemetry eBPF Instrumentation(OBI)。云原生和微服务架构下,传统可观测性方案成本高,AI场景也需零代码方案。OBI利用Linux内核eBPF技术,不修改应用代码,自动拦截分析网络流量和GPU操作,生成标准遥测数据。其核心能力围绕应用、网络监控和日志增强三大支柱,支持多种协议。它有语言无关的网络级追踪和运行时特定的深度集成,能解决Go、Python等语言的调用关联问题,跨进程传播对非Go语言在内核态统一完成。OBI用户态是有向图,包括独立Agent、编排框架、节点通信队列等。还能追踪GPU操作,提供网络层观测和日志增强功能。通过云监控2.0可一键接入OBI,后续将补充更多能力。

[AI 深度研究员] 大模型 AI 企业架构 Token资本

后 Fable 5 时代,微软 CEO 抛“Token 资本论”:AI 越乱,你越贵!
微软CEO纳德拉针对Fable 5断供提出企业AI发展战略
Anthropic发布的前沿模型Fable 5因地缘政治出口管制全球断供,暴露企业依赖单一外部模型的风险。微软CEO萨蒂亚·纳德拉发表评论,指出企业应构建“解耦式”智能系统,打造人力资本与Token资本。他认为企业未来需构建两种核心资产,构建学习闭环,将业务流程等转化为AI系统,打造“前沿生态”,避免少数模型垄断红利,让价值回流到各企业和行业。

[数字生命卡兹克] AI Loop Engineering 目标定义

Prompt该退环境了,未来属于Loop Engineering。
OpenClaw、Claude Code等推动Loop Engineering概念诞生
本文介绍AI领域新出现的Loop Engineering概念。6月7日OpenClaw创始人Peter、Claude Code创始人Boris提出相关观点,后Google的Addy Osmani梳理出该概念。Loop Engineering是在Harness Engineering基础上的进化,能实现自动化流程。一个完整的loop由定时任务、工作树隔离、项目知识体系、连接器、子Agent五个组件构成。其核心是定义目标的能力,目标定义好坏影响工具使用效果。同时指出管理AI Agent和管人逻辑相似,但对管理能力要求更高,还存在古德哈特定律陷阱,需结合Harness Engineering。最后给出目标定义框架,并回顾从Prompt到Loop的四次跃迁。

[MacTalk] 大模型 GLM 5.2 软件工程

终于吃上了国产模型的细粮,最新 glm 5.2 成国区 Opus
作者用智谱GLM 5.2实现CatReader移动版并优化
作者分享生活时提到GLM 5.2发布。作者此前用GLM 5.1写东西,认为购买原厂纯血订阅计划最合适,GLM 5.1国内订阅被黄牛抢,作者选海外版。GLM 5.2面向“复杂系统工程”和“长周期智能体”,实现1M超长上下文。作者用其两小时实现CatReader移动微信版,完成后做验证并提交到生产环境。周日重度使用发现问题,与GLM 5.2优化,遇bug切到Codex协助解决。GLM 5.2全面支持1M Tokens上下文,思维链设计更贴合软件工程需求。海外版在国内使用畅通,智谱5.2发布后股价回升。

[微软亚洲研究院] 医疗AI 多模态基础模型 肾癌诊疗 专病世界模型

RenalCLIP:从“通用”转向“专病”,让医疗 AI 更懂肾癌诊疗
微软亚洲研究院等团队发布肾癌诊疗模型RenalCLIP
微软亚洲研究院联合多团队开展多中心研究,在Nature Communications发表多模态基础模型RenalCLIP。该模型聚焦肾癌精准诊疗,基于4家医疗中心6867名患者的CT影像及报告预训练,采用两阶段预训练策略,学会识别与肿瘤性质等相关特征。在系统评估中,它展现卓越临床价值,跨中心泛化能力强,还能预测生存期。此外,RenalCLIP仅用少量微调数据就达通用全量数据训练效果,有较强零样本泛化能力。其成功表明医疗基础模型正从‘更大更广’走向‘更深更专’。

[字节跳动技术团队] 赛事传播 AI短视频工厂 火山引擎 多模态模型

进球、切片、全网爆:如何打造一座跑赢热搜的赛事“AI 短视频工厂”?
火山引擎推出赛事AI短视频工厂及实战指南
赛事流量争夺不仅在直播间,赛后短视频分发也关键。传统人工剪辑难跑赢热搜,易漏‘次高光’。火山引擎AI MediaKit将发现高光、快速切片、批量生成融入直播流实时处理链路。它综合多模态模型能力,支持90+语种,准召率超80%,支持直播和点播处理,其高光片段提取工具能输出结构化数据。火山引擎视频云将多能力串联成自动化生产线,还推出《大型赛事直播与互动实战指南》助赛事运营方抢占流量。

[Kimi智能助手] 大模型 编程模型 Kimi K2.7 Code

6 倍速!Kimi K2.7 Code 高速版已上线
Kimi发布K2.7 Code高速版,提升编程体验并开展充赠活动
Kimi K2.7 Code高速版已上线,输出速度约为普通版5 - 6倍,常规编程场景下输出约180 Token/s,短上下文场景可达260 Token/s。其API定价为普通版2倍,企业和开发者可通过Kimi API开放平台调用。Kimi Code Plan同步上线,用户可加入「抢先体验计划」体验。预计7月起陆续开放给Allegretto及以上会员,高速版在Kimi Code Plan中用量消耗是普通版3倍。使用须打开思考模式。为庆祝模型发布,API开放平台开启三周充赠活动。相比K2.6,K2.7 Code在长上下文编程场景等方面性能提升,基准测试表现更好,普通版定价与K2.6基本一致,非编程任务推荐K2.6。

[谷歌开发者] 大模型 多模态模型 无编码器架构

Gemma 4 12B 开发者指南|借助无编码器架构轻松构建本地多模态智能体
谷歌推出Gemma 4 12B多模态模型及开发集成方案
谷歌推出Gemma 4 12B多模态模型,采用无编码器架构,降低多模态交互延迟。它是首款支持音频输入的中型模型,体量轻巧,可在笔记本本地运行。架构上,用单一Decoder - only Transformer架构,含视觉嵌入器和音频波形投影,且统一微调优势明显。该模型能力优异,如构建本地图像处理应用、处理含音频视频。还推出由LiteRT - LM驱动的设备端开发者集成方案,包括MacOS应用和本地API服务器。用户可通过多种方式体验,如在相关应用中尝试、下载模型权重等。

[MiniMax 稀宇科技] 大模型 多模态模型 MiniMax M3 MSA技术

我们开源了 MiniMax M3
MiniMax 开源 MiniMax M3 模型权重并发布 MSA 论文
上周五,MiniMax 开源了 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型,总参数 428B,激活参数 23B,从 Step 0 开始做多模态混合训练,训练时融合不同模态语义空间。发布两周,M3 在综合智能指数排行榜获全球开源模型最高排名,收到大量实测反馈,获多位行业人士积极评价。针对访问量激增问题,M3 输出速度已提升,Token Plan 后台上线调用量看板。后续迭代将坚守普惠初心,更加开放、加速进步。文章还给出开源地址和 MSA 论文地址。

[腾讯云开发者] AI Agent Loop SELF Protocol

读完Agent Loop工程手册,我有8个还没想明白的问题
作者读Agent Loop手册后提出8个待解问题并分享SELF方案
文章围绕Agent Loop工程手册展开,先介绍其核心主张,将使用AI从手动挡升级为自动驾驶,拆解成Automations等零件,还阐述4个设计法。作者读完手册后,从心态、失败处理等4方面改变工作方式,重新定位了手上的SELF Protocol。接着提出8个未解决的问题,如软目标停止条件、子代理验收、护栏分层等。最后介绍SELF Protocol细节,包括设计目标、模块、数据和安全承诺,目的是征集这8个问题的解决方案。

[十字路口Crossing] 大模型 AI Coding 多模态 Agent 数据

对话 MiniMax 闫俊杰:M3、10X 计划、10T 模型、和智能的终局
MiniMax团队在Dev Meetup探讨模型发展及AI应用方向
本文是MiniMax Dev Meetup圆桌讨论实录。MiniMax创始人闫俊杰表示活动要持续开展,传播AI Coding火种。从M1到M3,模型通用消耗量进步大,但能力上多模态等未达预期。Multica张佳圆提出聚合不同模型解决单一模型缺陷;DeerFlow何涛介绍开源项目,其已成社区;金融公司虞扬称AI应降低专业理解门槛。闫俊杰认为模型与Agent相互拉动,训练10T模型需时间和积累,数据是挑战。在AI Coding方面,要明确不做什么,回归工程底线。MiniMax启动“10x”项目,与专家合作。嘉宾还分享2026下半年关注方向,如陪伴价值、利用AI改善生活等。最后回应观众关于M3优化、模型计划等问题。

[Web3天空之城] 大模型 AGI AI创业 智能公用事业 教育变革

Sam Altman斯坦福最新对话:深度展望AGI和未来的一切
Sam Altman在斯坦福访谈展望AGI和未来发展
本文是Sam Altman在斯坦福大学的访谈内容。他结合OpenAI成长历程,探讨AI时代初创公司逻辑变化。指出廉价token取代人力成核心生产力,创业者应找自动化前不可能的机会。规模会带来涌现效应,如Y Combinator扩大资助产生网络效应。揭秘ChatGPT从研究演示成爆款产品的过程。他还提出智能将成公用事业,商业重心转向推理服务。面对AI对教育冲击,强调培养‘如何思考’的元技能。最后描绘未来十年分歧,包括技术权力走向民主化还是垄断,以及计算资源分配正义问题。

[GSYTech] 大模型 知识蒸馏 中美模型对比

Redis 作者反驳「中国模型之所以强,是因为通过 API 蒸馏了美国模型」
Redis作者反驳中国模型靠API蒸馏美国模型说法
Redis作者antirez反驳‘中国模型强是因API蒸馏美国模型’言论。他指出,API白盒蒸馏在机器学习原理上不成立,因商业API仅返回最终文本,无法获取内部信息;黑盒蒸馏虽可行,但作用有限,难以创造强大通用能力。他认为中国模型落后主因是算力获取限制,而非技术抄袭或蒸馏。此外,文中介绍了硬蒸馏和软蒸馏的区别,指出大众常混淆二者,而中国模型进步源于自身算力投入、数据工程和研究工作。

[火山引擎Agent社区] 大模型 AI Agent 可观测性 APMPlus Hermes Plugin

APMPlus・看得见的 Agent(二) | 从养虾到赛马:Agent 到底在偷偷干什么?
APMPlus发布Hermes Plugin助力Hermes Agent可观测
文章围绕APMPlus Hermes Plugin展开,将OpenClaw比作“养虾”,Hermes比作“赛马”,该插件能让Hermes Agent执行不再是黑盒。它把对话、调用等接入APMPlus,可观测相关指标,还提供预置报警规则。接入后能组合Trace、Metrics等能力,解决常见排障问题,如判断慢的原因、定位Token消耗问题等。最后介绍了一键接入步骤,强调可观测性对AI Agent在生产环境是刚需,后续APMPlus会持续拓展。

[浮之静] 大模型 多模型合议 Fusion 复合智能栈 MoA

OpenRouter Fusion:从模型路由到复合智能栈
OpenRouter 发布 Fusion 开启多模型编排的复合智能时代
文章介绍 OpenRouter Fusion,它是多模型合议 API 原语,标志 LLM 应用架构进入复合推理编排阶段。其核心价值是以推理时计算换取高质量、高覆盖率和强分歧诊断能力,适合高价值、低频、容错成本高的任务。Fusion 工作流按需触发,有工程级容错。官方 DRACO 评分显示多模型面板表现优,但结果需理性看待。其成本高、延迟高,思想源于 MoA 且更克制。Fusion 的 judge 需约束,还存在数据治理问题。它适合开放式、跨领域任务,不适合简单问答等。未来复合智能栈将从固定面板走向动态面板等五个方向演进,AI 竞争将转向智能系统工程能力竞争。

[极思TopMinds] AI编程 企业AI应用 马斯克 SpaceX Cursor

速递|600亿美元全股票交易!马斯克刚刚把Cursor收入囊中
马斯克旗下SpaceX 600亿美元全股票收购Cursor
2026年6月16日,SpaceX向美国SEC提交文件,确认与Cursor开发商Anysphere签署合并协议,以600亿美元全股票交易收购,预计三季度完成。此前Cursor已与SpaceX合作训练模型,SpaceX早有收购选择权。收购Cursor对马斯克意义重大,xAI有模型和算力,Cursor掌握开发者入口和企业软件工作流,三者结合可切入代码生产场景。拿下Cursor让马斯克获得企业AI市场入场券,未来Cursor或集成xAI模型能力。交易待监管审批,马斯克不断寻找变革性技术入口,Cursor可能不是最后一个目标。

[定焦One] AI音乐 版权 商业化 测评

AI音乐混战,谁能成为“中国版Suno”?
国内多玩家入局AI音乐混战,与Suno仍有差距
2026年6月初,Suno完成4亿美元D轮融资,虽深陷版权诉讼,但资本市场看好AI音乐赛道。国内字节跳动、腾讯音乐等纷纷入场,形成三类玩家格局。第一类背靠大厂,将AI音乐作为引流产品;第二类大模型厂商,将其作为商业化手段;第三类垂直创业公司,押注差异化路线。测评显示,国产产品各有优劣,但与Suno有差距。国内AI音乐平台面临版权、付费、出海三道坎,中国音乐市场特殊性或改变其发展形态。

[Unity官方平台] 大模型 GLM - 5.2 Max Tuanjie AI 游戏开发

Tuanjie AI Day-0 接入 GLM-5.2 Max
Tuanjie AI Day - 0接入GLM - 5.2 Max并开启公测
Tuanjie AI自Day - 0全面接入GLM - 5.2 Max。它面向Unity/团结引擎,能在真实游戏工程中完成代码理解等工作,目前公测已开启,公测期有免费额度。GLM一直是Tuanjie AI主力Coding模型,此次接入延续‘发布即接入’节奏,让开发者能及时体验GLM - 5.2 Max更强能力,该模型在Code Arena评估平台成绩优异。还介绍了在游戏工程中使用GLM - 5.2 Max的三步方法,鼓励开发者下载试用并反馈建议。

[大转转FE] 机器学习 人工智能 深度学习 大模型

从神经元到大语言模型,回顾机器学习发展史
文章回顾从神经元到大语言模型的机器学习发展史
文章回顾机器学习发展史。先介绍人工智能定义、流派,引出机器学习。理论萌芽期(1943 - 1969),提出M - P神经元、图灵测试,举办达特茅斯会议定义人工智能,出现首个可学习神经网络模型,机器学习成独立领域。寒冬与破冰期(1969 - 1986),因单层感知机局限致神经网络寒冬,后反向传播算法终结寒冬。深度化积累期(1986 - 2011),卷积、强化学习等算法及深度学习概念出现。深度学习爆发期(2012 - 2020),AlexNet、GAN、Transformer等模型推动深度学习发展。大模型时代(2021 - 今),OpenAI等推出大模型,全球竞争格局形成,大模型轻量化受关注。总结指出其发展是循环演进史,需多方面协同,兼顾伦理安全。

[腾讯云开发者] AI WorkBuddy 架构师 信息整理

20年架构老兵的AI探索,让WorkBuddy帮你超越身边的人
20年架构老兵李伟山分享玩转WorkBuddy的经验
本文围绕20年架构老兵李伟山使用WorkBuddy的经验展开。2026年AI重塑架构师工作,信息整理等重复性工作成难题。李伟山用WorkBuddy10分钟产出17500字《Codex从入门到精通》教程,内容全面且有深度。还创建自动化任务,每日早8点自动推送AI早报,规则细致,质量稳定。他分享用好WorkBuddy的三条原则:知识库先行、用好专家模块、给AI立规矩。此外,他还重度使用Codex和Claude Code写代码,认为WorkBuddy能放大能力,助其成为「一人AI培训部门」。

[硅星人Pro] AI应用 创意生产 商业化 演语科技

Liblib 的 3 亿美元融资:是一次 PMF、两次 PMF、三次 PMF
演语科技获近3亿美元B+轮融资,验证商业能力
过去两年AI应用层爆款频出,但单一产品成功难证公司商业能力。演语科技连续推出LiblibAI、星流、LibTV,展示了持续造血能力。其获近3亿美元B+轮融资,投后估值超20亿美元。截至2026年5月,ARR达3亿美元,较融资完成时增长近3倍。AI应用成功关键在于切中硬场景,演语科技各产品围绕AI创意生产,从吸引核心用户,到推进设计流程,再到切入视频生产,完成了产品成功的复制,此次融资是对其AI创意生产闭环的认可。

[追问nextquestion] 神经科学 人工智能 NeuroAI 目标函数对齐 课程学习

万字追问:AI 的尽头是神经科学?我们为什么要教人工智能学会“长大”?
安东尼·扎多尔教授与保罗探讨NeuroAI发展及相关问题
文章围绕NeuroAI展开探讨,对比大脑与人工智能,指出人工智能缺乏大脑的适应性。冷泉港实验室的安东尼·扎多尔教授与卡内基梅隆大学的保罗·米德布鲁克斯对话,分享对NeuroAI的看法。他起初对该术语不感兴趣,后因认识到神经回路功能的复杂性而转变。信息理论方法为理解神经回路提供框架,但传统麻醉动物实验有局限。现代深度学习和NeuroAI可能存在模型与现实混淆问题,人工智能应研究人类完成任务的方式。在目标函数对齐上,动物能平衡多重目标,而人工系统尚难实现。发育过程值得研究,基因压缩表示可提高迁移学习效果。机器人技术面临“模拟到现实”问题,课程学习或能提供方向。最后指出神经科学虽有局限,但可激发对智能的思考。

[美团技术团队] AIGC 海报生成 技术体系

美团海报生成 AIGC 技术创新与实践
美团智能创作团队发布海报生成AIGC技术体系并开源
美团智能创作团队构建了覆盖“能生成、能编辑、能评判”的完整海报生成技术体系。百万商家面临设计资源匮乏、时效性要求苛刻等困境,AIGC虽提供新思路,但高质量海报生成面临精准文字渲染等技术挑战。团队推出PosterCraft,摒弃模块化流水线,端到端统一优化文字、视觉与版式;PosterOmni单一模型覆盖六类设计任务;PosterReward是首个面向海报质量评估的奖励模型。三者形成技术闭环,相互支撑、持续进化,已全部开源并在多个业务场景落地。未来团队将探索更强可控性、更广场景覆盖等。

[十字路口Crossing] 设计 AI设计 设计智能体 产品原型

设计进入 Agent 时代:交付物不再是设计稿,而是产品原型
天工上线设计智能体,可将想法转化为可交互页面
文章指出未来设计交付物或变为产品原型。今年Anthropic发布Claude Design引发关注,Google Stitch也做了大版本更新。国内天工上线“天工设计智能体”,可将想法转化为可交互页面。“十字路口”团队测试发现,它适合从零搭建APP UI原型或从PRD生成网站页面。通过两个案例展示其能力,如生成“AI怪谈时报”APP UI原型和“苹果神奇麦克风”网站。当前Claude Design等产品缩短想法到产品的距离,改变产品创造方式,设计稿渐成中间产物,产品原型成交付物。专业价值在于降低做原型成本、遵循设计规范,关键是提升判断力,不过专业技能仍需把关。

[深思圈] 设计向AI 天工设计智能体 生成式设计

Claude Design 用不了的那几个月,有人把这套能力悄悄搬到了国内,还更强了
天工上线设计智能体,对标海外产品并具多项优势
6月15日,天工设计智能体在tiangong.cn全面上线,对标海外Claude Design,将想法变原型能力引入国内,并结合中文内容等。它并非单纯AI作图工具,而是工作区,面向有想法但缺技术的人群,解决从想法到原型的难题。其优势在于可长期维护项目,能一套生成多页面,共享设计规范,还能将文字资产转UI项目。此外,它支持多风格切换、深度编辑、添加动效,可截图标注学习设计语言,打通天工原有能力,实现从想法到落地的完整链路,拉近文字与产品距离,让更多人参与审美判断。

[极思TopMinds] AI助手 市场份额 商业化 人格化 品牌信任

深度|ChatGPT份额跌破50%:AI助手行业进入“后独占”时代
2026年ChatGPT份额跌破50%,AI助手行业竞争加剧
截至2026年5月,ChatGPT全球市场份额跌至46.4%,首次跌破50%。如今AI助手成互联网基础设施,用户迁移意愿变强,如写代码用Claude、查资料用Gemini等。Gemini靠生态碾压,Claude靠口碑积累。2026年上半年全球AI应用下载量接近23亿次,应用内支出超42亿美元,增速放缓,厂商需将流量变现。美国用户愿为高级功能付费,ChatGPT开始用广告变现。用户与AI交互从工具使用过渡到关系建立,品牌信任成竞争关键,用户对AI评判标准升级。AI行业愈发成熟,后来者机会在分散场景。

[谷歌开发者] 大模型 Gemma 4 量化感知训练 移动端优化

Gemma 4 QAT 模型现已推出: 支持日常端侧设备与消费级 GPU 本地流畅运行
Google DeepMind发布Gemma 4 QAT模型支持本地流畅运行
Google DeepMind发布经量化感知训练(QAT)优化的Gemma 4 QAT模型。此前已引入多Token预测加速推理,发布Gemma 4 12B模型。QAT在训练中模拟量化,减少模型压缩时精度和质量损失,此次发布包含主流Q4_0量化格式及移动端定制格式,将Gemma 4 E2B内存占用降至1GB。还为移动端设计定制量化方案,包括静态激活、逐通道量化等。用户可在Hugging Face获取模型权重,通过多种工具在桌面端、设备端运行,还能按需部署模态优化内存。

[Kimi智能助手] 大模型 Kimi Work 目标模式 插件中心

Kimi Work 上新:目标模式、插件中心和 6 月限时福利
Kimi Work升级推目标模式和插件中心,6月享5折福利
6月3日上线的Kimi Work(Beta版)保持高速迭代,提升用户体验。此次Kimi电脑客户端升级,带来两个新特性。一是“目标模式”,有循环机制,人类设定目标后,Agent自主推进,人可随时干预,适合长任务,如整理论文成知识库;二是“插件中心”,除内置专业数据库插件,还可选用办公协作、设计、笔记等类插件,操控常用办公软件。同时,6月有专属福利,Kimi电脑客户端Work模式任务额度消耗打“5折”,规则见指定链接。用户可访问指定网址下载安装,支持Mac和Windows电脑。

[知危] 大模型 GLM - 5.2 Coding Agent 模型测评

实测GLM-5.2 :你别说,他还真能跟Claude干一下
文章实测GLM - 5.2并与Claude Opus 4.8对比表现
6月中旬上线并开源的GLM-5.2口碑好、抢用资格难。文章对其进行测试,先开展基础能力测试,GLM 5.2基本能完成2048、PVZ等小游戏开发,开发网页版Excel功能完成度高,但耗时久。接着在近生产环境的LuckySheet中对比Claude Opus 4.8和GLM 5.2表现,在加工作表防删除、扩展工作簿统一权限管理、增加工作簿权限定义等方面两者各有优劣,在实现“用户 - 角色 - 权限”体系时,Claude Opus 4.8在业务理解和逻辑处理上更胜一筹。Token用量上,GLM - 5.2比Claude Opus 4.8少。总体而言,GLM - 5.2工程实现能力强,有大型代码库理解和一次性开发成功率优势,作为开源模型有高使用价值,但存在耗时问题,若解决算力问题竞争力将提升。

[极思TopMinds] 大模型 Transformer架构 AI人才流动

速递|Transformer 之父出走谷歌,Gemini 联席负责人正式加盟 OpenAI
Transformer之父Noam Shazeer离开谷歌加盟OpenAI
2026年6月18日,Transformer之父Noam Shazeer离开谷歌加盟OpenAI。他是奠定大模型底层架构论文的核心作者之一,谷歌曾花27亿美元请他联合执掌Gemini技术路线。此次跳槽带来三个信号:一是后Transformer架构竞争加速,他将开发OpenAI下一代AI架构;二是开启“反向挖角”时代,大巨头间开始互相挖人;三是加剧谷歌与OpenAI军备竞赛,他的离开对Gemini打击大,也动摇谷歌人才吸引逻辑。架构革命不会一夜之间发生,他更可能是“架构探索加速器”。

[Datawhale] 大模型 GLM - 5.2 1M上下文 长程任务

GLM-5.2 + Claude Code实测!1M 上下文用法来了
作者分享GLM - 5.2 1M上下文用法及长程任务实测
智谱上线并开源GLM - 5.2,主打Coding和长程任务,官方数据亮眼。作者分享使用GLM - 5.2 1M上下文的方法:先在Claude Code里花两分钟开启1M上下文模式,配置时后缀[1m]要注意;实测有三条经验,包括给模型固定锚点、按需开启1M、将长任务分段设检查点。还展示两个长程任务实测,小任务给学习库补资料,大任务重排知识库,GLM - 5.2表现出色。官方案例显示其能力边界宽,但也有短板,如超长任务比Opus 4.8低13%。GLM - 5.2全量开放、MIT开源,文末有教程。

[GSYTech] AI 蒸馏 数据策略 中国AI实验室

关于中国 AI 蒸馏问题,前 GitHub 国际化负责人走访中国 AI 实验室
前GitHub负责人走访中国AI实验室解读蒸馏问题
前GitHub国际化负责人Kevin发长文讨论AI“蒸馏”问题,他带队走访国内多家AI实验室后解读:蒸馏本质是“数据策略”,目的是获取高质量后训练数据。国内AI实验室分独立和大厂系,前者缺数据依赖蒸馏,后者依赖度低。很多人认为人口多就有数据优势是误解,国内缺成熟商业数据产业。封锁政策效果有限,无法阻挡国内AI进展。“黑盒蒸馏”是高效知识转移方式。他还发现国内实验室核心力量多是年轻实习生,美国限制难改中国AI长期发展势头。

[十字路口Crossing] AI 世界模型 JEPA VLA 机器人控制

图灵奖得主押上 10 亿美元的「世界模型」,是AI 的下一个十年?(下)
图灵奖得主 LeCun 押注 10 亿美元探索 JEPA 世界模型
本文围绕图灵奖得主 Yann LeCun 押注 10 亿美元的世界模型展开。LeCun 认为 VLA 必死,JEPA 路线会超越它。节目先探讨了 VLA 模型,其虽能打造惊艳机器人,但 LeCun 指出它有行为克隆难扩展、缺乏明确规划的问题。接着分析了 JEPA 替代技术栈:在视觉编码器层,对比 CLIP 和 V - JEPA 2,V - JEPA 2 不依赖语言,在视频理解基准达 SOTA;VL - JEPA 把 VLM 改造成 JEPA 架构,学习效率更高;在机器人层面,VLA 靠行为克隆,泛化能力有限且规划不明确,而 LeCun 用 JEPA 搭建世界模型,在 push - T 任务中可显式规划动作,但目前性能落后于 VLA。LeCun 提出用分层模型解决短板,未来 AMI Labs 想控制复杂系统积累经验,目标成为智能系统主要供应商。

工程效率 & 工具链

[Datawhale] 编程工具 Codex 开源模型接入

刚刚,Codex负责人官方发声:Codex原生支持其他模型!
OpenAI Codex负责人官宣支持搭配开源模型并给出接入教程
OpenAI Codex负责人Tibo称,Codex App、CLI和SDK从2026年2月起可搭配任何支持OpenAI Responses API的开源模型。阶跃星辰平台上线该API支持,step-3.7-flash为首个接入模型。文章介绍接入步骤:先在~/.codex/目录下找到配置文件,将阶跃API Key写入auth.json,配置config.toml,验证接入。还给出用Codex review代码的实战案例,如使用codex review --uncommitted等命令。

[搜狐技术产品] AI工具 Codex 代码开发技巧

跟大家说下我最近在用的 10 个 Codex 小技巧
cxuan 分享 10 个 Codex 使用技巧以减少返工
作者 cxuan 分享 10 个使用 Codex 的技巧以减少返工。计划方面,用 /plan 用于跨文件或需求不明场景,明确修改范围、验证方法等; /goal 用于长任务,设定完成标准并定期复盘。权限方面,按任务切权限,通过 AGENTS.md 写规则,hooks 做校验。审查方面,用 /diff 检查改动方向,/review 结合行内评论审查真实风险。前端任务使用 in - app browser 明确验收对象。拆分会话用 worktrees 和 subagents 避免会话上下文过载。重复动作通过 Skills 解决流程重复,MCP 解决外部上下文问题。强调把 Codex 当脑机接口,明确标准让其更好执行。