Signal #17:Agent 开始进入组织系统
Agent 正在从工具入口,变成组织系统里的行动者。
当 Agent 只是帮开发者补一段代码、解释一个问题时,它更像一个助手。但当它开始访问 GitHub、Slack、Linear、云端环境和企业知识库,开始提交 PR、触发流程、调用工具、消耗预算、留下产物时,它就不能再只是一个 prompt 驱动的工具。
这周多个产品变化都指向同一个方向:Agent 开始进入组织已有的权限、凭证、审批、日志、成本和责任体系。它以谁的身份访问系统?能拿到什么凭证?哪些动作需要人确认?执行过程如何记录?产物最后算谁的?运行成本归到哪里?
这些问题听起来不像模型能力,但会决定 Agent 能不能真正进入真实研发组织。
过去一段时间,AI Coding 的重点是让 Agent 能完成任务;接下来,更关键的是让 Agent 能被组织稳定地使用和管理。Agent 越能行动,越需要边界。AI Coding 的下一阶段,不只是更强的 Agent,而是能被授权、被审计、被归因、被纳入工作流的 Agent。

AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
阿里云分享Kafka×Table Bucket零ETL入湖架构方案
文章围绕AI时代流数据入湖架构减法展开。AI时代企业需兼具实时消费、历史沉淀与多引擎复用的数据底座,Kafka、Iceberg与对象存储组合成重要方向,但传统ETL方式有链路长等问题。实时入湖呈现开放格式优先、零ETL诉求等趋势,Kafka入湖分原生集成、Connector/ETL、生态平台三大阵营。‘零ETL’减掉额外数据搬运链路等,Kafka×Table Bucket零ETL入湖路径分三层,消息入湖经记录转换、Schema感知与演进、Iceberg写入与事务提交三阶段,具备稳定性、一致性与可治理性等关键能力。该架构融合协议与格式,成本低、稳定性强、场景覆盖能力完整。实时日志分析、数据库变更实时入湖等四类场景优先受益。‘零ETL’收敛通用入湖能力,减少系统复杂性,未来将朝三方向演进,阿里云ApsaraMQ for Kafka×OSS Tables已实现该能力并开启邀测。

更可靠的主播助理:淘宝主播Agent的Harness工程实战
淘宝分享主播Agent的Harness工程实战经验
本文围绕淘宝主播Agent的Harness工程实战展开。首先阐述主播Agent需Harness的原因,因其应用场景比多数公开实践更苛刻。接着介绍Harness建设思想,包括基础定义、分层结构和工程载体,分层结构使业务方和框架层责任清晰,工程载体采用逻辑统一、物理分治模式。然后介绍八项实战,如上下文工程通过分层压缩、Reducer模式更新和大上下文卸载解决上下文问题;工具调用从能力边界、约束和错误恢复三方面强化;生命周期Hook在关键时机插入规则;沙箱执行防护隔离不可信代码;五层安全防护体系构建纵深防御;还有异常处理、DAG全局规划和评测体系。最后介绍Harness记忆,从与通用系统差异、三层记忆模型、记忆对账与信任度进化、多因子遗忘等方面提升主播记忆可靠性。

AI 不缺智商缺纪律:我的 Harness 工程化实践
作者分享Harness工程化实践及AI Coding流程框架
作者分享Harness工程化实践,指出AI Coding瓶颈从“模型能力”转向“流程工程”。harness是把“AI该怎么干活”固化的工程框架,能解决工序随机、上下文污染、坑反复踩等痛点。其采用三层加载模型,各层有不同作用和代价,贯穿19节点链、G1 - G8门禁和意图×风险动态裁剪。演进历经四个阶段,从拿来开源规范,到自建重prompt约束,再到减负分层加载,最终实现Agent调度编排。还构建了评测平台,从7个维度给harness执行打分,推动自进化闭环。最后作者坦诚系统存在不足,如产物质量判不了深度等,并提及业界前沿方向,强调该模式适用于过程可观测的AI工作流。

Spec 也会骗人:AI Coding 为什么一进真实仓库就翻车
文章借论文探讨AI Coding工程化进入真实仓库的难点与解决思路
文章借论文《Spec Kit Agents: Context-Grounded Agentic Workflows》探讨AI Coding工程化难点。AI Coding进入真实仓库易“上下文失明”,如引用不存在API、错判仓库结构等。“先明确规格,再推进实现”工作流虽重要,但Spec本身可能有误。AI Coding失败常因读错仓库,错误会被流程放大。Spec-Driven Development有价值,但需验证。论文提出在各阶段前后进行只读探测和验证,将AI Coding推进到生成能被仓库承认的方案。未来AI Coding竞争关键在于恢复真实仓库上下文、绑定需求等到仓库事实、阶段发现偏差。AI研发自动化要将隐性判断环节显性化,AI Coding需打通需求、方案、任务、代码和验证闭环。

AI Agent 为什么看起来很忙,却做不好真实工作
上海交通大学等机构论文揭示AI Agent难胜任真实工作原因
文章围绕AI Agent在真实工作场景的表现展开。指出很多AI Agent虽忙碌,但难做好真实工作,因其难以理解工作空间。真实工作非单文件问答,是上下文恢复,核心是关系判断。上海交通大学等机构论文《Workspace - Bench 1.0》将Agent置于接近真实工作的环境评测,结果显示Agent在复杂任务等方面表现不佳。完成任务关键是理解文件关系,更多工具调用不代表可靠。对研发组织,真实上下文不止代码仓库。RAG正从检索片段向理解关系进化。AI Agent进入工作,需读懂工作空间。

端到端研发自动化,为什么不能只靠 Workflow 或 SDD
文章阐述端到端研发自动化不能仅依赖 Workflow 或 SDD
文章指出端到端研发自动化不能只靠 Workflow 或 SDD。AI Coding 正从单点生成走向系统化执行,有以规格为中心的工具链出现和 Coding Agent 长时运行两类信号。Workflow 让流程可见,SDD 让任务可表达,但二者只解决局部问题,无法形成完整闭环。端到端研发自动化还需研发运行承载能力,包括输入组织、任务表示、Agent 执行等六方面。落地可从把真实交付项做成可回放样本开始,形成最小闭环。Workflow 和 SDD 应融入更大运行系统,端到端研发自动化核心是面向真实研发现场的运行承载能力。

用 AI Skills 打通中间件迁移:定位服务从 Android 到鸿蒙的完整实践
淘天集团团队提出“AI+Skills”解决代码迁移问题
本文以 Android 到鸿蒙的定位服务迁移为案例,剖析 AI 辅助开发中通用智能与领域知识断层的矛盾,提出“AI+Skills”方案。该方案把隐性知识转化为 AI 可读的 Skills 文档,明确分工模型。实践表明,相比纯 AI 翻译和人工查源码,此模式将单服务迁移时间缩至 30 分钟且零编译错误,154 个服务迁移节省 25 小时。该模式适用于需领域知识的 AI 辅助开发场景,未来有望向知识图谱、主动建议、动态生成及组织级知识平台发展。

ICASSP 2026|Sparse-Up:高精三维几何生成技术与应用前沿
京东XR团队提出三维几何生成算法并在“妙搭”落地
AI生成技术向3D领域渗透,催生AI3D革命,市场发展迅猛。京东零售产研中心XR产品研发团队提出基于稀疏体素的高精度三维几何生成算法。当前AI3D生成技术有基于体素表征和基于点云和3DShape2VecSet两条路线。团队论文Sparse - Up被ICASSP 2026接收,提出表面锚定上采样和视域分区渲染优化。实验表明该方法提升纹理重建质量、生成效果佳、降低显存消耗。新算法在商品几何重建上性能跃升,已在京东“妙搭”产品落地,未来将持续创新提升AI3D生成精度。

Vibe Coding 很爽,但你的应用安全吗?
WeaveFox推出OAuth2服务解决Vibe Coding应用安全问题
Vibe Coding(氛围编程)爆火,歌手胡彦斌用其做出粉丝应用“彦火”,但该应用被爆存在严重安全漏洞,尤其登录与认证环节。AI 写登录逻辑易因只求“能跑通”、难搞定加密与校验、维护成本高而翻车。WeaveFox 提供 OAuth2 用户认证授权服务,可一键安全接入,实现“一次接入,无限升级”,还能数据脱敏。用户只需给 AI 发送“帮我加上 WeaveFox OAuth2 登录”提示词,就能自动接入认证体系体验一键安全登录。

从研发到数据复盘,AI正在改写游戏公司
游族网络引入AI Agent,全面推进业务流程智能化转型
文章以游族网络为例,介绍AI改写游戏公司的情况。游族为提升出海效率,自2023年起引入AI工具,2026年初全员使用Agent,成本公司买单,目前渗透率超75%。Agent在游族业务中应用于三场景:资讯上自动获取、汇总、分析信息;广告素材方面压缩创意到初稿周期,但投放仍需人工判断;运营数据复盘可让业务人员按需查数据。此外,游族将经验封装成Skill,腾讯云沉淀最佳实践进专家团。不过,Agent使用仍需人工验收,其价值在于进入公司高频耗时流程,改写工作方式。

制造业AI落地,海尔智家先做了一个企业Agent OS
海尔智家推出企业Agent OS,与腾讯云合作推动制造业AI落地
海尔智家以智小能为企业Agent OS,打通研产供销服,推动全员自建Agent。腾讯云提供模型、算力等支撑。制造业面临产品难契合用户需求问题,AI需嵌入业务流程。智小能让员工通过一个入口调用智能体,在多业务场景应用,提升研发、采购等环节效率。海尔智家推出“全民开发者”,员工可自建智能体和轻应用。腾讯云与海尔智家共创保障Agent安全运行,海尔智家还将AI能力向上下游开放,推动行业发展。

ICLR'26 Oral | 当 LLM Agent 在多轮推理中迷失时:T3 如何让强化学习重新学会主动推理
港中大等团队提出T3方法解决LLM agent推理训练问题
随着大语言模型走向真实环境交互,LLM agent需具备主动推理能力,但用强化学习训练时,随交互轮次增加,模型易偏离正确判断。香港中文大学等研究者提出论文,从belief tracking角度分析训练失败机制,提出T3方法。T3通过截断belief-trapped轨迹尾部,避免低信息量尾部污染前缀动作的advantage estimation。论文在多个主动推理任务上评测T3,结果显示其稳定提升性能、减少无效token,对不同RL算法有效,在OOD场景也表现良好,且较强模型收益更显著。该工作为多轮主动推理问题提供理论刻画,T3解决思路轻量,有较强可集成性。

飞连智能体:用 Agent 实现 Agent 办公安全
字节跳动飞连智能体助力企业办公安全运营
随着办公环境复杂化,企业面临 Agent 新风险与传统账号、权限风险。飞连办公安全智能体借助 AI 赋能,适配新办公安全环境。文章通过三个场景展示其作用:一是应对 Agent 使用恶意 Skill 致数据泄露风险,能快速判断、解释和推动处置;二是处理合法账号异常使用问题,从身份认证到可信分析,识别异常行为;三是解决权限长期累积的隐性越权风险,从访问控制升级到持续治理。多个飞连子智能体协同形成办公安全闭环,沉淀安全专家经验,助力企业高效应对风险。

一文搞懂Token经济学:同样额度多干3倍活,只需理解消耗机制
文章介绍AI编程Token经济学及成本降低策略
文章围绕Token经济学展开,旨在帮助读者理解Token消耗机制以降低成本。首先介绍Token概念及API调用结构,指出用户输入仅占小部分。接着阐述缓存机制,无缓存成本呈指数增长,KV缓存可节省成本且能覆盖更多对话,不过缓存只能从头匹配。还讲述四类配置加载机制,不同配置适合不同内容。Sub-Agent虽不能省Token,但可防主上下文膨胀。最后提出优化策略,配置侧要精简,对话侧要保护缓存减少无效Token,并纠正了常见误区。

B站特征选择算法LeAP:模型的“精准瘦身”实践
B站搜索团队发布特征选择算法LeAP实现降本增效
文章介绍B站搜索团队的特征选择算法LeAP。先指出现有特征选择方法在工业场景面临维度异构、稀疏特征、算力、掩码门控及超参调节等挑战。LeAP将特征打散做成端到端可学,采用自适应梯度去偏的正则稀疏。在模型特征拼接层后插入轻量级门控模块,通过算法在batch内对特征洗牌生成噪声,与原始特征融合,加入正则项约束。还提出基于特征打散差异的自适应正则化,解决异构与稀疏难题,使特征重要性两极分化。在公开数据集上表现达SOTA水平,已在B站多核心业务场景落地,能识别冗余特征,实现推理提效、降本增效,加速特征迭代。

面向Skills编程-淘宝企业购端对端研发提效实践
淘宝企业购团队实践“面向Skills编程”提效研发
文章围绕淘宝企业购端对端研发提效实践展开。提出“面向Skills编程”范式,将领域知识等封装为Skills单元,让AI写代码。核心理念是从“配置化编程”升级,解决传统范式重复编码问题。以企业购客户对接为实战,该业务面临对接高频、需求碎片化等痛点。团队历经五阶段探索:从对话驱动到Prompt模板,再到SDD、Skill沉淀,最终迈向云端集成。通过分层架构设计,将系统拆分为三层,减少适配层代码量。构建垂直领域Skill,解决接口提取、逻辑输出等问题,代码生成成功率从50%提至90%。还建设知识库,实现知识管理和分发。当前虽验证了链路,但仍有提升空间,未来将推进端到端研发闭环,重构研发范式。

小红书数据平台部 ICDE 2026 新成果:RedParrot 以语义缓存加速企业级自然语言数据分析
小红书数据平台部联合浙大发布RedParrot加速数据分析
小红书数据平台部联合浙江大学在ICDE 2026发表论文,提出面向企业级商业分析的RedParrot框架。该框架针对传统NL - to - DSL长链路工作流的问题,构建查询语义缓存,将其压缩为短链路生成流程。其核心贡献包括提出查询语义缓存框架、混合式查询骨架构建与实体无关表示学习方法、多源异构RAG增强的DSL生成机制。实验表明,在小红书真实业务数据集上,RedParrot平均实现3.6x推理加速,执行准确率提升8.26%;在开放NL - to - DSL基准上,整体准确率显著提升。此外,文章还介绍了框架各模块的设计与实验效果,以及小红书企业智能部的岗位招聘信息。

21年老牌企服公司的AI实验:让Agent跑一遍流程
司盟企服将 AI 应用写进规划并落地多流程提效
司盟企服是中港星集团旗下综合企服平台,2018 年起做数字化转型。2026 财年,司盟将 AI 应用写进年度规划,目标是各岗位在 AI 加持下增强、用 Agent 代理工作流程、改造现有流程。司盟总结出让 Agent 发挥作用的标准,即流程清晰、环节标准,据此找到了邮件分类、审计、全球公司注册审核等场景应用 Agent,效率大幅提升。袁林认为企业应用 AI 最大的坑是浅尝辄止,应持续使用,让 Agent 更贴合业务需求。司盟员工深度使用 AI,AI 未替代员工,而是让他们处理更需经验和判断的事。

当 Agent 自己做 SRE:详解 ArkClaw 自动化可观测体系的工程实践
火山引擎ArkClaw实践自动化可观测体系工程
文章介绍火山引擎ArkClaw自动化可观测体系工程实践。当前可观测体系缺工程化主线,存在观测对象不完整等五类问题。ArkClaw将体系划分为8个核心Skill模块,包括SLI建模、架构链路建模等。各模块有明确输入输出和规范,如SLI建模从多来源生成结构化SLI Spec,架构链路建模输出三类链路。文章还给出各模块实跑案例,最后阐述其核心价值,能跨语义对齐、跨系统编排、跨时间演进和跨组织复用,是稳定性工程智能化关键一步。

从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
得物用Hermes Agent重构数仓工作流并强调证据口径
文章介绍Hermes Agent重构得物数仓工作流。因埋点和指标需求分散信息拼接难,选择Hermes Agent,因其有分层持久记忆、技能自动沉淀等能力。它让流程可控,承担判断前工程化准备,把需求拆成可检查追踪之事。采用单Agent串流程、多能力模块沉淀复用能力,固化流程契约,模块可迁移到更多数据研发场景。总体工作流从对话变为可回放链路,将需求各环节串联。能力底座把规则、上下文和命令资产化,实现协作可见、明确事实源等。风险治理强调上线前需三类硬证据,过三道门。最后指出应跑实证据口径,为扩大使用打基础。

初探 AI-Infra 下的服务器固件安全实践
火山云与字节跳动团队分享AI服务器固件安全实践
随着AI - Infra升温,服务器固件安全问题严峻。文章先分析服务器业务特点,从整机视角进行威胁建模,指出需整机视角、重视BMC和BIOS边界、缩小信任锚点。火山引擎给出服务器安全最佳实践,包括构建安全架构(签名与密钥管理、安全启动、可信度量)和进行全生命周期管理(需求、设计、开发、测试、部署、漏洞管理)。以BMC固件漏洞修复为例,介绍修复难点、流程及成果,还提及短期演进(服务器BOM与资产监控、BMC固件Nday扫描工具BoardSentinel)和中长期目标,即形成体系化架构,实现默认安全能力。

提示词工程已死,Loop Engineering来了!
谷歌云AI总监提出Loop Engineering新协作模式
谷歌云AI总监Addy Osmani称Loop Engineering比写提示词难。Loop Engineering是将‘发现问题、执行、检查、记录、继续下一步’做成自动运转小系统,重点在‘闭环’。一个完整的loop要回答六个问题,包括启动、并行、知识、资料、验收、记忆方面。同时需注意其成本和边界,如token消耗大、不能担责等。代码是其最先爆发的领域,也适用于内容选题等重复、流程稳定且结果可检查的工作。未来人和AI协作会升级成闭环模式。

记录一次完整的vibe coding项目,花费8小时和30块钱的西瓜
作者用AI 8小时和124.8元完成研发排期工具开发
文章以研发排期工具开发为例,展现AI对软件工程的变革。作者用8小时和124.8元完成工具开发,具备智能排期等核心功能。对比传统开发,AI极大降低成本。同时分享用AI开发踩的坑,如单文件过大和登录无反应问题。最后指出AI使软件工程稀缺资源转变,未来管理重结果验收等,产品经理和开发者边界消失,应向‘问题解决者’方向发展。

GraphRAG还在持续进化,FlowRAG让证据链自己流起来
上海AI Lab与华东师大提出FlowRAG优化RAG检索
上海AI Lab和华东师大论文提出FlowRAG,是GraphRAG变体。传统RAG在多跳推理易出错,存在entity sparsity和noise propagation问题。FlowRAG核心设计分三步:建四层图,做双粒度实体激活,做频率感知加权流,旨在让证据连成可解释路径。实验显示,FlowRAG在四个数据集平均GPT - Acc达58.89%,平均Recall达92.90%,但平均Relevance为69.82%。其在效率上表现较好,消融实验表明两模块各解决不同问题,不过在专业领域使用需谨慎设计。

仿照大脑记忆机制,给 AI 装了一个海马体,拿到了 SOTA
支付宝体验技术部开源智能体记忆项目 Hebb Mind
支付宝体验技术部开源智能体记忆项目 Hebb Mind,它将大脑完整记忆环路引入工程。当前 AI 记忆常见做法有借助文件和 grep 检索、向量库 + 语义检索,但都缺乏大脑记忆的巩固、激活、遗忘环节。Hebb Mind 参考大脑记忆机制,实现编码、巩固、激活、遗忘四步。编码时新记忆存入工作记忆缓冲区;巩固通过后台任务重放记录给大模型;激活时三路同时召回;遗忘由使用频率等动态决定。其在 LongMemEval 和 LoCoMo 数据集表现出色,与其他记忆框架相比,本地优先、多智能体兼容。安装简单,可本地运行,还能接入 Claude Code 和 Codex,提供 WEB 控制台方便管理。

看完快手这场沙龙,我对生成式推荐的判断变了
快手在生成式推荐领域体系化演进并开放挑战赛
作者参加快手技术沙龙,其已走向“生成式推荐系统专场”。快手在生成式推荐领域体系化演进,从 OneRec 到 OneReason,从 OneSearch 到 OneSearch V2,还有 GR4AD、Pool - Rec 等。OneReason 让模型学会思考,解决传统推荐系统边界问题,在实验中效果良好;Pool - Rec 解决生成式推荐算力利用问题;OneSearch V2 用于搜索,GR4AD 针对广告,二者使生成式推荐进入业务主流程;LLM - Rec 挑战赛开放资源。快手在生成式推荐上形成持续演化路径。

Google I/O 2026:Android 17 MemoryLimiter 来了,你的 Bitmap 优化做好了吗?
Google I/O 2026介绍Android 17 MemoryLimiter及Bitmap优化策略
文章围绕Android 17的MemoryLimiter展开。它基于设备总RAM限制应用内存,超上限会静默终止进程,目的是防止内存泄漏影响多任务体验。Bitmap是内存占用大户,易触发限制。文中给出Bitmap优化策略,如缩放、裁剪、选择像素格式、用矢量图替代、复用等。还介绍Android Studio新工具,可检测重复Bitmap、集成LeakCanary排查泄漏、用ProfilingManager捕获线上事件。此外,提出onTrimMemory主动释放内存、R8优化字节码等策略,并给出行动清单。

Huolala Figma MCP 原理与实践
货拉拉发布Huolala Figma MCP服务转换设计稿为UI代码
文章介绍货拉拉自研的Huolala Figma MCP服务,可将Figma设计稿自动转为高还原度UI代码。先阐述背景,指出UI编程痛点及AI技术发展促使变革;分析现有方案不足,明确产品定位。接着说明原理,含MCP整体架构、功能、产物及Skills机制,还解析AI算法服务重点算法。实践部分对比同类方案,展示业务应用案例及多语言转码效果。最后总结成果,指出经验与不足并给出后续优化方向,如自动分析工程组件、界面自动定位等。

Android 17 正式版发布,全新 AI 和各种破坏性更新
Google发布Android 17正式版,带来多项更新及适配要求
Android 17正式版发布,是首个AI升级且隐私收紧的版本。对开发者而言,有App被AI Agent调用等诸多行为变化。更新重点是向“智能系统”转变,支持AppFunctions。官方明确adaptive - first开发标准,App要适配大屏。新增多任务形态,修改Activity处理配置变化方式,有Continue On跨设备任务接续功能。官方强调Compose - first。性能上,有内存限制、GC改进等变化;隐私安全方面,权限更细化;本地网络访问、SMS OTP保护等有新限制;还加入PQC能力,扩展动态代码保护等。官方提醒开发者尽快适配。

一句话搞定数据可视化,你需要这个 AntV 新成员
AntV 发布数据可视化创作平台 Sive
文章介绍了 AntV 出品的 AI Native 数据可视化创作平台 Sive。它能解决数据可视化的难题,面向不同用户有不同功能。对开发者,可答疑并生成可预览图表代码;对业务创作者,能一句话出应用;对数据分析用户,可解析数据结构并持续建设进阶分析能力。Sive 内置 10+ 公开数据源 Skill,支持联网搜索和自定义数据源;支持多种数据格式上传,采用严格私有数据隔离机制;内置 50+ 设计风格 Skill,可复刻网站视觉语言;沉淀多种社区可视化 Skills;还能一键复刻精品应用。未来,Sive 将持续迭代,如接入更多资源、深化 AI 分析能力、探索新调用形式等。

Kotlin 跨平台(KMP)在 iOS 端的实践与挑战
Kotlin跨平台KMP在iOS端实践遇挑战但仍适合生产
文章围绕Kotlin跨平台(KMP)在iOS端的实践与挑战展开。先介绍KMP已投入生产,其能降低开发成本,有质量提升、技术栈统一等优势,在安卓团队接受度高,近半数用户代码复用率超50%,99%用户对性能等方面满意。但iOS端使用KMP面临诸多难题,如调试难、Objective - C互操作性限制、部分iOS API不支持、原生依赖支持有限、并发模型复杂等。最后指出KMP适合投入生产,但使用时要谨慎,可先小模块试点、从共享组件入手,并关注版本兼容性。

KMP / CMP 鸿蒙版本 Beta 发布,他有什么特别之处?
华为发布 KMP/CMP 鸿蒙版本 Beta 适配有亮点
华为官方发布 KMP/CMP 鸿蒙适配版本 Beta。适配门槛高,需将鸿蒙作为 Kotlin/Native 新 Target 实现,代码核心实现和 UI 统一渲染分别来自腾讯 KuiklyBase 和 ovCompose。KMP 适配鸿蒙要在 KonanTarget.kt 新增 OHOS 平台,让 LLVM 后端产出二进制,工具链接通后有多种产物,还支持缓存和 DFX。CMP 在鸿蒙上有自渲染和统一渲染两条 Skia 绘制路线。目前鸿蒙社区版本继承了 KuiklyBase 和 ovCompose 实现,已合入 JetBrains 上游版本,也有算法调整。未来 KMP 和 CMP 在鸿蒙可能多分叉,开发者选择待明确。

一行代码没改,Xcode 27 帮你省掉了 ViewModel 的重复初始化开销
Xcode 27 改进 @State 底层,省掉 ViewModel 重复初始化开销
Xcode 27 beta 中,@State 从 property wrapper 变为 Swift macro,解决了 @Observable 用户的性能问题。以前父 View 重新evaluate,CounterView 的struct重建会让 CounterViewModel() 初始化逻辑多次运行,存在开销。Xcode 27 后,初始值表达式只在 View 首次插入 hierarchy 时求值一次,后续 View struct 重建不再触发 init()。不过,@State 的懒加载只对属性默认值生效,在 init() 里赋值不受影响,若 ViewModel 依赖父 View 参数,用 init() 赋值会有更新问题,应把初始化放属性默认值里,用 task(id:) 响应变化。

Android CLI 1.0 稳定版现已推出|随时随地实现高质量的 Android 开发
Google 推出 Android CLI 1.0 稳定版助力 Android 开发
本文介绍 Android CLI 1.0 稳定版推出。开发者选开发工具自由度高,Google 使命是确保高质量 Android 开发。在 2026 Google I/O 大会展示其新功能,已发布稳定版。Antigravity 可安装 Android 资源包获开发能力。新版引入 android studio 命令,智能体可利用 Android Studio 功能,还介绍相关命令。可通过多种包管理器安装,更新了安装路径。支持 Journeys,智能体可用其测试应用。还扩展 Android Skills 库,推出新 Skills,可通过命令添加到工作流。最后邀请开发者体验,关注相关资讯。

Kotlin inline:你以为它只是个性能优化?
文章系统介绍Kotlin inline关键字的特性及使用场景
文章围绕Kotlin的inline关键字展开。它用于优化接受lambda参数的高阶函数,减少运行时开销。编译器会将内联函数体替换到调用处,消除对象分配和虚方法调用。其好处有提升性能、支持非局部返回、保留运行时泛型类型信息。但它也有局限,如代码体积膨胀、不适合大型函数等。此外,还介绍了inline属性,可内联getter/setter,减少方法调用开销,适合简单逻辑属性。标准库中的repeat()等inline函数能接受挂起lambda,让挂起调用在协程中正常执行。

突破云原生网关局限:面向海量 AI 沙箱的 Web VNC 动态路由与会话保持深度实践
团队构建AI沙箱可观测基础设施,解决动态路由难题
文章围绕海量AI沙箱的Web VNC动态路由与会话保持展开。AI发展到自主智能体阶段,运行安全和可观测性成挑战。为解决运行安全问题,采用隔离沙箱;为实现可观测性,选用Web VNC技术。但系统规模扩大后,动态路由难题凸显。传统云原生网关处理复合会话有短板,如静态Upstream配置失效、基于源IP的会话保持脆弱、现代API网关插件有上下文缺失问题。团队重新设计架构,控制面由Sandbox Manager负责拓扑同步,数据面通过自研Lua脚本实现“首包驱动 + 状态寄存”决策树。在工程落地中,解决了阻塞、内存、连接池等问题。生产部署时遭遇多种故障并解决,还进行了生产级调优和安全防御,最终利用HTTP Cookie寄存会话状态,构建了支撑AI Agent观测需求的基础设施。

鸿蒙生态下广告统一跳转能力的探索与工程实践
团队完成鸿蒙生态下广告统一跳转能力三阶段实践
文章围绕鸿蒙生态下广告 SDK 统一跳转能力展开三阶段实践。因鸿蒙与 iOS/Android 架构差异,传统广告跳转方案无法复用。第一阶段基于 @ohos.router 实现 H5 落地页基础跳转,完成路由组件封装与 Web 页面权限适配,但面临 DeepLink 未支持和接口废弃风险;第二阶段因 @ohos.router 接口废弃,重构为 HMRouter 组件实现无界面依赖的页面跳转,保障了落地页跳转稳定性;第三阶段适配 DeepLink 直呼能力,通过 openLink 接口、页内拦截、白名单机制实现应用间安全跳转。最终形成标准化、可扩展方案,实现架构统一、能力闭环和可扩展性,提升了广告点击转化率,后续将拓展生态能力和优化用户体验。

Node.js Plus 来了!
colinhacks开发Nub为Node.js提供增强开发体验
尽管Bun和Deno发展良好,但多数团队因Node.js生态等因素难以更换。新开源工具Nub由colinhacks开发,定位是增强版Node.js,将分散工具能力整合。它不修改Node源码,在启动前布置运行环境,处理开发细节,提升工具链速度,最高快24倍。还收紧安全策略,与现有包管理器共存,为依赖Node的项目提供现实升级路线。

如何搭建一个端到端业务需求专家 Agent
作者分享搭建端到端业务需求专家 Agent 的实践经验
文章分享搭建端到端业务需求专家 Agent 的经验。指出代码外串联成本是瓶颈,要解决上下文组织、工具串联、反馈复利三个工程化问题。系统分四层架构,从输入到反馈形成闭环。纵向流程含需求进入、澄清、方案、实现、协同、验收、发布、结项等阶段,各阶段按需调用架构能力。当前存在接入成本高、缺度量体系等问题,后续规划从单 Agent 扩展到 Agent Team,共享长期 wiki 并各自维护视角。

装在内核里的透视镜:云监控 2.0不改一行代码实现全栈可观测
云监控2.0的OBI利用eBPF技术实现全栈可观测
文章介绍云监控2.0的OpenTelemetry eBPF Instrumentation(OBI)。云原生和微服务架构下,传统可观测性方案成本高,AI场景也需零代码方案。OBI利用Linux内核eBPF技术,不修改应用代码,自动拦截分析网络流量和GPU操作,生成标准遥测数据。其核心能力围绕应用、网络监控和日志增强三大支柱,支持多种协议。它有语言无关的网络级追踪和运行时特定的深度集成,能解决Go、Python等语言的调用关联问题,跨进程传播对非Go语言在内核态统一完成。OBI用户态是有向图,包括独立Agent、编排框架、节点通信队列等。还能追踪GPU操作,提供网络层观测和日志增强功能。通过云监控2.0可一键接入OBI,后续将补充更多能力。

后 Fable 5 时代,微软 CEO 抛“Token 资本论”:AI 越乱,你越贵!
微软CEO纳德拉针对Fable 5断供提出企业AI发展战略
Anthropic发布的前沿模型Fable 5因地缘政治出口管制全球断供,暴露企业依赖单一外部模型的风险。微软CEO萨蒂亚·纳德拉发表评论,指出企业应构建“解耦式”智能系统,打造人力资本与Token资本。他认为企业未来需构建两种核心资产,构建学习闭环,将业务流程等转化为AI系统,打造“前沿生态”,避免少数模型垄断红利,让价值回流到各企业和行业。

Prompt该退环境了,未来属于Loop Engineering。
OpenClaw、Claude Code等推动Loop Engineering概念诞生
本文介绍AI领域新出现的Loop Engineering概念。6月7日OpenClaw创始人Peter、Claude Code创始人Boris提出相关观点,后Google的Addy Osmani梳理出该概念。Loop Engineering是在Harness Engineering基础上的进化,能实现自动化流程。一个完整的loop由定时任务、工作树隔离、项目知识体系、连接器、子Agent五个组件构成。其核心是定义目标的能力,目标定义好坏影响工具使用效果。同时指出管理AI Agent和管人逻辑相似,但对管理能力要求更高,还存在古德哈特定律陷阱,需结合Harness Engineering。最后给出目标定义框架,并回顾从Prompt到Loop的四次跃迁。

终于吃上了国产模型的细粮,最新 glm 5.2 成国区 Opus
作者用智谱GLM 5.2实现CatReader移动版并优化
作者分享生活时提到GLM 5.2发布。作者此前用GLM 5.1写东西,认为购买原厂纯血订阅计划最合适,GLM 5.1国内订阅被黄牛抢,作者选海外版。GLM 5.2面向“复杂系统工程”和“长周期智能体”,实现1M超长上下文。作者用其两小时实现CatReader移动微信版,完成后做验证并提交到生产环境。周日重度使用发现问题,与GLM 5.2优化,遇bug切到Codex协助解决。GLM 5.2全面支持1M Tokens上下文,思维链设计更贴合软件工程需求。海外版在国内使用畅通,智谱5.2发布后股价回升。

RenalCLIP:从“通用”转向“专病”,让医疗 AI 更懂肾癌诊疗
微软亚洲研究院等团队发布肾癌诊疗模型RenalCLIP
微软亚洲研究院联合多团队开展多中心研究,在Nature Communications发表多模态基础模型RenalCLIP。该模型聚焦肾癌精准诊疗,基于4家医疗中心6867名患者的CT影像及报告预训练,采用两阶段预训练策略,学会识别与肿瘤性质等相关特征。在系统评估中,它展现卓越临床价值,跨中心泛化能力强,还能预测生存期。此外,RenalCLIP仅用少量微调数据就达通用全量数据训练效果,有较强零样本泛化能力。其成功表明医疗基础模型正从‘更大更广’走向‘更深更专’。

进球、切片、全网爆:如何打造一座跑赢热搜的赛事“AI 短视频工厂”?
火山引擎推出赛事AI短视频工厂及实战指南
赛事流量争夺不仅在直播间,赛后短视频分发也关键。传统人工剪辑难跑赢热搜,易漏‘次高光’。火山引擎AI MediaKit将发现高光、快速切片、批量生成融入直播流实时处理链路。它综合多模态模型能力,支持90+语种,准召率超80%,支持直播和点播处理,其高光片段提取工具能输出结构化数据。火山引擎视频云将多能力串联成自动化生产线,还推出《大型赛事直播与互动实战指南》助赛事运营方抢占流量。

6 倍速!Kimi K2.7 Code 高速版已上线
Kimi发布K2.7 Code高速版,提升编程体验并开展充赠活动
Kimi K2.7 Code高速版已上线,输出速度约为普通版5 - 6倍,常规编程场景下输出约180 Token/s,短上下文场景可达260 Token/s。其API定价为普通版2倍,企业和开发者可通过Kimi API开放平台调用。Kimi Code Plan同步上线,用户可加入「抢先体验计划」体验。预计7月起陆续开放给Allegretto及以上会员,高速版在Kimi Code Plan中用量消耗是普通版3倍。使用须打开思考模式。为庆祝模型发布,API开放平台开启三周充赠活动。相比K2.6,K2.7 Code在长上下文编程场景等方面性能提升,基准测试表现更好,普通版定价与K2.6基本一致,非编程任务推荐K2.6。

Gemma 4 12B 开发者指南|借助无编码器架构轻松构建本地多模态智能体
谷歌推出Gemma 4 12B多模态模型及开发集成方案
谷歌推出Gemma 4 12B多模态模型,采用无编码器架构,降低多模态交互延迟。它是首款支持音频输入的中型模型,体量轻巧,可在笔记本本地运行。架构上,用单一Decoder - only Transformer架构,含视觉嵌入器和音频波形投影,且统一微调优势明显。该模型能力优异,如构建本地图像处理应用、处理含音频视频。还推出由LiteRT - LM驱动的设备端开发者集成方案,包括MacOS应用和本地API服务器。用户可通过多种方式体验,如在相关应用中尝试、下载模型权重等。

我们开源了 MiniMax M3
MiniMax 开源 MiniMax M3 模型权重并发布 MSA 论文
上周五,MiniMax 开源了 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型,总参数 428B,激活参数 23B,从 Step 0 开始做多模态混合训练,训练时融合不同模态语义空间。发布两周,M3 在综合智能指数排行榜获全球开源模型最高排名,收到大量实测反馈,获多位行业人士积极评价。针对访问量激增问题,M3 输出速度已提升,Token Plan 后台上线调用量看板。后续迭代将坚守普惠初心,更加开放、加速进步。文章还给出开源地址和 MSA 论文地址。

读完Agent Loop工程手册,我有8个还没想明白的问题
作者读Agent Loop手册后提出8个待解问题并分享SELF方案
文章围绕Agent Loop工程手册展开,先介绍其核心主张,将使用AI从手动挡升级为自动驾驶,拆解成Automations等零件,还阐述4个设计法。作者读完手册后,从心态、失败处理等4方面改变工作方式,重新定位了手上的SELF Protocol。接着提出8个未解决的问题,如软目标停止条件、子代理验收、护栏分层等。最后介绍SELF Protocol细节,包括设计目标、模块、数据和安全承诺,目的是征集这8个问题的解决方案。

对话 MiniMax 闫俊杰:M3、10X 计划、10T 模型、和智能的终局
MiniMax团队在Dev Meetup探讨模型发展及AI应用方向
本文是MiniMax Dev Meetup圆桌讨论实录。MiniMax创始人闫俊杰表示活动要持续开展,传播AI Coding火种。从M1到M3,模型通用消耗量进步大,但能力上多模态等未达预期。Multica张佳圆提出聚合不同模型解决单一模型缺陷;DeerFlow何涛介绍开源项目,其已成社区;金融公司虞扬称AI应降低专业理解门槛。闫俊杰认为模型与Agent相互拉动,训练10T模型需时间和积累,数据是挑战。在AI Coding方面,要明确不做什么,回归工程底线。MiniMax启动“10x”项目,与专家合作。嘉宾还分享2026下半年关注方向,如陪伴价值、利用AI改善生活等。最后回应观众关于M3优化、模型计划等问题。

Sam Altman斯坦福最新对话:深度展望AGI和未来的一切
Sam Altman在斯坦福访谈展望AGI和未来发展
本文是Sam Altman在斯坦福大学的访谈内容。他结合OpenAI成长历程,探讨AI时代初创公司逻辑变化。指出廉价token取代人力成核心生产力,创业者应找自动化前不可能的机会。规模会带来涌现效应,如Y Combinator扩大资助产生网络效应。揭秘ChatGPT从研究演示成爆款产品的过程。他还提出智能将成公用事业,商业重心转向推理服务。面对AI对教育冲击,强调培养‘如何思考’的元技能。最后描绘未来十年分歧,包括技术权力走向民主化还是垄断,以及计算资源分配正义问题。

Redis 作者反驳「中国模型之所以强,是因为通过 API 蒸馏了美国模型」
Redis作者反驳中国模型靠API蒸馏美国模型说法
Redis作者antirez反驳‘中国模型强是因API蒸馏美国模型’言论。他指出,API白盒蒸馏在机器学习原理上不成立,因商业API仅返回最终文本,无法获取内部信息;黑盒蒸馏虽可行,但作用有限,难以创造强大通用能力。他认为中国模型落后主因是算力获取限制,而非技术抄袭或蒸馏。此外,文中介绍了硬蒸馏和软蒸馏的区别,指出大众常混淆二者,而中国模型进步源于自身算力投入、数据工程和研究工作。

APMPlus・看得见的 Agent(二) | 从养虾到赛马:Agent 到底在偷偷干什么?
APMPlus发布Hermes Plugin助力Hermes Agent可观测
文章围绕APMPlus Hermes Plugin展开,将OpenClaw比作“养虾”,Hermes比作“赛马”,该插件能让Hermes Agent执行不再是黑盒。它把对话、调用等接入APMPlus,可观测相关指标,还提供预置报警规则。接入后能组合Trace、Metrics等能力,解决常见排障问题,如判断慢的原因、定位Token消耗问题等。最后介绍了一键接入步骤,强调可观测性对AI Agent在生产环境是刚需,后续APMPlus会持续拓展。

OpenRouter Fusion:从模型路由到复合智能栈
OpenRouter 发布 Fusion 开启多模型编排的复合智能时代
文章介绍 OpenRouter Fusion,它是多模型合议 API 原语,标志 LLM 应用架构进入复合推理编排阶段。其核心价值是以推理时计算换取高质量、高覆盖率和强分歧诊断能力,适合高价值、低频、容错成本高的任务。Fusion 工作流按需触发,有工程级容错。官方 DRACO 评分显示多模型面板表现优,但结果需理性看待。其成本高、延迟高,思想源于 MoA 且更克制。Fusion 的 judge 需约束,还存在数据治理问题。它适合开放式、跨领域任务,不适合简单问答等。未来复合智能栈将从固定面板走向动态面板等五个方向演进,AI 竞争将转向智能系统工程能力竞争。

速递|600亿美元全股票交易!马斯克刚刚把Cursor收入囊中
马斯克旗下SpaceX 600亿美元全股票收购Cursor
2026年6月16日,SpaceX向美国SEC提交文件,确认与Cursor开发商Anysphere签署合并协议,以600亿美元全股票交易收购,预计三季度完成。此前Cursor已与SpaceX合作训练模型,SpaceX早有收购选择权。收购Cursor对马斯克意义重大,xAI有模型和算力,Cursor掌握开发者入口和企业软件工作流,三者结合可切入代码生产场景。拿下Cursor让马斯克获得企业AI市场入场券,未来Cursor或集成xAI模型能力。交易待监管审批,马斯克不断寻找变革性技术入口,Cursor可能不是最后一个目标。

AI音乐混战,谁能成为“中国版Suno”?
国内多玩家入局AI音乐混战,与Suno仍有差距
2026年6月初,Suno完成4亿美元D轮融资,虽深陷版权诉讼,但资本市场看好AI音乐赛道。国内字节跳动、腾讯音乐等纷纷入场,形成三类玩家格局。第一类背靠大厂,将AI音乐作为引流产品;第二类大模型厂商,将其作为商业化手段;第三类垂直创业公司,押注差异化路线。测评显示,国产产品各有优劣,但与Suno有差距。国内AI音乐平台面临版权、付费、出海三道坎,中国音乐市场特殊性或改变其发展形态。

Tuanjie AI Day-0 接入 GLM-5.2 Max
Tuanjie AI Day - 0接入GLM - 5.2 Max并开启公测
Tuanjie AI自Day - 0全面接入GLM - 5.2 Max。它面向Unity/团结引擎,能在真实游戏工程中完成代码理解等工作,目前公测已开启,公测期有免费额度。GLM一直是Tuanjie AI主力Coding模型,此次接入延续‘发布即接入’节奏,让开发者能及时体验GLM - 5.2 Max更强能力,该模型在Code Arena评估平台成绩优异。还介绍了在游戏工程中使用GLM - 5.2 Max的三步方法,鼓励开发者下载试用并反馈建议。

从神经元到大语言模型,回顾机器学习发展史
文章回顾从神经元到大语言模型的机器学习发展史
文章回顾机器学习发展史。先介绍人工智能定义、流派,引出机器学习。理论萌芽期(1943 - 1969),提出M - P神经元、图灵测试,举办达特茅斯会议定义人工智能,出现首个可学习神经网络模型,机器学习成独立领域。寒冬与破冰期(1969 - 1986),因单层感知机局限致神经网络寒冬,后反向传播算法终结寒冬。深度化积累期(1986 - 2011),卷积、强化学习等算法及深度学习概念出现。深度学习爆发期(2012 - 2020),AlexNet、GAN、Transformer等模型推动深度学习发展。大模型时代(2021 - 今),OpenAI等推出大模型,全球竞争格局形成,大模型轻量化受关注。总结指出其发展是循环演进史,需多方面协同,兼顾伦理安全。

20年架构老兵的AI探索,让WorkBuddy帮你超越身边的人
20年架构老兵李伟山分享玩转WorkBuddy的经验
本文围绕20年架构老兵李伟山使用WorkBuddy的经验展开。2026年AI重塑架构师工作,信息整理等重复性工作成难题。李伟山用WorkBuddy10分钟产出17500字《Codex从入门到精通》教程,内容全面且有深度。还创建自动化任务,每日早8点自动推送AI早报,规则细致,质量稳定。他分享用好WorkBuddy的三条原则:知识库先行、用好专家模块、给AI立规矩。此外,他还重度使用Codex和Claude Code写代码,认为WorkBuddy能放大能力,助其成为「一人AI培训部门」。

Liblib 的 3 亿美元融资:是一次 PMF、两次 PMF、三次 PMF
演语科技获近3亿美元B+轮融资,验证商业能力
过去两年AI应用层爆款频出,但单一产品成功难证公司商业能力。演语科技连续推出LiblibAI、星流、LibTV,展示了持续造血能力。其获近3亿美元B+轮融资,投后估值超20亿美元。截至2026年5月,ARR达3亿美元,较融资完成时增长近3倍。AI应用成功关键在于切中硬场景,演语科技各产品围绕AI创意生产,从吸引核心用户,到推进设计流程,再到切入视频生产,完成了产品成功的复制,此次融资是对其AI创意生产闭环的认可。

万字追问:AI 的尽头是神经科学?我们为什么要教人工智能学会“长大”?
安东尼·扎多尔教授与保罗探讨NeuroAI发展及相关问题
文章围绕NeuroAI展开探讨,对比大脑与人工智能,指出人工智能缺乏大脑的适应性。冷泉港实验室的安东尼·扎多尔教授与卡内基梅隆大学的保罗·米德布鲁克斯对话,分享对NeuroAI的看法。他起初对该术语不感兴趣,后因认识到神经回路功能的复杂性而转变。信息理论方法为理解神经回路提供框架,但传统麻醉动物实验有局限。现代深度学习和NeuroAI可能存在模型与现实混淆问题,人工智能应研究人类完成任务的方式。在目标函数对齐上,动物能平衡多重目标,而人工系统尚难实现。发育过程值得研究,基因压缩表示可提高迁移学习效果。机器人技术面临“模拟到现实”问题,课程学习或能提供方向。最后指出神经科学虽有局限,但可激发对智能的思考。

美团海报生成 AIGC 技术创新与实践
美团智能创作团队发布海报生成AIGC技术体系并开源
美团智能创作团队构建了覆盖“能生成、能编辑、能评判”的完整海报生成技术体系。百万商家面临设计资源匮乏、时效性要求苛刻等困境,AIGC虽提供新思路,但高质量海报生成面临精准文字渲染等技术挑战。团队推出PosterCraft,摒弃模块化流水线,端到端统一优化文字、视觉与版式;PosterOmni单一模型覆盖六类设计任务;PosterReward是首个面向海报质量评估的奖励模型。三者形成技术闭环,相互支撑、持续进化,已全部开源并在多个业务场景落地。未来团队将探索更强可控性、更广场景覆盖等。

设计进入 Agent 时代:交付物不再是设计稿,而是产品原型
天工上线设计智能体,可将想法转化为可交互页面
文章指出未来设计交付物或变为产品原型。今年Anthropic发布Claude Design引发关注,Google Stitch也做了大版本更新。国内天工上线“天工设计智能体”,可将想法转化为可交互页面。“十字路口”团队测试发现,它适合从零搭建APP UI原型或从PRD生成网站页面。通过两个案例展示其能力,如生成“AI怪谈时报”APP UI原型和“苹果神奇麦克风”网站。当前Claude Design等产品缩短想法到产品的距离,改变产品创造方式,设计稿渐成中间产物,产品原型成交付物。专业价值在于降低做原型成本、遵循设计规范,关键是提升判断力,不过专业技能仍需把关。

Claude Design 用不了的那几个月,有人把这套能力悄悄搬到了国内,还更强了
天工上线设计智能体,对标海外产品并具多项优势
6月15日,天工设计智能体在tiangong.cn全面上线,对标海外Claude Design,将想法变原型能力引入国内,并结合中文内容等。它并非单纯AI作图工具,而是工作区,面向有想法但缺技术的人群,解决从想法到原型的难题。其优势在于可长期维护项目,能一套生成多页面,共享设计规范,还能将文字资产转UI项目。此外,它支持多风格切换、深度编辑、添加动效,可截图标注学习设计语言,打通天工原有能力,实现从想法到落地的完整链路,拉近文字与产品距离,让更多人参与审美判断。

深度|ChatGPT份额跌破50%:AI助手行业进入“后独占”时代
2026年ChatGPT份额跌破50%,AI助手行业竞争加剧
截至2026年5月,ChatGPT全球市场份额跌至46.4%,首次跌破50%。如今AI助手成互联网基础设施,用户迁移意愿变强,如写代码用Claude、查资料用Gemini等。Gemini靠生态碾压,Claude靠口碑积累。2026年上半年全球AI应用下载量接近23亿次,应用内支出超42亿美元,增速放缓,厂商需将流量变现。美国用户愿为高级功能付费,ChatGPT开始用广告变现。用户与AI交互从工具使用过渡到关系建立,品牌信任成竞争关键,用户对AI评判标准升级。AI行业愈发成熟,后来者机会在分散场景。

Gemma 4 QAT 模型现已推出: 支持日常端侧设备与消费级 GPU 本地流畅运行
Google DeepMind发布Gemma 4 QAT模型支持本地流畅运行
Google DeepMind发布经量化感知训练(QAT)优化的Gemma 4 QAT模型。此前已引入多Token预测加速推理,发布Gemma 4 12B模型。QAT在训练中模拟量化,减少模型压缩时精度和质量损失,此次发布包含主流Q4_0量化格式及移动端定制格式,将Gemma 4 E2B内存占用降至1GB。还为移动端设计定制量化方案,包括静态激活、逐通道量化等。用户可在Hugging Face获取模型权重,通过多种工具在桌面端、设备端运行,还能按需部署模态优化内存。

Kimi Work 上新:目标模式、插件中心和 6 月限时福利
Kimi Work升级推目标模式和插件中心,6月享5折福利
6月3日上线的Kimi Work(Beta版)保持高速迭代,提升用户体验。此次Kimi电脑客户端升级,带来两个新特性。一是“目标模式”,有循环机制,人类设定目标后,Agent自主推进,人可随时干预,适合长任务,如整理论文成知识库;二是“插件中心”,除内置专业数据库插件,还可选用办公协作、设计、笔记等类插件,操控常用办公软件。同时,6月有专属福利,Kimi电脑客户端Work模式任务额度消耗打“5折”,规则见指定链接。用户可访问指定网址下载安装,支持Mac和Windows电脑。

实测GLM-5.2 :你别说,他还真能跟Claude干一下
文章实测GLM - 5.2并与Claude Opus 4.8对比表现
6月中旬上线并开源的GLM-5.2口碑好、抢用资格难。文章对其进行测试,先开展基础能力测试,GLM 5.2基本能完成2048、PVZ等小游戏开发,开发网页版Excel功能完成度高,但耗时久。接着在近生产环境的LuckySheet中对比Claude Opus 4.8和GLM 5.2表现,在加工作表防删除、扩展工作簿统一权限管理、增加工作簿权限定义等方面两者各有优劣,在实现“用户 - 角色 - 权限”体系时,Claude Opus 4.8在业务理解和逻辑处理上更胜一筹。Token用量上,GLM - 5.2比Claude Opus 4.8少。总体而言,GLM - 5.2工程实现能力强,有大型代码库理解和一次性开发成功率优势,作为开源模型有高使用价值,但存在耗时问题,若解决算力问题竞争力将提升。

速递|Transformer 之父出走谷歌,Gemini 联席负责人正式加盟 OpenAI
Transformer之父Noam Shazeer离开谷歌加盟OpenAI
2026年6月18日,Transformer之父Noam Shazeer离开谷歌加盟OpenAI。他是奠定大模型底层架构论文的核心作者之一,谷歌曾花27亿美元请他联合执掌Gemini技术路线。此次跳槽带来三个信号:一是后Transformer架构竞争加速,他将开发OpenAI下一代AI架构;二是开启“反向挖角”时代,大巨头间开始互相挖人;三是加剧谷歌与OpenAI军备竞赛,他的离开对Gemini打击大,也动摇谷歌人才吸引逻辑。架构革命不会一夜之间发生,他更可能是“架构探索加速器”。

GLM-5.2 + Claude Code实测!1M 上下文用法来了
作者分享GLM - 5.2 1M上下文用法及长程任务实测
智谱上线并开源GLM - 5.2,主打Coding和长程任务,官方数据亮眼。作者分享使用GLM - 5.2 1M上下文的方法:先在Claude Code里花两分钟开启1M上下文模式,配置时后缀[1m]要注意;实测有三条经验,包括给模型固定锚点、按需开启1M、将长任务分段设检查点。还展示两个长程任务实测,小任务给学习库补资料,大任务重排知识库,GLM - 5.2表现出色。官方案例显示其能力边界宽,但也有短板,如超长任务比Opus 4.8低13%。GLM - 5.2全量开放、MIT开源,文末有教程。

关于中国 AI 蒸馏问题,前 GitHub 国际化负责人走访中国 AI 实验室
前GitHub负责人走访中国AI实验室解读蒸馏问题
前GitHub国际化负责人Kevin发长文讨论AI“蒸馏”问题,他带队走访国内多家AI实验室后解读:蒸馏本质是“数据策略”,目的是获取高质量后训练数据。国内AI实验室分独立和大厂系,前者缺数据依赖蒸馏,后者依赖度低。很多人认为人口多就有数据优势是误解,国内缺成熟商业数据产业。封锁政策效果有限,无法阻挡国内AI进展。“黑盒蒸馏”是高效知识转移方式。他还发现国内实验室核心力量多是年轻实习生,美国限制难改中国AI长期发展势头。

图灵奖得主押上 10 亿美元的「世界模型」,是AI 的下一个十年?(下)
图灵奖得主 LeCun 押注 10 亿美元探索 JEPA 世界模型
本文围绕图灵奖得主 Yann LeCun 押注 10 亿美元的世界模型展开。LeCun 认为 VLA 必死,JEPA 路线会超越它。节目先探讨了 VLA 模型,其虽能打造惊艳机器人,但 LeCun 指出它有行为克隆难扩展、缺乏明确规划的问题。接着分析了 JEPA 替代技术栈:在视觉编码器层,对比 CLIP 和 V - JEPA 2,V - JEPA 2 不依赖语言,在视频理解基准达 SOTA;VL - JEPA 把 VLM 改造成 JEPA 架构,学习效率更高;在机器人层面,VLA 靠行为克隆,泛化能力有限且规划不明确,而 LeCun 用 JEPA 搭建世界模型,在 push - T 任务中可显式规划动作,但目前性能落后于 VLA。LeCun 提出用分层模型解决短板,未来 AMI Labs 想控制复杂系统积累经验,目标成为智能系统主要供应商。

刚刚,Codex负责人官方发声:Codex原生支持其他模型!
OpenAI Codex负责人官宣支持搭配开源模型并给出接入教程
OpenAI Codex负责人Tibo称,Codex App、CLI和SDK从2026年2月起可搭配任何支持OpenAI Responses API的开源模型。阶跃星辰平台上线该API支持,step-3.7-flash为首个接入模型。文章介绍接入步骤:先在~/.codex/目录下找到配置文件,将阶跃API Key写入auth.json,配置config.toml,验证接入。还给出用Codex review代码的实战案例,如使用codex review --uncommitted等命令。

跟大家说下我最近在用的 10 个 Codex 小技巧
cxuan 分享 10 个 Codex 使用技巧以减少返工
作者 cxuan 分享 10 个使用 Codex 的技巧以减少返工。计划方面,用 /plan 用于跨文件或需求不明场景,明确修改范围、验证方法等; /goal 用于长任务,设定完成标准并定期复盘。权限方面,按任务切权限,通过 AGENTS.md 写规则,hooks 做校验。审查方面,用 /diff 检查改动方向,/review 结合行内评论审查真实风险。前端任务使用 in - app browser 明确验收对象。拆分会话用 worktrees 和 subagents 避免会话上下文过载。重复动作通过 Skills 解决流程重复,MCP 解决外部上下文问题。强调把 Codex 当脑机接口,明确标准让其更好执行。
