Signal #5:执行开始接管软件,界面退居为观测层
过去的软件中,界面是操作入口。
用户通过点击、输入来触发功能,执行由人驱动。但随着 Agent 开始参与执行,这一结构正在改变。
执行开始从“被触发”,走向“持续运行”。
在这个过程中:
- CLI 的流行,本质是执行入口的压缩
- GUI 不再承担主要操作职责,而逐渐转向系统状态的观测与干预
- 在真实需求中,问题已经不再是“AI 能不能写”,而是“系统能不能稳定执行”
当执行可以持续运行之后,
软件也开始发生变化。它不再只是被使用,
而开始被运行。

商家端PC Agent框架重构:从“对话问答”到“任务闭环”
淘宝对商家端PC Agent框架进行重构升级
文章围绕淘宝商家端PC Agent框架重构展开。先指出当前对话式助手只能被动问答,商家任务操作门槛高,而技术发展使AI可处理复杂任务。接着阐述框架升级思考,包括AI与端框架关系转变、基于场景选框架模式、从对话助手到任务容器。方案设计方面,采用常驻式让AI与界面无缝协同,新增虚拟页面展示内容,设计任务挂起和多任务并行。未来,商家端将从任务闭环走向经营托管,实现经营决策自动驾驶和界面形态去中心化,让经营更简单。

当网站开始为 Agent 提供接口,Web 的交互边界正在改变|从 WebMCP 看网页如何从“界面”走向“能力入口”
Chrome发布WebMCP,推动网页向能力入口转变
文章围绕WebMCP探讨网页从“界面”走向“能力入口”的变化。Chrome发布WebMCP early preview,其将能力分为声明式和命令式交互,目标是让网站对Agent更易理解和调用。过去网页主要服务人,以GUI为入口,Agent通过界面反推能力效率低。WebMCP使网站直接告知Agent能力及触发方式,推动交互边界移动,补上适合机器的交互层。它虽不成熟,但将“Agent Interface”显性化,让网页适应Agent。未来网页从“界面容器”变“能力入口”,软件同时面向人和Agent,这对Web开发在前端、交互设计和网站可用性等方面提出新要求。

B端体验设计探索|如何缓解用户视觉疲劳——以京东物流客服系统护眼模式为例
京东物流设计客服系统护眼模式缓解视觉疲劳
文章以京东物流客服系统护眼模式为例,探索B端体验设计缓解用户视觉疲劳的方法。首先阐述项目背景,指出物流一线人员长时间作业易视觉疲劳,且缺少适用标准和设计。接着研究过程中,分析行业标准、竞品,依据理论得出影响视觉舒适度的因素,初步认为灰、黄、绿系可缓解疲劳。然后设计护眼模式,经眼动实验和用户调研,验证灰色、黄色、绿色背景页面能缓解视疲劳,用户更倾向灰色。最后推进方案,落地设计、测试使用情况,纳入组件规范,赋能物流系统,期望提升用户体验和生产效率。

AI 畅销社 01 期:告别廉价感!用「续色」让产品变得更高级
AI畅销社介绍「续色」智能配色工具及WeaveFox创意工具
2026年3月27日的AI畅销社01期介绍「续色」,它是让产品变高级的色彩哲学。这是一款为设计师等打造的智能配色工具,选初始颜色可生成完整色阶,用于UI设计等场景。其核心功能有智能色阶生成、和谐配色推荐、实时预览对比、一键复制色值。还推荐了AI创意工具WeaveFox,可通过简单对话实现创意,给出了「续色」和开启创造之旅的体验地址。

百度APP跨越屏幕的体验-不止于响应式
百度APP开展多端适配体系化建设提升体验
在设备形态多样化背景下,百度APP面临多端适配挑战,如传统适配模式失效、定制成本上升、缺乏治理机制等。百度启动多端适配体系化建设,策略为「统一标准 + 响应式架构 + 体系化提效 + 定制化体验」。具体举措包括驱动立项完善覆盖机制、建立通用标准、驱动提效、定制化设计提升体验。未来跨端体验升级关键是从“页面适配”走向“任务连续”。

在HTML中声明语言
W3C介绍HTML中声明语言的方法和注意事项
文章围绕在HTML中声明语言展开。先指出在html标签用lang属性声明默认语言,页面含其他语言内容时在对应元素添加该属性,使用IANA语言子标签注册表的标签。还提到代码中遇到的问题及解决办法,如title元素多语言文本无好方案,用嵌套元素处理同一元素不同语言内容等。处理双向文本要结合dir属性,若属性和元素内容语言不同,将属性移到其他元素。选择语言值要遵循BCP 47规范,不同文档类型选择不同属性声明语言,还说明了HTTP标头、meta元素等语言声明情况及一些不相关要点。

Android Studio Panda 2,全面进入 AI 化和去 XML 化
Android Studio Panda 2支持Gemini,进入AI与去XML时代
2026年,Android Studio Panda 2正式支持Gemini创建项目,标志Android开发进入AI时代,官方不再维护AS的XML。在Welcome界面选New Project可通过AI创建项目,默认Gemini模型较旧,可通过Google AI Studio API的Key解锁满血版本。还可通过AI Agent简化依赖项升级流程,官方建议用AGP Upgrade Assistant升级AGP版本。此外,Android Studio将单色图标选项集成到Image Asset Studio wizard,同时弃用Layout Inspector 3D mode。最后对比了Flutter的AI生态,指出Android官方AI核心集中在Android Studio,部分生态AI支持需Jetbrains努力。

Android 17 新适配要求,各大权限进一步收紧,适配难度提升
Android 17发布新适配要求,各大权限进一步收紧
本文介绍了Android 17新适配要求,权限进一步收紧。位置权限引入单次授权与动态粗略定位算法,新增“位置按键”,支持开发者自定义风格,适配通过Jetpack库实现。联系人权限新增ACTION_PICK_CONTACTS,收紧应用读取通讯录隐私。APM和无障碍权限方面,加入高级保护模式,限制侧载等。此外,后台启动、本地网络权限、短信验证码读取、动态代码加载、证书透明度、静态final字段修改、密码显示策略等方面也有调整。

优雅解决Android app后台悬浮窗权限问题
货拉拉技术团队用画中画解决安卓app后台悬浮窗权限问题
2025年10月起,小米调整悬浮窗权限使用场景,货拉拉app后台悬浮窗功能将无法使用。为解决此问题,对比多任务处理方式后,选择画中画功能替代。介绍画中画实现步骤,包括声明PiP权限、进入PiP模式、处理UI、更新数据、添加按钮等,还提及兼容性处理和降级方案。同时给出常见问题及解决办法,如PiP窗口未显示指定区域、显示空白等。最后指出其可应用于导航、订单提醒、通话兼容等场景。

Android 依赖注入:高质量代码完整指南
文章详解Android依赖注入及Hilt、Koin框架使用
文章围绕Android依赖注入展开,先介绍依赖注入概念,将依赖从外部传递给类,以解决依赖关系。对比无DI和构造函数注入场景,指出无DI存在耦合、难测试等弊端,而构造函数注入更优。阐述实现DI的三种方式,即构造函数、参数、属性注入。随着应用规模增长,手动DI会遇瓶颈,因此引入DI框架,如Hilt和Koin。Hilt基于Dagger,简化使用,有编译时保证;Koin用Kotlin DSL运行时解析,适合KMP项目。最后给出使用建议,强调依赖注入能提升代码质量和可维护性。

刚刚,TypeScript 6.0 发布,但真正的重点其实是 7.0
微软发布TypeScript 6.0,为7.0过渡并释放升级信号
2026年3月24日微软发布TypeScript 6.0,它是过渡版本,旨在助开发者过渡到7.0。7.0编译器将基于Go重写以提升性能,已接近完成。6.0是基于当前JavaScript代码库的最后版本,新增实用能力,如类型推断更合理、支持特定子路径导入等。同时开始调整默认行为,为7.0做准备,还明确7.0弃用方向。升级6.0时,建议先压弃用警告,显式配置types和rootDir,迁移旧模块解析方式,可借助ts5to6工具。TypeScript正进入新阶段。

下一代GUI范式,图形界面实时生成!Google正在重塑网页浏览体验
Google DeepMind发布实时生成网站的Flash - Lite Browser
2026年3月28日消息,Google DeepMind发布实验性浏览器Flash - Lite Browser,它利用Gemini 3.1 Flash - Lite模型,仅凭用户一句话就能实时生成整个网站。用户在输入框用自然语言表达需求,模型实时编写代码并渲染网页,无需预设网页。与传统软件开发流程相比,AI几秒就能生成页面。该浏览器无传统搜索功能,依据页面状态和用户输入推断内容,每次交互都触发模型重写代码。它颠覆传统Web生态,让GUI按需生成,未来界面可按需定制,还将重塑开发者工作模式,预示全新互联网生态雏形的出现。

Ant Design 又出新玩具,让你的 AI 更懂 Ant Design!
Ant Design推出@ant-design/cli让AI写代码更稳定
2026年3月25日,Ant Design推出@ant-design/cli,定位为给AI Agent用的工具层。因AI写Antd代码常因版本错位出错,该CLI将Antd组件真实数据结构化整理,在代码生成前提供给AI。它数据随包提供、支持按版本查询,能检查过期写法并做迁移提示,可接入Claude Code等AI工具,让AI基于当前数据输出代码,提升稳定性。这反映组件库从考虑人使用转向兼顾AI使用的趋势。

AI x 大前端性能稳定性:快手亿级DAU下的智能诊断实践
快手主站技术部分享亿级DAU下大前端AI智能诊断实践
文章整理自快手移动端稳定性负责人李锐演讲,分享快手借助「柯南AI」保障大前端性能稳定性的实践。快手稳定性历经四阶段发展,如今大前端性能稳定仍面临挑战。AI定位是团队产出放大器,快手锁定“问题处置”切入,搭建「柯南AI」平台。通过真实案例展示AI辅助根因排障,建四级胜任度评估体系,用Holmes工具应对“零线索”场景,处理崩溃和性能问题。应急处置上,推出“Ekko”工具,结合AI降低操作门槛、提供处置建议。最后提到开发Agent的认知升级,认为AI是人类能力延伸,未来将向“human-on-the-loop”发展。

Room 3.0 抢先看:一次面向未来的现代化重构
Google发布Room 3.0首个Alpha版,开启跨平台重构
2026年Google发布Room 3.0首个Alpha版本,是一次面向未来的现代化重构。其核心目标是支持Kotlin Multiplatform,让数据库逻辑跨多平台运行。Room 3.0核心变化包括包名和依赖变更、放弃SupportSQLite、仅支持KSP和Kotlin、强制异步等。虽有破坏性变更,但也带来自定义DAO返回类型、Web支持等新特性。官方给出迁移步骤,包括迁移到KSP、使用新API、升级依赖等。Room 2.x进入维护模式,开发者需向3.0迁移。

B端订单存储架构升级:京东应对ES高并发压力的技术演进之路
京东为应对ES高并发压力升级B端订单存储架构
随着京东业务增长,B端订单存储面临压力,POP订单ES存储挑战大。文章介绍了POP订单异构系统现状,包括业务场景和架构。其核心痛点有数据倾斜、分片数据过大、ES更新频繁、数据维护成本高。针对这些问题提出解决方案:物理隔离大商家、扩展路由策略、增加挡板、分阶段优化数据迁移,最终构建高性能平台。附录提及超大集群维护挑战、ES更新机制及频繁更新带来的压力。

模型调用总闸门再次被投毒
阿里云分享防范开源镜像及PyPI包投毒的经验
2026年3月24日,PyPI仓库中LiteLLM 1.82.7和1.82.8版本被监测出含恶意代码,会窃取系统敏感数据并生成后门。此前DockerHub也发生过OneAPI镜像被投毒事件。PyPI因便利普及成攻击目标,此次LiteLLM投毒或因开发者Token被盗。阿里云开源的Higress网关软件分享防范经验,使用阿里云容器镜像服务可防镜像投毒。阿里云API网关以Higress为内核,构建三重纵深防线及其他安全能力应对PyPI包投毒,目前涉事版本已被下架。

为什么 Spec 不是终点,而只是中间产物?软件研发正在从 Spec 驱动,走向表示驱动(RDD)
软件研发从Spec驱动走向表示驱动(RDD)
文章指出软件研发正从Spec驱动走向表示驱动(RDD)。当执行不再稀缺,核心问题是任务表达。Spec虽可参与执行链路,但允许解释空间,无法被系统直接执行。当任务转向系统执行,模糊性、上下文和验证标准问题凸显,系统需要可执行表示。可执行表示需明确边界、约束和完成标准,沉淀为Task IR。不同复杂度任务对Task IR需求不同。从Spec驱动到RDD,任务表达成核心能力,研发流程重构,Agent等能力基础改变。

OpenHarmony SDK Kit 1.2.0 发布
OpenHarmony发布SDK Kit 1.2.0,升级多模块功能
2026年3月26日,OpenHarmony SDK Kit 1.2.0上线,聚焦提升开发效率与丰富应用能力。Notification Kit重大升级,新增查询授权、角标设置等接口,支持多种通知消息发布;DEMO UI界面优化。Push Kit能力同步升级,通知能力对齐,新增用户画像绑定接口,Demo UI优化。Account & Game Service Kit登录接口更灵活,DEMO UI新增输入项。IAP Kit新增非续期订阅商品类型,优化起始页UI。Ads Kit新增获取OAID接口,支持请求权限。该版本为开发者提供更强大工具集,助力开发OpenHarmony应用。

MiniMax Office Skills:开源一套生产级办公文档引擎
MiniMax稀宇科技开源生产级办公文档引擎Office Skills
2026年3月25日,MiniMax稀宇科技开源一套生产级办公文档引擎Office Skills。M2.7模型在专业办公领域对Office三件套编辑能力提升显著,但实际文档生成存在交付难题。该引擎含四个Office Skills代码等,经多轮自动化测试,可生成可交付文档。文章介绍各格式技术选型:MiniMax - docx选.NET OpenXML SDK;MiniMax - xlsx直接操作XML;MiniMax - pdf封面和正文用不同渲染引擎;PPTX - generator先定义约束体系。还搭建了Execute→Evaluate→Fix三阶段循环实现自进化。代码等已开源,采用MIT协议,部分已上线可体验。

内存占用高?TRAE 研发工程师 5 个方法教你解决
TRAE研发工程师分享解决IDE内存高占用的5个方法
文章由TRAE研发工程师李世民撰写,指出IDE内存占用高是常见困扰,纠正了内存越低越好的看法。先介绍内存概念,不同系统对内存定义有别,Windows关注私有工作集,MacOS要留意内存、实际内存等指标。接着分析TRAE内存主要分布:用户窗口是内存占用大头,可少开窗口、避免打开超大文件;社区插件是常见消耗源,应保留高频刚需插件并定期清理;用户终端常是内存溢出源头,重任务可放系统终端;IDE基础服务和AI能力有必要开销,使用方式会影响占用。最后给出5步排查法,即查看终端任务、插件、窗口、文件和磁盘空间。

一文读懂:智能体身份权限治理演进实录
字节跳动复盘智能体BrewSense身份权限治理进化史
文章以虚拟智能体BrewSense为例,复盘其从“能打杂”到“可托付”的四幕进化史,剖析企业引入和规模化应用AI Agent时身份权限治理的阵痛与路径。第一幕解决“谁能用我”,通过建立入站认证机制,设认证网关和用户池;第二幕解决“我能做什么”,定义出站授权与审计机制;第三幕解决“我为谁做”,引入委托身份与三方授权;第四幕解决“不可降解的级联委托”,建立面向委托链的零信任。最后强调企业应将身份与权限治理纳入顶层设计,实现智能治理。

OpenSearchCon China 2026:字节跳动在 OpenSearch 上的技术实践与前沿探索
字节跳动在OpenSearchCon分享技术实践与创新成果
OpenSearchCon China 2026举办,字节跳动作为核心成员分享技术实践。OpenSearch是支撑字节跳动多市场多语言产品海量数据检索分析的关键引擎。字节跳动内部应用规模庞大,其云搜索服务负责人李亚坤分享工程实践与创新成果。字节跳动是OpenSearch社区核心贡献者,向Lucene和OpenSearch社区贡献超200个PR。面对PB级数据等挑战,字节在实时搜索、存算分离等五大领域攻坚,如实时搜索实现写后立即可查,存算分离架构降本增效。此外,还分享Lucene性能优化实践,未来将围绕现代化等方向探索搜索新范式。

谷歌TPU能撼动英伟达吗?前TPU工程师首次揭秘
前谷歌TPU工程师揭秘TPU能否撼动英伟达GPU地位
文章围绕谷歌TPU能否撼动英伟达GPU地位展开。前TPU工程师Henry揭秘,TPU与GPU架构不同,TPU专为机器学习矩阵计算定制,在软硬件协同下,能在特定场景实现比GPU更低推理成本。但TPU存在短板,软件生态上编译工具XLA是“黑盒”,产能受HBM产能、台积电封装资源限制,通用性不及GPU。此外,文章还探讨了TPU产能、软件黑盒、定制芯片痛点、供应链等问题,指出TPU在大规模部署、模型稳定场景有成本优势,但未来模型范式变化时面临挑战。最后提到新星Groq,它踩准推理、ASIC、Agent时代红利,主打低延迟市场,未来芯片市场推理端将分层、分应用场景,TPU和GPU会并存。

从单体 Agent 到群体智能:OpenClaw 背后的分布式 AI 演进
陈武探讨OpenClaw背后分布式AI从单体到群体智能演进
本文特邀陈武探讨分布式AI演进。OpenClaw走红让AI从“会回答”迈向“会做事”,但单体Agent有指令模糊等局限。AI系统设计重心转变,需新治理结构,分布式AI可拆分功能,降低误操作风险。数据与算力去中心化,分布式学习等提供新训练范式,算力走向端、边、云协同。未来AI是协作网络,群体智能强调分工协同,开发者思维要调整,同时面临新挑战。AI竞争重点将是构建安全可控、协同高效的系统架构。

97.9%采纳率,胶水编程:业务需求出码最佳实践【天猫AI Coding实践系列】
天猫团队分享胶水编程AI Coding最佳实践
本文分享天猫团队“胶水编程”最佳实践,实现97.9%代码采纳率。起初试点业务域采纳率仅50%,因AI代码不可控。“胶水编程”让AI抄代码而非创作,其核心是让AI做拟合,90%抄、10%写。它有四层物料体系:开发规范是底线,按业务和技术视角自动下发;领域知识填补AI对内部组件的知识盲区;代码模式提供可复制骨架,分两层继承;任务规格是需求施工图,有6种模板。四层物料协作,效果组合放大。交付后物料不断补充,任务规格归档且可同步。实践中采纳率从50%提升到90%+,但要避免物料过多、样板间不更新、轻视SPEC等误区。

万能助手正悄悄“脑控”你?清华×蚂蚁全面曝光 OpenClaw 劫持链
清华与蚂蚁曝光OpenClaw劫持链并提出防护体系
OpenClaw(「龙虾」)具备自主决策与跨会话记忆能力,但带来新型“脑控”攻击风险。攻击者通过恶意插件投毒、记忆篡改等隐蔽手段操控系统,传统单点安全防御难以应对。清华大学联合蚂蚁集团研究首次还原其“脑控”攻击链,揭示各环节关键威胁,提出“全生命周期介入、纵深防御、最小权限”防护原则,构建五层安全防护体系,还复现五类典型威胁案例,强调提前筑牢安全防线对未来AI智能体普及的重要性。

让AI变成Super员工的秘密:高效训练Skills
腾讯程序员分享将AI训练成S级员工的工程化方法
文章围绕将AI训练成高效员工展开。指出AI虽有通用能力,但在复杂任务中表现不佳,原因是缺乏业务SOP。以web - testing Skill为例,复盘4个真实翻车教训,如AI不知“哪些地方必须点”、优先做“最像成果的那个”等。提出训练方法:先让AI做真实任务,Skill要写“怎么做”,配checklist和门禁,效果不好时让AI参与复盘修改。最后强调训练Skill是建立AI职业素养,让交付质量稳定。

腾讯广泛使用的跨端开发框架——Kuikly在搜狗输入法中的AI Coding实践
腾讯在搜狗输入法Kuikly项目开展AI Coding实践
本文介绍腾讯跨端开发框架Kuikly在搜狗输入法中的AI Coding实践。AI时代,输入法Kuikly跨端项目面临机遇与挑战,虽AI辅助有一定提效,但存在存量工程理解有幻觉、需求缺乏结构化输入等问题。为实现AI工程化,采取推进AI友好型工程、构建精准的AIContext、标准化需求流程、使用Kuikly开箱即用的AI工具等措施。以输入法灵感词库功能页面开发为例,展示实践效果,新模块、新页面开发效率提升显著。未来将打通D2C工具、实现自动化验证、扩展更多场景,目前Kuikly已开源。

内存减6倍、精度0损失,推理提速8倍!谷歌新技术震撼了AI圈
Google Research团队推出TurboQuant技术提升AI效率
2026年3月27日消息,Google Research团队推出TurboQuant技术,能将KV缓存6倍压缩、无精度损失且推理速度提升8倍,解决内存瓶颈问题。AI模型工作时,高维向量占内存,键值缓存也会成为瓶颈,传统向量量化方法有内存开销。TurboQuant通过PolarQuant和QJL两步实现高效压缩,PolarQuant将数据转换为极坐标,消除内存开销,QJL降低数据维度且保持数据关系。实验显示,TurboQuant在多项指标上表现优异,减少内存占用,提升推理速度,为高维搜索带来变革。

AI 不该等你说话才干活——OpenClaw 定时系统设计哲学
OpenClaw定时系统让AI从被动应答变为主动行动
文章是「OpenClaw实战」系列第三篇,介绍如何让AI主动干活。传统AI被动应答,OpenClaw定时系统改变这一模式。它有四个组件:Heartbeat定时巡查,Cron精确调度任务,Hooks监听内部事件,Webhook由外部系统触发。各组件可单独或组合使用,用户可按需选择。文中还以搭建AI股票助手为例,展示了定时系统的应用,包括接入行情数据、配置盘前、盘中、盘后任务及多渠道推送报告。最后强调AI只做分析,交易决策由人做,定时系统能让用户更轻松。

观察 AIRI 源码:一个 Agent 系统如何处理入口、扩展与执行闭环
文章解析AIRI源码展示Agent系统运行闭环
文章围绕AIRI源码,介绍其作为Agent系统处理入口、扩展与执行闭环的方式。AIRI是面向数字角色场景的运行系统,与普通Agent平台不同,它将模型、交互等纳入可运行系统。其服务入口先做基础治理再分发业务;把模型Provider作为用户可管理资源,用后端路由固定修改边界;插件扩展用状态机约束生命周期、做权限断言;在渠道服务实现典型agent loop。还给出阅读仓库的顺序,强调其将AI能力推进到系统工程。

生成率从8%到60%:快手智能测试用例生成系统的四阶进化
快手研发效能团队实现智能测试用例生成系统四阶进化
文章围绕快手智能测试用例生成系统展开。该系统源于传统测试模式下用例设计效率低的问题,快手研发效能团队在2024年开启AI生成手工测试用例探索。其从V1.0到V4.0不断演进,生成率从8%提升到60%以上,累计生成超120万条测试用例。V1.0探索Prompt工程,V2.0引入Multi - Agent协作与人机交互,V3.0构建知识工程,V4.0实现自主评审和自进化。同时介绍了四层架构驱动的方法论,包括场景分层、用户运营、知识运营和Agentic架构。未来,快手将聚焦AI智能执行用例,构建全链路智能化能力。

WSDM 2026|快手大促CVR预测技术斩获最佳长文提名奖!
快手商业化算法团队论文获WSDM 2026最佳长文提名奖
近日,国际数据挖掘顶级学术会议WSDM 2026举行,快手商业化算法团队联合高校完成的论文获最佳长文提名奖。论文聚焦大促场景CVR预估难题,提出跨时序知识复用框架TEN。大促时数据分布变化致CVR模型预测偏差,历史大促知识难直接复用。TEN将模型拆分,用BridgeNet解决表征不匹配,TEG精准建模样本需求,采用两阶段训练策略。离线实验TEN收益显著,线上实验在快手平台部署后,CVR提升7.52%,RPM提升4.27%,且工程开销低,全量上线带来业务增益。TEN从“模型替换”转向“知识累积”,增强模型适应性。

Agent 语音交互如何更稳、更快?一次高并发消息链路优化实践
阿里云基于RocketMQ LiteTopic优化Agent语音交互消息链路
文章围绕Agent语音交互高并发场景展开。先指出语音交互进入高并发时,消息链路易成瓶颈。分析了智能语音交互对技术架构的要求,如海量会话管理、高频小包传输、严苛时效性。接着阐述传统消息架构在实时语音场景面临的问题,包括路由精准性、异步结果回推、元数据爆炸、会话生命周期管理等。然后介绍基于阿里云RocketMQ LiteTopic构建的消息链路重构方案,涵盖方案设计和优势。最后说明优化后在用户体验、系统复杂度、运维定位、资源成本和业务扩展等方面带来的业务价值。

聊着天把虾队管了:用 HiClaw 正确打开多智能体协作方式【限时领 PPT】
HiClaw助力多智能体协作解决AI应用痛点
文章整理自DataWhale x HiClaw直播分享,介绍多智能体协作工具HiClaw。单Agent做完整Web应用存在上下文爆炸、串行排队、成本浪费等痛点,HiClaw让多个AI Agent在聊天室协作,Manager管理,Worker并行交付。其架构分三层,设计哲学是关注点分离。关键决策包括用容器隔离Worker保障安全、选Matrix协议减少适配、让Worker拿不到真实密钥。Manager只管理不执行,能创建Worker、分配任务等。HiClaw在OpenClaw基础上加协作管理能力,还给出安装、使用、配置的踩坑指南,最后给出运行命令。

融资1.1亿美金,来自欧洲的最新AI独角兽,为什么说"数据才是护城河",而不是 AI 模型?
Dash0获1.1亿美元融资,用AI agent变革软件运维
文章介绍获1.1亿美元B轮融资的Dash0公司,它用AI agent改变软件运维方式。传统可观测性工具因数据多、成本高、告警疲劳等问题失效。Dash0核心创新是Agent0平台,能将数据转化为自主行动,可定制。它基于OpenTelemetry,有数据格式和上下文管理优势。创始人有创业经验,调整销售策略采用PLG模式。Dash0增长快,因素有市场时机、定价模式、高留存率和PLG策略。AI改变可观测性,Dash0架构适配。其护城河是数据处理能力,坚持开放标准构建基础设施,标志可观测性行业新纪元。

Anthropic说:不要在等下一代模型了,立刻马上做Harness!
Anthropic呼吁立刻开展Harness Engineering实践
文章介绍了Harness Engineering相关内容。它指模型运行环境,改变其能大幅提升模型表现。回顾了其前两代Prompt Engineering和Context Engineering,指出Harness Engineering是搭建工作环境。OpenAI、Stripe、Cursor等公司实践证明其能让Agent高效生成代码。还提到模型不会自我评估,Anthropic借鉴GAN思路拆分生成和评估Agent。数据显示优化Harness回报率高,但也有人认为它像“拐杖”。不过Harness会持续演化,设计让Agent高质量写代码的系统才是关键。

治愈 Cursor AI 编程的 “幻觉”?用它就够了!
天玑前端团队自研Specflow解决Cursor AI编程“幻觉”
天玑前端团队在AI Coding实践遇瓶颈,AI生成逻辑碎片化,效率波动源于上下文断层和需求共识缺失。团队调研业界主流三种规格驱动方案,发现其在Cursor等IDE中有摩擦力,于是自研适配Cursor的AI研发流Specflow。该方案设计哲学含全链路流程闭环、严格物理门控、单指令状态机、SSOT与角色思维隔离。它通过自动探测机制精准切换工作模式,涵盖需求分析、架构规划、编码实现、知识归档四阶段。Specflow是专为Cursor IDE定制的研发效能工具,介绍了前置要求、安装配置、核心功能。还给出最佳实践指南,分四阶段驱动研发流程。未来规划Specflow 2.0将进化为自治架构,实现深度角色隔离、意图自触发等。

只需一个指令,让 OpenClaw 安排 TRAE 干活
开发者开发TRAEClaw插件实现OpenClaw指挥TRAE干活
文章介绍了通过OpenClaw安排TRAE干活的方案。TRAE是电脑里的AI驱动IDE,OpenClaw是智能AI助手,TRAEClaw插件能将OpenClaw命令传递给TRAE。配置前需安装TRAE国际版、完成登录和配置OpenClaw,只需对OpenClaw发指令就能完成配置。还给出用OpenClaw指挥TRAE制作网页等案例。TRAEClaw插件适配Mac端OpenClaw,架构分四层,提供查看状态、新建对话和委托任务三个能力。此插件由开发者受用手机对接TRAE IDE的讨论启发而开发,旨在探索新的人机协作模式,目前优先适配macOS端,Windows版也在推进。

Claude在得物App数仓的深度集成与效能演进
博温探讨Claude在得物App数仓的深度集成与效能演进
文章围绕Claude在得物App数仓的深度集成与效能演进展开。先界定数仓开发人机边界与架构演进,明确数据确权边界、工具演进趋势和架构范式升级。介绍Galaxy MCP标准化集成方案,包括协议、工具暴露与IDE集成。阐述工程实践,如智能视觉埋点、AI OneData建模等场景。设计提示词工程架构,拆解提示词模块。建立风险管控机制,抑制幻觉风险,保障数据安全。Code LLM推动数仓研发范式演进,未来将促进数据仓库智能化、自动化发展。

知识基座:让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】
天猫团队分享AI全栈研发知识基座构建实践经验
文章分享天猫团队构建“AI全栈研发知识基座”的实践经验。背景是后端工程师用AI完成前端需求时,经验难沉淀共享。为此构建知识运营体系,智能沉淀方面,通过信号驱动机制捕获会话和代码中的隐性经验,经多步骤处理后入库,召回时按策略分级检索,还沉淀三类团队知识,验证效果良好;历史需求经验复用利用同仓库需求连贯性,沉淀和召回需求信息;云端统一下发可自动匹配业务域并下发配置,解决配置分散难题;多来源知识汇聚整合不同渠道知识。体系已在部分业务域落地,未来目标是实现知识沉淀全链路AI驱动。

Memento-Skills VS OpenClaw 不改模型也能进化
Memento - Skills项目让AI Agent自行进化提升能力
本文介绍Memento - Skills项目,它让AI Agent自行设计和改进自身。AI“变强”有预训练、微调、部署时学习三条路径,Memento - Skills走第三条,不动模型参数,将经验存入技能库。其运作分Read、Execute、Reflect、Write四步,能精准定位问题并修复技能。论文测试显示,在HLE和GAIA benchmark上准确率大幅提升,技能库也不断丰富。它与OpenClaw等项目定位不同,更关注学习进化。该项目有多种部署方式,不绑定模型,自带9个基础技能且能自动生长新技能。虽有学习成本高、技能质量依赖底层模型等局限,但提供了新的AI变强思路。

"驭缰工程" Harness Engineering 到底在搞什么?
OpenAI推出“驭缰工程”,工程师从写代码转向设计约束
文章介绍了OpenAI的“驭缰工程”Harness Engineering,这是一种全新工程范式,5个月用Codex生成百万行代码。工程师从写代码转变为设计约束,产出变成约束系统。其运转有四根“缰绳”:仓库即唯一真相,以仓库文档为地图指引;机械化执行,用自定义linter和结构测试强制执行规则;智能体可读性优先,选稳定技术让智能体易理解;熵管理,建立自动化清理循环。GitHub上有相关学习路线,其核心前提是前期构建约束系统。它指出未来工程师核心竞争力是设计约束能力。

TGRS 2025 | FSConv:空域捕结构+频域提细节,即插即用的特征增强神器
TGRS 2025提出FSConv模块用于红外小目标检测
文章围绕TGRS 2025提出的FSConv模块展开。红外小目标检测面临目标小、背景干扰等挑战,传统卷积有信息丢失问题。FSConv融合空域和频域,空间域用DWConv提取结构,频域用DWT捕捉细节。其架构含低频近似、高频分解和自适应融合阶段。该模块优势显著,多尺度特征保持好,设计轻量化,能自适应增强特征。实验对比显示它在精度和参数量上性价比高,消融实验验证双域融合有效。实战中可直接替换卷积层或作注意力模块插入,还给出训练和推理优化策略。其应用场景广泛,未来可在多尺度分析等方向发展。

95% vs 34%成功率、能耗降低近100倍:神经符号方法击败VLA模型
塔夫茨大学团队研究表明神经符号方法击败VLA模型
过去两年,具身智能将视觉、语言和行动统一进VLA模型。但塔夫茨大学团队质疑其用于结构化任务的适用性,并设计「汉诺塔」操纵任务对决。结果显示,神经符号架构NSM在3块汉诺塔任务成功率95%,VLA仅34%;4块版本中VLA全军覆没,NSM达78%,且VLA微调能耗是NSM近100倍。VLA因需从演示隐式学规则,数据偏差易致其失败,低级执行偏差也多。研究认为VLA适合开放环境短程操作,神经符号架构更适规则明确任务,大规模部署要考虑能耗。

没想到,又一个Code Agents瓶颈,被美团&上交大彻底撕开了~
美团与上交大推出PRDBench基准评估代码智能体
近几年,AI写代码能力进步快,但给代码智能体打分的方法存在僵化、成本高的问题。美团和上交大提出新思路,推出PRDBench基准。一是让AI自己出题,先找真实Python项目需求,让代码智能体生成结构化产品需求文档、测试大纲、项目脚手架和测试方案,人再审核,最终生成涵盖20个领域的50个项目、1258个测试点,标注效率大幅提升。二是训练专门裁判PRDJudge,以Qwen3 - Coder - 30B为基座微调,与人类打分一致率和稳定性大幅提高。PRDJudge学会‘审代码’,像人类QA做事。目前方法只能测固定接口,未来若让AI自由发挥,测试难度将增加。

从 0 到 25 万行:一个 100% AI 编码项目,真正难的不是生成,而是治理
作者分享Routa项目100% AI编码的治理实践
本文作者分享Routa项目用AI驱动编码的实践。创建项目时决定让AI驱动,使用多个AI工具。实践发现重要的是项目在AI参与后的变化,要将AI当队友,关注其能否融入协作系统。介绍四个反馈环:一是用AGENTS.md把协作规则写成统一入口,渐进式披露知识;二是用Monorepo收敛上下文,用Contract锁定系统边界;三是用Git Hooks把约束前移到提交前,触发重构;四是用CI/CD和Fitness做仓库级裁决,自动修复CI。指出真正门槛是治理能力,全AI项目需强化治理。

Gartner预测,在AI组合中纳入中国LLM和多模态模型的全球企业占比,将从2025年的5%上升至2027年的50%
Gartner预测全球企业采用中国AI模型及物理AI比例将上升
商业与技术洞察公司Gartner预测,在AI组合中纳入中国LLM和多模态模型的全球企业占比将从2025年的5%升至2027年的50%,中国本土LLM有竞争力且开源战略增强其优势。企业领导者应评估集成模型、扩展用途等。此外,Gartner还预测到2030年超80%企业将采用物理AI,目前采用率不足1%,企业领导者需试点项目、建立合作等。

Gartner预测2026:中国AI进入“硬核进化”时代,四大支柱决定企业成败
Gartner预测2026中国AI发展,四大支柱决定企业成败
Gartner研究总监金玮就中国AI发展趋势做预测。尽管监管和地缘政治带来挑战,中国AI在资本和数字化转型推动下仍有活力。2026年中国CIO预算增幅低但企业AI投入增加,面临“资源悖论”,超六成企业优先选本土供应商。四大预测包括:2030年80%本土AI基础设施用国产芯片;2028年数据主权等问题占数据管理工作量50%;2029年70%企业实施AI安全测试;2029年超40%大型企业IT运维任务由AI智能体完成。金玮提醒CIO保持理性,企业应统筹四大支柱赢得未来。

Joy戴成君:首度分享靖亚资本投资多模态领域Pixverse、Viggle、VAST背后的故事
靖亚资本Joy戴成君分享多模态领域投资故事及未来机会
2026年3月19日,清华大学校内举办Future Tech Demo Day活动,靖亚资本MD Joy戴成君分享多模态领域投资故事。多模态是AI行业重要主线,靖亚资本自2022年起围绕其布局。多模态创业中,融资与产品技术同样关键,不同融资时点影响公司命运。2021 - 2025年,多模态视频赛道经历多轮分化。当前行业从“模型打榜”走向“产品商业化”,应用层因能整合模型、适配场景、助力用户使用而仍有机会。靖亚资本看好2D/视频应用层、端侧实时互动内容、3D与世界模型三个方向。

The Batch: 929 | Qwen3.5 超越更大模型,领跑视觉基准测试
阿里巴巴发布Qwen3.5系列视觉 - 语言模型,性能出色
2026年3月25日消息,阿里巴巴发布Qwen3.5系列8个开源权重视觉 - 语言模型,含不同规模。其输入支持文本、图像、视频,输出为文本。架构有专家混合或Dense Transformer,视觉编码器未披露。性能上,整体视觉出色,Qwen3.5 - 9B多项语言任务超gpt - oss - 120B。开源权重免费,托管模型可通过API使用。该模型基于Qwen3 - Next架构,用大规模视觉 - 文本tokens训练。测试显示,各模型在视觉任务超更大规模模型,部分在语言任务有竞争力。此前Qwen团队有成员离职,阿里加强监管并承诺加大AI投入。小模型可在消费级电脑运行,有望带来低成本、强隐私保护的视觉 - 语言应用。

用 AI Coding 工具生成 60 万字奇幻世界设定的实践记录
作者用AI Coding CLI生成60万字奇幻世界设定并分享实践
作者分享用AI Coding CLI生成60万字奇幻世界设定的实践。早期用Python/C#编排LLM调用有局限,如上下文窗口小、输出形态不佳。AI Coding CLI有上下文窗口管理和文件系统关键能力。生成过程分四阶段:搭建骨架生成主文档;基础层展开按顺序编写12篇基础设定文档;深度展开编写48篇子文档,不足处重写;角色叙事创作基于设定创作角色日志并展开。还提到几点观察,如上下文窗口保证一致性、层级展开降低矛盾风险等,此方案适合大规模内容生成场景。

杨植麟、张鹏、罗福莉等齐聚一堂,他们关于OpenClaw的观点值得一听。
中关村论坛AI圆桌,嘉宾探讨OpenClaw及大模型发展趋势
2026年3月27日中关村论坛人工智能主题日,举办了小龙虾与AI开源圆桌。杨植麟主持,张鹏、夏立雪、罗福莉、黄超参与。嘉宾们探讨OpenClaw,认为其让普通人可用顶尖模型能力,提升AI想象力空间。张鹏解释智谱GLM5 Turbo提价是因任务消耗token量大,需回归商业价值。夏立雪表示要打造高效token工厂和智慧化算力投放工厂。罗福莉称中国团队在模型结构创新有优势,关注long context架构。黄超指出agent在planning、memory、tool use方面有痛点。最后,嘉宾用一个词展望未来12个月趋势,分别为生态、自进化、可持续token、算力。

Transformer 中的专家混合模型 (MoE)
Hugging Face介绍Transformer中专家混合模型(MoE)及库支持
文章围绕Transformer中的专家混合模型(MoE)展开。先介绍MoE背景,因稠密模型扩展有瓶颈,MoE将部分前馈层换为专家网络,由路由器选专家处理token,具计算效率高、适合并行、被广泛采用等优势。接着阐述transformers库对MoE的支持,权重加载重构通过WeightConverter实现动态加载,减少重复扫描和内存峰值,提升加载速度;专家执行后端提供可插拔架构,有eager、batched_mm、grouped_mm三种后端;专家并行将专家分布多设备解决参数规模问题;与Unsloth合作实现高效MoE训练方案,提升训练速度、降低显存占用、支持更长上下文。

Kimi、Minimax 们的算力荒:智能白菜价,你买不到
Kimi、MiniMax等受算力荒影响,面临保用户或利润率难题
2026年国产AI进入“用不了”时代,Kimi、MiniMax等轻资产模式公司受算力荒影响大。用户购买服务后常遇高峰时段算力不足、掉线、限速等问题。这主要因Agent使算力需求剧增,其单次任务算力消耗比Chatbot放大30 - 100倍,极端超1000倍。云厂商因AI业务利润率低、设备折旧等问题集体调价,Kimi和MiniMax受上游成本传导影响,面临保用户还是保利润率的抉择。短期内,Agent需求上升、供给扩容慢,涨价和限流情况难改善,云厂商或进入重资产设备周期。

通用大模型写不好分镜脚本,所以我决定自己精调一个
作者为写分镜脚本对开源模型进行精调并分享经验
作者因通用大模型写分镜脚本不佳决定精调。先指出通用模型在分镜拆分、画面描述、输出格式上的问题,解释精调是在已有模型用专业数据训练。选基座模型时考虑成本、可控性和迭代效率选开源路线,对比Qwen、GLM、LLaMA后优先中文能力。训练数据靠自建,从建标准、“人工+AI”生产、保证多样性和严格格式入手。精调后在镜头设计、画面描述等方面有提升,还分享了过拟合、学习率高、评估标准不明等坑,并给产品经理建议。

多智能体编排太繁琐?MASFactory用Vibe Graphing直接「话」出来了
北京邮电大学开源MASFactory框架,引入Vibe Graphing范式
在大模型能力提升下,多智能体系统(MAS)成解决挑战性任务关键,但当前MAS编排手段陈旧低效。北京邮电大学开源的全新框架MASFactory,提出以图为中心架构描述多智能体工作流,引入“Vibe Graphing”开发范式,使开发进入自然语言驱动时代。它主张“先全局意图,后局部细节”,用自然语言阐述目标和分工,AI引擎推演出协作图结构,还引入“人在回路”过程控制AI幻觉。与代码编写、可视化拖拽方式相比,Vibe Graphing更适合复杂需求下快速原型设计和低人力成本开发。MASFactory将多智能体交互抽象为四层架构,实验验证其能稳定承载不同工作流,Vibe Graphing生成的工作流有较强竞争力。

52天75次发布,A司这场“产品大爆炸”太猛烈了
Anthropic 52天发布75款产品,迫使OpenAI调整策略
2026年2月1日至3月23日,Anthropic在52天发布75款产品,速度达OpenAI 4倍以上。其1月中旬发布的Cowork改变工作方式,后续Claude上线法律插件、Sonnet 4.6、Code Security等。Anthropic成功关键在于线束架构,解决了上下文焦虑和自我评估失效问题。同期,OpenClaw成功证明其路线正确,也迫使OpenAI调整策略,聚焦编程工具和企业客户,推出类似插件市场,但追赶需时间。

台大李宏毅OpenClaw原理课来了!
台大李宏毅讲授OpenClaw原理课揭秘AI Agent运作
本文是台大李宏毅讲授AI Agent的课程文字稿,以OpenClaw开源项目为例,介绍AI Agent运作机制。OpenClaw与一般语言模型不同,能真正做事,如创建YouTube频道、制作影片等。AI Agent早有设想,随语言模型能力提升而发展。OpenClaw是人与语言模型的接口,其行为由系统提示决定,通过传递对话历史让语言模型“记住”信息。它可使用电脑工具,也带来安全风险,如提示注入,可通过配置层防御。OpenClaw用心跳机制实现主动行为,还有Cron Job功能助其学会等待。其记忆系统简单,用RAG机制节省上下文窗口。此外,它有子智能体、Skill等机制,也有上下文压缩等配置。最后通过Meta研究人员的例子,强调了解运作原理能更好使用AI Agent,并提出为AI提供安全执行环境。

INTSIG DocFlow ,AI原生时代激活企业文档数据价值的理想Agent
合合信息推出 INTSIG DocFlow 助力企业文档处理升级
企业文档处理依赖大量人工,大模型涌现使企业需求迈向新台阶。合合信息的 INTSIG DocFlow 是 AI 驱动的一站式文档自动化处理平台,能为企业打造文档处理基础设施。它有三大亮点:实现端到端全流程自动化,减少多工具采购与维护成本;单点能力极致,如文档解析精准、分类智能、抽取精准;内嵌业务逻辑,通用场景全覆盖、复杂场景高适配。DocFlow 还能进行文件拆分分类、信息抽取、智能审核等操作,已在多行业核心业务场景规模化应用,助力企业全面升级。

"将注意力旋转90°":深入浅出解读 Kimi 最新出圈成果
Kimi团队论文提出注意力残差机制提升模型能力
文章解读Kimi论文「ATTENTION RESIDUALS」。主流LLM模型用标准残差作层间连接有贡献稀释和隐状态值爆炸问题。论文提出“注意力残差”机制解决。介绍了全注意力残差和分块注意力残差,前者解决贡献稀释,但有内存和通信开销问题;后者是折中方案,分块聚合并作注意力加权计算,设块数为8可平衡开销与效果。还分析几种残差机制结构化矩阵处理,通过半可分秩分析灵活性,最终选分块注意力残差。此机制是提升模型复杂上下文理解能力上限的可行路径。

鹅厂员工的龙虾都长什么样?
鹅厂员工分享OpenClaw多种新奇实用玩法
文章围绕OpenClaw展开,先抛出话题,询问大家用OpenClaw搞定的事及独特用法。接着展示多位鹅厂员工使用OpenClaw的实例,如测试开发用其写公众号推文,后台开发用它查日志、自动发帖评论、解决深夜文档处理难题,应用研究做了多AI agents云端同步身份的skill服务,行业应用手搓两个实用skill等,还提到有人探索用其代打游戏,认为能操作GUI界面的Agent+本地模型是AI发展方向。

“AI越厉害,审美就越贵”这事儿,被Seedance2.0证明了
Seedance 2.0实测:优点多但有局限,不同行业适配不同
本文围绕AI视频模型Seedance 2.0展开。它证实了“AI越厉害,审美就越贵”的观点。其优点显著,输出完整度高、稳定性强,指令遵循表现佳,能大幅提升效率、降低成本。但也存在不足,如易出现物理缺陷、沉浸感不足、二次编辑能力弱等。在不同行业适配度不同,广告、游戏、漫剧行业适配度高,可直接提升生产力;动画行业采用较克制,多用作灵感参考。虽有局限性,但市场潜力大,不过受算力、版权、安全等限制,使用体验和意愿被弱化,未来需解决这些问题并改进交互形式。

百虾大战里,阶跃给出了「养虾全家桶」
阶跃星辰推出「养虾全家桶」服务助力Agent使用
今年开春,开源项目OpenClaw爆火,被称作「百虾大战」,阶跃星辰围绕其搭建生态。3月12日上线「一键部署云端StepClaw」;19日限时免费桌面端上线;22日推出面向Agent场景订阅方案StepPlan。StepClaw安装后可7×24小时在线,操作在沙箱,还能同步OpenClaw配置,自带技能工具集,可自动化操作。还有「水产市场」生态,能找资产促龙虾进化。其触发器可自定义触发策略监控电脑。此外,它有高安全性,整体让养Agent更完整,降低使用门槛,致力于解决长期使用问题。

我们还是低估了AI Coding的真正天花板?| 对谈谢吉宝:QoderWork技术负责人
Qoder团队推出面向非程序员的AI Coding产品QoderWork
本文是对QoderWork技术负责人谢吉宝的访谈。Qoder团队推出面向非程序员的QoderWork,初衷是让更多人享受AI Coding红利。开发时5人团队7天完成,全程用Qoder开发。该产品有标准和旗舰模式,适合不同场景。与OpenClaw理念有差异,QoderWork注重实际干活。用户场景丰富,如HR、教师、法务等都能借助其提升效率。在本地和云端选择上,QoderWork选本地,通过虚拟机沙箱解决安全和使用问题。其内部有Agent社区,可自我迭代。对于Agent集群协作,应按需拆分。未来QoderWork将打通IM,做记忆,成主动式助手。2026年Agent将务实落地,提升工作可靠性,促进协作,变革部分行业岗位生产方式。

30分钟开一家“一人跨国公司”是什么体验?
阿里上线Accio Work助力海外电商创业者开跨国公司
2026年3月23日,阿里上线面向海外市场的企业级Agent「Accio Work」,目标是为海外创业者配备7×24小时在线的Agent团队。实测中,只需提供店铺网址和API地址,它就能从零开始搭建店铺,完成选品、装修等操作,还能生成相关分析文档。其技能页集成上百个电商、供应链、营销等技能,可对店铺进行优化、SEO和元数据增强,提供数据分析和供应商推荐。此外,它支持与多种应用和消息渠道打通,可组建智能体团队协同工作,完成社媒调研、供应链任务及谈判等。全球电商环节复杂,Accio Work让用户专注决策,执行交给Agent,虽尚处早期有提升空间,但阿里有完整商业生态,值得期待。

AI的记忆问题解决了!最强记忆基准99%的准确率
Supermemory团队公布近99%准确率的AI智能体记忆技术
2026年,Supermemory团队公布研究成果,其构建的实验性AI智能体流程在LongMemEval基准测试中达近99%准确率,团队称是智能体记忆前沿新突破。该技术名为ASMR,摆脱传统向量数据库和嵌入限制。它有创新的数据摄取和检索管道,部署多智能体并行协作。为应对测试,设计“8 - 变体合集”和“12 - 变体决策森林”两种智能体回答流程,准确率颇高。团队获重要工程洞察,计划开源代码并于4月初公开新智能体记忆系统细节。不过网友指出该技术存在烧Token、速度慢且贵等问题,还有延迟、规模验证和摄入质量三大挑战。

让AI看懂科研图表:深势科技开源150万高质量科研图文数据集
深势科技开源150万高质量科研图文数据集OmniScience
2026年3月27日,深势科技开源包含150万个高质量图文对的OmniScience数据集,提升了多模态大模型阅读科学图表的能力。其利用Uni - Parser工具攻克图文提取难题,经去重筛选形成涵盖10个学科的数据集。为让算法理解图表逻辑,设计动态模型路由重写流水线,引入质量控制体系。用该数据集微调底层模型Qwen2.5,经多维度评估,在各评估维度表现领先,提升了AI处理多模态信息的能力,推动AI自主科研发展。

DeepSeek-R1之后是智能体式思考:林俊旸离职后首发长文
林俊旸复盘大模型发展,点明迈向智能体式思考
本文是阿里通义千问前技术负责人林俊旸离职后首发长文,复盘大模型发展。过去两年大语言模型从文字接龙进化到推理式思考。推演时代,OpenAI和DeepSeek在技术路径上相互辉映,让研发人员认识到强化学习需确定、稳定的反馈信号,且底层算力与架构支撑作用凸显。融合路线中,Qwen团队尝试融合推演与指令模式遇数据难题,部分机构推出混合推理模型,成功融合需平滑算力曲线。新范式下,行业从训练模型迈向训练智能体,智能体式思考将思考融入行动。重构系统时,强化学习底层技术栈需重构,环境质量成关键,同时要防范奖励作弊。未来,人工智能将从打磨语言模型走向统御智能系统。

具身智能独角兽「星海图」新论文引热议,谢赛宁转评:最好和Yann LeCun的新作一起看
星海图发表新论文,与Yann LeCun新作引具身智能热议
2026年3月25日消息,国内具身智能明星公司星海图发表新论文,联合创始人赵行提出Fast - WAM,将训练与推理解耦,其性能与“先想象后执行”类模型相当,速度快4倍以上,证明WAM中视频预测价值在训练阶段。AI圈谢赛宁建议将其与Yann LeCun的新作LeWorldModel一起看。LeWorldModel是对JEPA的优化,实现从原始像素端到端学习稳定JEPA模型,参数紧凑,单GPU可训练,成本低、规划速度高。业内认为二者是世界模型迈向“真机落地”的关键拐点,新一代机器人大脑呼之欲出。

OpenClaw 架构与运行流程解析
OpenClaw构建让AI能工作的操作系统
文章围绕OpenClaw展开,介绍其是连接大模型、工具系统等的AI Agent运行框架,解决AI接入现实、持续工作和多渠道服务问题。架构以Gateway为中心,包括交互入口、渠道适配等五层。运行流程含消息接入、网关处理等七阶段。记忆系统分会话记录和长期记忆,采用混合检索。插件机制可扩展功能,涉及渠道、工具等插件。安全设计含工具执行隔离、命令审批和危险操作拦截。核心价值是让AI有执行力、持续性和组织能力。

速递丨Claude 进化出“手”,OpenClaw 重磅升级:大战一触即发!
Anthropic升级Claude,OpenClaw推“全家桶”升级包
2026年3月24日消息,Anthropic宣布对Claude Code与Claude Cowork进行底层能力跃迁式升级。Claude不再局限于文字交互,优先调用已连接应用程序,无现成工具时会征求许可接管屏幕,像人一样操作电脑且能跨设备工作,不过受严格安全限制,此功能先向macOS特定用户开放预览。同期,OpenClaw推出“全家桶”级升级包,包括换底层模型、推应用商店、翻新架构、加固安全等。两大项目的竞争让人们思考未来AI的走向。

通用语音识别模型VibeVoice ASR:长达60分钟音频一次性“直出”结构化转写
微软亚洲研究院发布VibeVoice ASR长语音识别模型
语音识别技术在复杂场景下有局限,传统系统需切分音频再拼凑,易丢失上下文和张冠李戴。微软亚洲研究院发布通用语音识别模型VibeVoice ASR,单次可处理60分钟连续音频,能生成结构化输出。它集成到Hugging Face生态,可通过Microsoft Foundry检索。该模型颠覆传统流程,有五大核心能力,在五项权威测试中性能超越领先模型,开发者和企业可通过Microsoft Foundry平台和Hugging Face探索应用。

Pro丨Meta震撼开源TRIBE v2:AI终于能“读脑”了
Meta开源TRIBE v2模型,助力神经科学研究
2026年3月27日,Meta FAIR团队开源TRIBE v2模型,可给大脑建数字模型,精确预测大脑对不同刺激的反应。它有零样本预测能力,分辨率比一代提升70倍。该模型采用Transformer架构,融合视觉、音频、语言信号映射大脑活动。其在大赛中表现出色,Meta借此提出计算机模拟神经科学概念,对神经疾病研究、AI系统设计和脑机接口技术有重大影响。不过,因fMRI技术局限、许可限制和对个体差异分析能力有限,距完全理解大脑有差距,但它或改变神经科学研究范式。

这篇文章让我看懂了 AI:应用层最火,基础层最赚钱
投资人Anish剖析AI产业价值链及投资机会
投资人Anish Moonka发布长文剖析AI产业价值链结构。Nvidia CEO黄仁勋称AI是五层系统,Anish将其称为AI Stack。多数AI讨论集中在应用层,但真正财富在底层。2026年四大云计算公司预计投入6500 - 7000亿美元在资本支出,约75%投入AI基础设施。OpenAI虽收入增长快但现金消耗大,利润流向底层。AI发展类似电力革命,基础设施先获利。Anish还逐层分析投资机会,回应是否为泡沫质疑,指出虽有风险,但AI将带来巨大经济转变,当前仍处基础设施阶段。

生产力提升20倍的秘密:用AI Agent把一周工作压缩进一天
Remy分享AI Agent工作流系统提升生产力
文章介绍AI Agent提升生产力的方法。多数人用AI停留在问答模式,而少数人用AI Agent自动管理工作,生产力提升10 - 20倍。AI Agent按观察 - 思考 - 行动循环运作,跨平台通用。构建AI Agent系统,要创建agents.md文件提供上下文,memory.md文件解决记忆问题,用MCP协议连接工具,创建技能实现自动化。技能可累积、链接,还能设置任务调度。合理的文件夹结构能提高可管理性。起步可按选框架、建文件夹、构建文件、连接工具、处理任务、积累技能的步骤进行。此系统重新定义自动化,提升个人生产力,也有过度依赖等潜在问题。

人民想念DeepSeek
腾讯科技探讨AI时代Token成本及行业现状
文章从Token降本视角探讨AI时代经济逻辑。Token因OpenClaw扩散进入公众视野,但消耗大、价格贵,黄仁勋虽强调使用并纳入薪酬激励,但投入产出效果存疑。周鸿祎认为大模型后端可灵活配置,用户能自主控成本,但多数用户难承担日均10美元费用。内存价格疯涨使Token降价缺杠杆,提升模型能力、MFU等可降本。2024年国内大模型曾有价格战,如今因Token消耗、硬件成本等,厂商打价格战动力不足。部分用户尝试本地部署模型或使用EdgeClaw硬件,Taalas团队推出芯片HC1,将模型“焊”在芯片上,但有专芯专用局限。文章指出需降低Token总费用、明确产出,人们想念Token价格战和DeepSeek。

AI助手的终极形态?为什么投资人给这个"偷看你屏幕"的AI产品投了1100万美元?
Littlebird获1100万美元融资,展示全上下文AI潜力
文章介绍获1100万美元融资的AI产品Littlebird。当前AI助手需用户反复提供信息,使用不便。Littlebird采用屏幕阅读技术,持续读取屏幕文本,自动忽略敏感字段,还可连接其他应用,全面理解用户工作生活。其功能丰富,如回答问题、会议准备、例行程序等,内部调查显示能节省时间、减轻焦虑。它注重隐私安全,获相关认证。该产品体现上下文、找到杀手级用例、产品定位等理念,引发从工具型到伙伴型AI转变的思考,虽面临心理适应和依赖挑战,但全上下文AI是未来方向。

OpenClaw构建自我迭代AI助手笔记
作者用OpenClaw构建银行客户经理助手并验证其迭代能力
作者假期花3天用OpenClaw构建银行客户经理助手,验证通用智能体框架可用性。分两阶段,阶段1构建Agent并验证迭代能力,明确工作内容、痛点,初始化人设,建立反馈机制。阶段2实现Agent自主交流与评估,解决跨Agent通信,模拟客户场景测试,构建评估技能。还介绍Cron和Heartbeat配合的反思迭代机制、Agent-Eval Skill测试流程等。对比OpenClaw、Claude Code及OpenViking,指出OpenClaw能提升生产力,未来智能体将走进生活。

Harness is the New Dataset:模型智能提升的下一个关键方向
Celia团队分享Harness提升模型智能的关键方法与思考
文章围绕Harness engineering展开,指出其是模型智能提升的关键方向。首先介绍AI工程方法经历了Prompt、Context、Harness engineering三次演进,Harness是驾驭模型的外围系统。接着阐述Harness的6个关键组件,包括记忆与上下文管理、工具与技能等,可归为信息、执行、反馈三层。随后总结Harness设计原则,如信息层要精准,执行层要分开任务步骤,反馈层要构建闭环。还探讨模型与harness关系,指出训练即部署,harness能力被模型吸收,harness即数据。最后提及创业公司机会,涉及信息、执行、反馈层,并展望下一代AI产品可能是协调工程。

Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)
Kimi杨植麟分享开源大模型进展及研发方式演变
Kimi杨植麟在2026中关村论坛分享开源模型和大模型训练进展。做大模型是将能源转化为智能,关键在规模化。从三方面提升效率:提升Token效率,从有限数据学更多智能;扩展上下文长度,设计新架构和数据提升长上下文表现;提出Agent集群,让多个Agent协作提升任务复杂度。还开源注意力残差架构,提升网络架构性能。开源模型成新基准,Kimi K2.5用于评测芯片性能。大模型研发方式不断演变,未来将由AI主导加速发展。

刚刚,首个AI科学家登上Nature:端到端自动化AI科研时代来临
Sakana AI等团队提出AI科学家The AI Scientist登Nature
2026年3月,首个AI科学家The AI Scientist登上Nature。它由Sakana AI等团队提出,是实现科研全流程自动化的综合AI系统,核心是端到端自动化。其工作分四阶段:用大模型提研究点并筛选,自动编写运行代码,基于实验日志写论文,内置自动审稿人评估。研究团队做实验,向ICLR 2025研讨会提交3篇其生成的论文,1篇高于录用线,若不撤回大概率被接收。还开发Automated Reviewer评估论文质量,表现与人类审稿人相当。该系统标志AI在科学推理领域进步,能加速科研,但也有局限,未来发展与基础模型进步相关,同时存在一定风险。

AI原生组织:OpenClaw推动组织形态重塑|甲子光年智库
甲子光年智库提出AI原生组织及转型路径
人工智能进入代理式AI阶段,OpenClaw突破大模型交互边界,以“数字员工”接管工作流。其将AI从“认知工具”变为“执行主体”,引发组织形态范式跃迁。甲子光年智库提出AI原生组织,它以AI OS为调度中枢、Agent为执行单元、动态协同网络为运行机制,典型形态有流态型企业和生态节点。报告分析了AI原生组织的两条转型路径,即传统企业到流态型企业、传统个体到生态节点,还阐述了其“五化”特征。

黄仁勋一直说的“Token经济学”,到底是什么意思?
黄仁勋提出“Token经济学”并阐述其相关概念
2026年英伟达GTC大会上,黄仁勋发言中Token一词出现超70次,他还提出“Token经济学”。Token是AI能理解、处理、输出的最小信息单元,是AI的成本和效率单位,正成为“新货币”。Token处理是分层定价服务,数据中心变为“Token工厂”,科技公司会给员工配Token额度。AI产业分能源、芯片、基础设施、模型、应用五层,构成Token“生产—消费”链条,AI将创造大量就业,围绕Token开展经济活动。理解Token经济学关键在于:AI是社会协作网络,工作成果是让AI更好处理Token,Token效率将成核心竞争力。

MiniMax Token Plan:全球首个支持全模态模型的订阅计划
MiniMax稀宇科技发布支持全模态模型的Token Plan
2026年3月23日消息,MiniMax稀宇科技将原Coding Plan全面升级为支持全模态模型的Token Plan。新计划与原编程模型用量和体验一致,为Plus及以上套餐用户新增多模态模型调用支持并赠额度。它支持调用M2.7编程模型及多种多模态模型,通过一个Token Plan Key可满足多样需求。还可在OpenClaw中安装多模态工具集拓展创作。专业开发者和企业用户可增购资源包节省成本。为保障稳定体验,高峰时段实施动态限流和单周额度调控,技术团队正推进算力扩容与优化。有超高并发需求者可选择“按量付费”模式。

【D2 演讲实录】从上下文工程到 Harness Engineering
字节周晓在D2大会分享从上下文工程到Harness Engineering
这是第20届D2技术大会周晓的演讲实录,探讨AI时代研发从上下文工程到Harness Engineering的转变。AI Coding提速但未加快产品交付,非编码工作量随代码生成量增加而爆发。解决办法是Harness Engineering,让工程师从写代码转变为设计环境、驾驭模型。周晓还介绍了Transformer原理、Prompt Cache等底层知识,以及上下文工程实战策略,如合理布局Prompt、利用Compaction和AGENTS.md管理上下文。同时,强调工具设计要对Agent可读,满足快、准、结构化标准,还提及多智能体协作、人机分工及构建AI Native工具等内容,最后总结了AI时代研发的四个核心转变方向。

百度地图Skills+智慧物流:给物流系统装上“业务大脑”
百度地图智慧物流Skill为物流系统装上“业务大脑”
2026年3月26日消息,百度地图智慧物流Skill重新定义物流工作。传统物流存在“三重门”,调度员需在多系统切换,司机要结合导航与业务要求,管理者获取报表滞后,本质是系统不懂业务。智慧物流Skill让系统理解业务,调度员从“拼图”到“一键生成”,司机导航更智能,管理者从“事后报表”到“实时洞察”。Skill是“生长”在统一业务智能体上,与传统API拼凑有本质区别。未来,物流人将拥有“业务大脑”,改变人与系统的关系。

聊聊那些百年未变的经典产品
文章介绍百年未变经典产品及背后的路径依赖
文章介绍了几款百年未变的经典产品。包括1874年大规模应用的QWERTY键盘,其布局起源尚无定论;1901年的回形针,经改良后成常用样式并延伸到数字世界;1902年的螺旋蚊香,由日本企业家受蛇启发设计,延长燃烧时间;1911年的拉链,经改进后在服装等领域广泛应用。这些产品因结构精妙、易用、易工业化等特质保持不变,但也存在缺陷。它们不变或是因成行业标准、有先发优势和路径依赖。最后指出设计需在多条件下平衡,设计师要审视行业惯例,探索创新方案。

当代人连看剧都不想"长期投入"了吗?
腾讯研究院研讨微短剧发展现状与未来趋势
2026年1月27日,腾讯研究院举办科技向善创新节,陈孟、董晨宇、刘纯懿就微短剧展开讨论。微短剧是“连续性”与“碎片化”结合,契合当下大众心理。其受众近7亿,但难全民热议,反映文化消费分众化。竖屏微短剧降低创作和消费门槛,拉近与用户距离,当前横竖屏并行体现产业成熟。精品化是微短剧从存量走向增量的关键,需兼顾原创美学、商业闭环和社会效益。未来“微短剧+”潜力大,有望带动地方文化等发展,行业也需实现文化价值跃迁。

活跃在评论区里的青年|T-ask调研
腾讯研究院发布评论区青年用户调研结果
腾讯研究院2026年初开展“评论区青年用户活跃度与情绪感知”调研,回收1008份有效问卷。调研发现评论区成内容消费一部分,人们看评论是为找观点、信息和共鸣,还承担事实核查功能。评论区情绪正负交织,近四成年轻人感氛围恶化。多数人认为玩梗含真实不满,社会公平等话题易引负面情绪。浏览频率越高情绪变差比例越高,评论区情绪渗透现实。近八成受访者有“欲言又止”经历,沉默螺旋效应明显,氛围越负面沉默比例越高。不同城市层级有差异,一线负面、三线正面,二线活跃、五线以下沉默,四线表达最不自由。评论区仍有正向价值,应重视沉默群体、关注情绪陷阱、正视社会焦虑。

老年人到底需要什么样的AI课?
多机构研究老年人所需AI课及学习路径与效果
该报告由多机构联合发起,通过调研访谈等方式,探讨老年人所需AI课。研究梳理出老年AI学习者的六大类型,如“老学霸”“老顽童”等。老年人学AI意义丰富,包括补偿遗憾、对抗虚无等。适合老年人的AI课应从生活场景出发,分层教学,有连续性。当前老年人学AI路径多样但各有问题,如老年大学AI课程边缘化,社区讲座碎片化等。课程应体量小、人数少,由“自己人”教,遵循“三明治”结构,注重安全培育和分层体系,城乡设计需本土化。实验表明,AI课能让老人从防御转向研判,夺回生活掌控权,长远看可推动银发经济发展。

重要时刻,如何高效地沟通?
刘润分享Sophie老师演讲沟通经验及思维方法
文章重发过往文章《重要时刻,可别说错了话》,介绍Sophie老师演讲经验。首先强调利他思维,演讲要从观众利益出发,如用“三只眼”视角,说人话,用旧知换新知。接着阐述系统思维,把演讲比作大树,分析树干(主题应“真、小、实”)、树枝(逻辑要先说结论、归纳三点)、树叶(用掉山洞情节讲故事)、树根(做好准备、和紧张做朋友等)、果实(用听觉锤制造记忆点)易出现的问题及解决办法。最后指出演讲需利他、系统两种思维,是个人品牌路演,愿读者展示最好自己。

吴恩达来信:社群和技能的重要性
吴恩达来信强调AI时代社群和技能的重要性
2026年3月23日吴恩达来信,指出在AI飞速发展及地缘政治不确定背景下,就业和企业未来充满不确定性。商业上,AI颠覆影响企业估值;软件领域,虽有趋势但工程形态和团队组织方式不明;还有诸多‘风险热点’加剧不确定性。他认为对担心职业安全的个体,社群和技能相对稳定。社群能在不确定时提供支持,线下活动可建立和维系关系;技能是终身资产,值得培养多样化技能,积累技能利于学习新知识。吴恩达对未来乐观,鼓励大家彼此帮助,建立社群、提升技能。

Claude Code的产品经理,把她用AI重构工作流的方式全说了!
Claude Code产品经理分享AI重构工作流方式
Claude Code产品经理Cat Wu分享用AI重构工作流的方式。她介绍自身从工程师到PM的AI工具使用经历,称Claude Code让工作门槛降低。日常工作中,Claude.ai用于思考,Claude Code用于做东西,Cowork处理杂事。AI时代PM工作方式转变,包括从长期路线图到短周期实验、从文档优先到Demo优先、新模型更新后重审老功能、保持简单实现避免过度工程。此外,PM要学会“放手”,快速迭代。整个公司各团队都用AI重构流程,产品管理应快速试错、拥抱变化。

AI时代,一个人就是一个团队——从One Person Group到SKILL,公司正在被重构
涛思数据创始人强调AI时代公司需重构以提升竞争力
文章由涛思数据创始人陶建辉撰写,强调AI时代公司需重构。AI是工作必选项和全局重构要素。过去分工协作效率低,如今借助AI一人可完成多环节工作,“One Person Group”理念更合适。公司应将流程、规范沉淀为SKILL,进行版本管理。推动“一切代码化”,让信息对AI可见可用。AI使分工重构,人应投入创新等工作,公司将调整架构。提出需求能力愈发重要,它决定生产力上限。涛思数据作为工业数据基础设施公司,应利用AI提效,构建壁垒。

斯坦福这场讨论,3 种人的机会变了
斯坦福讨论揭示AI浪潮下三种职场人的机会变化
斯坦福大学的讨论揭示AI浪潮下三种职场境遇。一是被“放大”的人,大模型接入客服系统后,新人效率提升30% - 40%,成长周期压缩,而经验丰富者提升不明显;二是还没进门的人,AI暴露率高的岗位,年轻人就业率萎缩,入门岗位需求冻结,职场入口变窄;三是工作在变的大多数,岗位还在但工作内容内核改变,工作重心从执行转向提问和评估,需兼具工具使用与人沟通能力。技术进步下,人的选择决定机会。

在AI时代拉开差距的,是关于组织的想象力
文章探讨AI时代企业认知模式升级并介绍组织课
文章指出在AI时代企业行动力充沛但想象力匮乏,想象力差距源于认知模式不同,企业需升级认知模式。一是从要素替代模式升级为边界扩张模式,商业竞争主战场将向需求创造转移;二是从追逐变化模式升级为重塑核心模式,为组织引入秩序;三是从运动式创新模式升级为系统级创造模式,进行系统性革新。最后介绍《AI时代的组织课》,包括课程目的、时间、费用等。

The Batch: 930 | DeepSeek 放弃 Nvidia 转向华为
DeepSeek放弃Nvidia,向华为提供V4预发布版本
2026年消息,中国开源权重模型开发者DeepSeek在DeepSeek - V4更新中未给Nvidia、AMD适配机会,却向华为提供预发布版本。此前DeepSeek训练与Nvidia合作紧密,虽特朗普政府官员称V4用Nvidia最先进芯片训练,但消息未被确认。多年来美国限制芯片出口,却推动中国发展本土芯片产业,华为等企业有进展。DeepSeek此举象征意义大,加深中美AI生态分裂,也符合中国技术自给自足战略。

W3C可验证凭证工作组新增多份关键规范
W3C可验证凭证工作组新增多份关键规范
2026年3月23日,W3C可验证凭证工作组更新标准化章程,新增多份关键规范。如Verifiable Credential Render Method v1.0阐述呈现机制,Verifiable Credential Confidence v1.0增强信任程度等。此外,部分文档或纳入标准化流程,如Vocabularies for Digital Product Passports等。小组还计划发布部分规范新版本,继续推进Data Integrity BBS Cryptosuites v1.0等规范开发。

[即将开启] W3C全球社区热点话题分组讨论
W3C将开启全球社区热点话题分组讨论
2026年3月25日消息,W3C全球社区热点话题分组讨论(W3C Breakouts Day 2026)即将开启,旨在汇聚全球技术社区,围绕Web技术热点话题及标准化需求与趋势展开交流。话题一览可查看相关链接,各话题分组讨论时间为3月25日21:00 - 23:00和3月27日05:00 - 07:00,远程参会信息可在活动日历页面获取。活动免费面向W3C会员及公众开放,无需注册,登录W3C用户账号获取会议接入信息,申请和管理账号可查看指定页面。如需更多信息或参会协助,可邮件联系W3C中国区会务团队。

就问 OpenClaw 还能不能更新了,我的微信 ClawBot 咋办?
OpenClaw升级致IM插件崩溃,2026.3.23版修复部分问题
2026年3月,很多人升级OpenClaw到2026.3.22版本后,微信、企微、飞书等IM通道龙虾不回消息。此次升级重写插件系统,移除plugin - sdk统一入口致IM插件崩溃。开发者称是为抵御网络攻击,但限流规则过严。2026.3.23版本修复部分问题,微信、企微、飞书插件也跟进适配。作者推荐更新到稳定版,还给出更新通道插件命令。最后建议不必频繁更新,可利用OpenClaw完成重复性工作,如使用墨问MCP工具。

AI,正在“杀死”哪些软件?
定焦One团队分析AI发展对软件行业的冲击与转型方向
速递丨NeurIPS 首回应!AI顶会"封杀"华为大疆等873家单位,CCF呼吁全面抵制
NeurIPS封杀873家中国单位,CCF呼吁全面抵制
2026年,顶级AI学术会议NeurIPS因遵守美国制裁规定,禁止873家中国单位投稿和审稿,波及华为等核心科技企业。此决定引发学术圈震动,多位学者拒绝审稿,质疑政策合理性。中国计算机学会(CCF)3月25日发布声明,指出其违背学术交流原则,呼吁科研人员抵制,若不改正将从推荐目录移除。此前2019年IEEE也有类似事件,后调整政策。中国学者近年是NeurIPS重要贡献者,此次争议削弱了学术交流开放性与中立性。
