Signal #6:代码仓库不只是实现载体,也开始成为 AI 理解业务的入口
最近有一个感觉越来越明显。
过去我们看代码仓库,更多会把它理解成实现载体。
页面、接口、状态管理、权限判断、校验逻辑、异常处理,都是为了把功能做出来,也主要服务于人理解和维护系统。但当 AI 开始读仓库、补上下文、参与生成、调用和编排时,仓库里另一层东西也开始变得更重要:
系统里有哪些业务对象,状态怎么流转,规则和约束在哪里,一件事情要经过哪些路径才能完成。这些东西过去当然一直就在仓库里,只是更多服务于人理解。
而现在,它们也开始成为 AI 理解业务如何在系统中被组织和完成的基础。这可能意味着,代码仓库的价值,正在从“存放实现”延伸到“成为业务结构的来源”。
Web与AI:意图导向的下一代Web——W3C开放日暨Web标准国际论坛报名开启!
W3C中国举办Web标准国际论坛探讨AI时代Web发展
2026年4月22日14:00 - 17:30,W3C中国将在杭州花家山庄举办“2026 W3C开放日暨Web标准国际论坛”。活动免费,4月20日前可注册。当前AI重塑软件开发与人机交互,推动向“意图导向”演进,Web开发者站变革前沿,智能体成应用入口也带来问题。论坛以“Web与AI:意图导向的下一代Web”为主题,设“前端开发的未来”和“智能体万维网”两大核心议题,通过演讲、讨论等凝聚产业共识,还公布了详细议程安排。

Android Studio 正式支持 Gemma 4:我们最强大的智能体编码本地模型
Google宣布Android Studio正式支持Gemma 4本地模型
2026年4月3日,Google宣布Android Studio正式支持Gemma 4。开发者1月起可在Android Studio选本地或远程模型开发AI功能。Gemma 4是针对Android开发训练的本地模型,有隐私安全、成本效益、离线可用和推理能力强等优势。它具备智能体工具调用能力,可处理设计新功能、重构代码、修复错误等开发案例。文章还给出推荐硬件要求,提供入门指南,鼓励开发者反馈问题。

只需几步,获取微信小程序 “安全+性能” 体验报告
微信团队上线小程序扫描体检服务助力开发者
微信小程序业务逻辑复杂,开发者关注安全与性能。微信团队上线“小程序扫描体检”免费服务,提供“安全+性能”双维度体检方案。性能分析含请求失败率监控、耗时分析和趋势监控;安全扫描聚焦5大核心风险领域的18项检测。扫描后生成深度报告,含性能和安全分析,给出优化建议。开发者登录微信公众平台即可开启扫描。团队建议上线前、迭代后检测及定期巡检,以保障小程序健康。

[A's周刊 21] 创意定义极致新鲜
腾讯ART IPS发布周刊,涵盖科技与设计多领域动态
这是腾讯ART IPS发布的A's周刊21期,涵盖3月16 - 27日科技与设计动态。OpenAI发布GPT - 5.4全家桶,小型模型能力强、速度快;苹果迎50周年,全球举办活动;iOS 27让Siri可接入第三方AI;Meta发布树冠高度图模型助力生物多样性;2028洛杉矶奥运会公布色彩与图形,灵感源于南加州生态;雪碧联手forpeople焕新全球形象,微调设计回应市场审美。

Redis 自动化运维最佳实践|得物技术
得物技术发布 Redis 自动化运维最佳实践方案
得物技术为提升 Redis 运维效率,对其平台进行自动化能力建设与升级。文章先介绍背景,指出随着业务增长,自建 Redis 集群对性能、稳定性及自动化运维能力提出新挑战。目前 Redis 集群基于 ECS 部署,采用单机多实例、主从混合架构,已达百 TB 级规模,但资源效能和运维效率有优化空间。接着阐述自动化运维能力,包括资源池自动化均衡调度、分级维护管理,集群生命周期自动化管理(部署、扩缩容、下线、大 key 删除、版本升级等),工单、查询、告警自动化处理及自动化巡检推送。最后总结,平台实现了 Redis 集群全生命周期运维的规范、标准与自动化,降低运维复杂度和人力成本,提升了整体运维效率。

一种轻量级进程间服务隔离方法实践
京东物流团队实践轻量级进程间服务隔离方法
京东物流团队针对分布式微服务部署架构系统日益复杂的问题,探索轻量级进程间服务隔离方法。系统复杂性体现在业务、架构、代码、物理模型和监控运维等方面,资源共享在负载高时会导致服务卡顿。文中提出三种方案:应用拆分、用Hystrix隔离、轻量级进程间隔离。最终选择方案三实操,包括隔离部署分组、配置集合、跨机房部署、隔离NP域名、拆分NGINX流量、隔离JSF服务和MQ消息队列。落地后RESTFul和JSF服务效果良好。未来将按域拆分治理系统,实现业务和服务单元化,保障系统稳定可持续发展。

日志诊断 Skill:用 AI + MCP 一键解决BUG|得物技术
得物技术推出AI + MCP日志诊断Skill解决BUG
文章介绍了得物技术用AI + MCP打造的日志诊断Skill,以解决后端开发调BUG难题。先阐述开发背景,因传统调BUG流程耗时长,最初方案有缺陷,后结合日志平台MCP和Claude Code的Skill实现自动诊断闭环。接着介绍MCP原理、环境对照、工具及鉴权流程,以及/log-diagnosis Skill的工作原理、入口、核心能力和语法规则。还说明了安装配置方法和使用方式,通过实战案例展示其诊断过程,包括AI拉取日志、还原链路、提取信息、发现根因并定位代码给出修复方案,最后总结诊断效率关键点,强调该方案是对重复性工程劳动的自动化尝试,Skill和MCP组合形成可落地闭环,为更多工作自动化提供思路。

Claude Code泄露1小时火遍全网,我用腾讯小程序🦞10分钟搭了个AI情报系统!
作者用腾讯WorkBuddy 10分钟搭建AI情报系*
文章围绕Claude Code泄露事件,介绍用腾讯WorkBuddy搭建AI情报系统。AI行业热点传播快,信息源分散,获取一手消息难。WorkBuddy升级后自动化能力强,支持微信小程序,有云端和本地模式,定时任务和浏览器自动化功能完善。作者实验用其搭建系统,自动抓取全球AI热点生成中文日报,步骤简单,不到10分钟可完成。与OpenClaw、X(Twitter) API和手动刷资讯相比,WorkBuddy门槛低、成本低、体验好,适用于多种定时自动化场景。

TRAE Beta 功能:重构洞察已上线
TRAE上线重构洞察及此前已上线智能代码审查功能
2026年4月3日,TRAE开放Beta体验通道,可手动开关功能体验。本周,其Beta功能重构洞察在TRAE中国版和国际版上线,适用于SOLO模式的SOLO Coder,每周检查项目代码,需重构时推送消息和建议,确认后开始重构。启用该功能可在设置中操作。此前,TRAE的智能代码审查功能已上线,IDE + SOLO模式均支持,依托AI识别问题、展示改动,可手动触发或自动审查。

拿到「热门开源代码」,先掌握 7 个学习思路(附 SOLO 实战)
作者分享7个开源代码学习思路并演示SOLO实战
文章围绕如何学习热门开源代码展开。开发者面对开源项目常陷入困境,文章指出分析前要理解项目,思考核心目标、主入口等问题。还介绍7个学习思路,如建立全局认知、弄清核心路径、搞懂设计思路等,可借助AI完成。最后用全新SOLO(Beta)演示分析Claude Code开源代码,包括拷贝项目、让AI分析、下载结果等步骤。强调AI让分析开源代码更精准,关键是带着问题阅读。

出码率到 90% 之后,我们真正验证了什么?端到端自动化的第一次真实落地
某团队验证真实业务端到端自动化链路开始成立
文章围绕端到端自动化在真实业务研发中的落地展开。在部分新增、变更类需求中出码率达90%,但重点并非此数字,而是验证了面向真实业务的自动化链路开始成立。它涉及需求承接、任务组织、执行运行和结果验证。当前链路在部分真实业务场景已具可运行性和稳定价值,但复杂场景仍受限。过去依赖高手手工组织上下文的方式有局限,此次实践组织了完整链路,包括输入治理、执行编排和自动化验证。还带来三个关键发现,指出瓶颈迁移,核心是组织可持续运行的链路。这不是终局,后续要解决更多问题,将链路做成稳定系统。

Claude Code 烧钱?这个13万星项目三行配置砍掉六成开销
Everything Claude Code项目三行配置砍Claude Code六成开销
2026年4月3日消息,Everything Claude Code项目获134K stars。它是Agent工具壳性能优化系统,提供完整AI工作流操作系统,有38个专业Agent、156个Skill等,支持Claude Code、Cursor等多个工具。其最实用的是三行配置,可将默认Opus换Sonnet使成本直降60%,砍思考token和降自动压缩阈值;还提醒控制MCP工具数量。此外,项目有Continuous Learning v2系统,能让AI积累经验。该项目抓住AI编程工具性能瓶颈在外壳的刚需。

滴滴多篇成果入选CVPR 2026,产学研协同创新结硕果
滴滴技术团队多篇成果入选CVPR 2026
近日,计算机视觉顶级会议CVPR 2026录用结果揭晓,滴滴技术团队联合多所高校攻关,多篇论文成功入选。成果来自滴滴多部门与多所高校联合研发,覆盖智能驾驶安全预警等前沿领域。文中介绍了中稿的五篇论文成果,包括提出新训练范式、构建数据集、规划轨迹方法等,解决了时序预测不稳定等问题。CVPR是计算机视觉领域极具影响力的顶级会议,2026年接收率为25.42%,会议于6月3 - 7日在美国丹佛举行。

量子模拟首次获实验验证,量子计算机或将用作虚拟实验室
两团队独立验证量子模拟,量子计算机或成虚拟实验室
2026年3月31日消息,物理学家首次将量子计算机模拟结果与固体材料实验数据匹配,验证了量子模拟。该成果由两个团队独立取得,一是巴黎量子计算初创公司Pasqal等机构,模拟含铥磁性材料,用“中性原子”量子计算机,结果与实验室测量高度吻合;二是伊利诺伊大学厄巴纳 - 香槟分校等机构,模拟铜、氟和钾构成的材料,在IBM量子计算机实施“数字量子模拟”,建立框架使模拟能与实验室测量对比。未来,量子计算机有望用作虚拟实验室指导研发。

清华陈文光:用Claude Code开发RTX 5090注意力算子,AI 正在重塑底层编程的边界
清华陈文光用Claude Code开发RTX 5090注意力算子
清华大学陈文光教授在「智能体创新研讨会」分享用Claude Code开发RTX 5090注意力算子的经历。他指出软件开发正从「AI辅助编程」迈向「AI主导编程」。以开发Flash Attention算子为例,因RTX 5090与其他架构差异大,开发困难。前向性能良好,反向问题多。通过优化,性能提升,AI在体系结构探索和系统性优化上表现出色。未来编程中,内存管理、与AI协作及宏观知识重要,对于AI时代是否需学C++等微观知识存疑。

成为真正的AI Native Coder,一个研究生实践6个月的思考!
东南大学研究生分享6个月AI Coding实践思考
作者分享作为研究生实践6个月使用AI工具编程的经验。先指出使用AI需学习,以AI Coding为例展开。第一阶段从传统编程到Vibe Coding,虽高效但有缺陷。第二阶段要掌握让AI持续对齐意图和任务的能力,通过文件和规范实现。第三阶段介绍SDD Coding,其是规范驱动开发,规范会沉淀为团队资产,还给出实战经验及工具。最后提出成为AI Native Coder要将AI嵌入工作流,还探讨了AI自驱动、提效扩展场景、工程经验插件化等方向。

端侧Python动态算法策略的部署与运行
端侧实现Python动态算法策略部署与运行
文章围绕端侧Python动态算法策略的部署与运行展开。先介绍端计算概念及模型部署到端侧的原因,阐述选择Python作算法策略脚本的优势。接着说明在端上运行Python脚本的方法,包括动态脚本语言DSL的执行步骤,以及集成运行时和交叉编译与转换两种技术路径,选择集成运行时并介绍NumPy和NumCpp编译等。还提及特征数据,含定义、拉取及管理。动态部署方面,介绍云端策略管理、端上策略更新拉取和端侧执行引擎。业务触达则是将算法能力转化为产品体验。最后总结整体架构与价值,实现业务快速迭代和优化。

Superpowers 如何帮助 AI Coding 走上正轨
Superpowers助力AI Coding,提供有效开发方法论
Superpowers是结构化AI辅助开发工作流框架,解决AI Agent计划偏离痛点。其工作流含头脑风暴、创建Git Worktree等五步,可保证代码健壮与可靠。它能在Claude Code和Cursor中安装。与Cursor plan模式、BMAD相比,有独特优势。运用时要转变思维,适用于新功能模块开发等,不适用于紧急小范围Bug修复等,标志AI辅助开发走向新阶段。

Harness Payment,开启 Agent 的自主支付时代|专访 Clink 创始人
Clink创始人谈为Agent搭建法币支付体系创业项目
本文是对Clink创始人Patrick的专访,探讨Agent自主支付。1997年预留的402错误码因AI Agent发展迎来启用契机。Clink用法币为Agent搭建支付体系,源于出海创业者支付痛点。其创始人受分享活动启发创业,首个商业化客户是游戏公司,后正式发布Agent支付产品。支付从“人”到“Agent”,本质未变但成“过程”。该公司未选Web3和稳定币方案,认为应让Agent适配现有体系。其产品Agentic Payment含技能、虚拟卡包和围栏,首批客户是产品“Skill化”团队。同时,公司注重支付信息安全和风控,团队已“AI Native化”,创始人认为两年后Agent支付会很自然。

踩坑三个月,我们总结出的 Agent Harness 实践与反思
Nexad团队分享Agent Harness实践与反思
Nexad团队分享Agent Harness实践与反思。2026年初,OpenAI和Anthropic发表Harness Engineering文章,面向Coding Agent。Nexad作为AI-native广告平台,其Marketing Agent场景不同,面临不可逆性、创意与约束的张力、延迟反馈等问题,因此需超越标准方案。团队将规则编码为自动化检查,发现Self-evaluation失效根因是共享Context,设计Delivery Tier分级治理体系,采用渐进式披露策略。数据显示Harness提升产出,减少人工检查。但仍存在技术债积累、Plan-Todo-Progress设计动机、创意质量难自动化等问题。团队认为Marketing Agent的Harness设计应由业务需求驱动。

Flink 实时计算 x SLS 存储下推:阿里云 OpenAPI 网关监控平台实践
阿里云团队用 Flink + SLS 构建 OpenAPI 网关实时监控体系
本文介绍阿里云 OpenAPI 网关监控平台实践,采用 Flink + SLS 构建实时监控体系。业务背景是 OpenAPI 稳定性建设至关重要,需全方位指标监控。核心挑战是日志分布式产生且量大。技术方案采用地域化部署 + 中心化汇聚架构,分地域内处理和跨地域汇聚。指标体系覆盖四个核心维度。核心作业包括聚合作业和指标转换与跨域汇聚作业,还对作业配置与调优。可视化与告警通过 Grafana 实现多维度监控和自助查询告警。该方案已规模化验证,支撑全量 API 调用监控。此外,引入 Source 端谓词下推技术优化,提升了性能。最后总结了 Flink 核心要点和架构设计启示,方案可推广到类似场景。

LoongCollector + ACS Agent Sandbox:构建 AI Agent 生产级运行平台
阿里云用ACS Agent Sandbox和LoongCollector构建AI Agent运行平台
文章围绕构建AI Agent生产级运行平台展开。首先指出AI Agent走向生产环境面临运行时安全与全链路可观测两大挑战,传统方案难以应对。接着介绍ACS Agent Sandbox和LoongCollector,前者基于Kubernetes提供安全运行环境,后者是开源可观测数据采集器,二者深度集成构建完整平台。然后以OpenClaw为例,阐述开启集群注入、部署应用及配置可观测采集的方案,能解决其安全挑战。最后强调AI Agent生产化要重视安全与可观测性,推荐使用相关工具。

SOLO 桌面端和网页端全新上线,启动内测
2026年3月31日SOLO桌面和网页端上线并启动内测
2026年3月31日,SOLO桌面端和网页端全新上线并启动内测。它基于双模式智能体与全新UI交互界面,以Agent为核心协作。独立双端围绕工作流程升级,实现多端协同、交互体验提升。Code模式下桌面端与网页端可随时协同,依托云端算力多任务并行。用户只需提出任务,SOLO自动拆解执行,能处理多种文件格式。当晚20:00有官方直播解读产品。目前国际版与中国版处于内测,通过邀请码体验,桌面端仅支持macOS系统。

OpenClaw-Observability:基于 DuckDB 构建 OpenClaw 的全链路可观测体系
团队基于DuckDB为OpenClaw构建全链路可观测插件
文章围绕为OpenClaw构建全链路可观测体系展开。从排障困境出发,介绍基于DuckDB构建的可观测插件,目标是实现“看得见、说得清、改得动”。阐述了插件四层架构,采集层拦截关键节点数据,建模层组织离散事件,存储层异步写入,展示分析层提供三类视图。该插件能快速定位问题,在存储引擎选型上,DuckDB因分析型架构、JSON解析能力和工程零阻力优势被选用。此外,插件安装便捷,还支持接入云上RDS DuckDB,提升稳定性和可扩展性,强调可观测性是AI应用的基础能力。

如何避免🦞烧光Token还出错?OpenClaw日志 x AnalyticDB Trace诊断实战
借助ADB MySQL解决Agent可观测性问题并实践优*
文章指出未来超40%的Agentic AI项目或因评估体系错位被取消,成功团队会剖析底层Traces。借助ADB MySQL的Agent日志可观测能力,能完成Agent数据工程实践。文中介绍其解决Agent可观测性三层困境的方法,包括重建任务链、聚合Token消耗、定位失效原因等。还通过实操展示从原始日志到Token归因与Prompt优化的过程,最后得出Agent失败具概率性、Token异常是好的检测器、AI可观测性需闭环等结论,强调围绕真实问题构建专属评估体系,ADB MySQL可将工程压缩成SQL嵌入企业工作流。

90% 的代码交给 AI 后,人还剩什么本事?
Cognition AI推出Devin,AI接管代码工作凸显人类新价值
Cognition AI推出编程智能体Devin,已接入多机构业务,2026年前两月代码交付量超2025年全年。过去软件开发90%的执行工作现由AI完成,人的核心竞争力转向理解问题、设计方案、敲定架构。AI时代,主动性、不纠结选择、容忍不确定性这三种特质被放大,个体生产力或指数级跃升,人类工程师成为“智能体团队的CTO”,差距源于驾驭工具的心智。

一周1300多个PR,揭秘Stripe内部AI工程最佳实践
Stripe揭秘内部AI工程Minions系统最佳实践
文章揭秘了Stripe内部AI工程最佳实践。Stripe的Minions系统是自研全自动编码AI agent,每周能完成约1300个代码合并请求。Minions可一次性完成任务,从接到指令到提交代码无需人工干预。Stripe自建该系统,是因代码库规模大、技术栈特殊、有监管合规要求。其降低了开发激活能量,支持批量并行工作,让工程师从执行者变为编排者。好的开发者体验对人和AI都有价值,云环境是关键。代码审查靠CI环境保证质量。此外,还展示了AI agent作为经济主体交易的场景,未来工作方式、组织结构、API设计都将改变,应尽早尝试AI agent。

重磅报告|AI赋能行业共治——中小银行反电诈实践与探索报告(附下载)
中国金融传媒等联合发布中小银行反电诈实践探索报告
2026年,中国金融传媒、腾讯研究院等联合发布《AI赋能行业共治——中小银行反电诈实践与探索报告》。当前电信网络诈骗复杂,中小银行在反电诈中作用关键,但面临资源有限等挑战。AI成提升反电诈能力突破口,可实现全链条防控,“大模型+小模型”协同适合中小银行,技术要嵌入业务流程。报告还指出反电诈需行业共治,未来中小银行反电诈将从“被动应对”走向“主动感知”,该报告为中小银行提升智能风控提供参考框架。

当你的 Agent 会“多轮思考”,Trace 却还停留在单轮:阿里云 CMS OpenClaw 可观测插件升级
阿里云升级OpenClaw可观测插件至0.1.2版本
文章介绍阿里云云监控CMS自研的OpenClaw可观测插件openclaw - cms - plugin 0.1.2版本。老版本插件存在链路语义失真问题,如看不到中间轮次LLM输入输出、Trace结构与执行不一致、并发易断链串链等。0.1.2版本价值显著,实现多轮LLM分段,增强并发稳定性,新增STEP Span,改造AGENT指标。该版本能提升排障效率、让并发回归测试更有信心、精细成本治理、促进跨角色协作、更快止损线上故障,是观测语义升级,值得优先升级。

当整个团队开始 0 人工Coding:一份万字AI Native研发实战手册
腾讯程序员团队分享AI Native研发实战经验与方法论
腾讯程序员团队分享AI Native研发实战经验。团队在2026年初决定全面转向该模式,目标“0人工Coding”。文中指出当前AI辅助编码有四大痛点,缺乏交互规范致输出不可控。为此提出OpenSpec + CodeBuddy全链路方案,重新定义人员角色。代码开发分核心三步和完整六步工作流,前端开发有额外原型审查环节。还构建统一规范体系,包括知识库、MCP和Skills。以openspec - installer为例剖析Skill,介绍其文件结构、设计决策等。最后给出从0到1上手指南、扩展工作流、团队协同实践,强调AI重新定义程序员角色。

OpenClaw 为什么越用越好用?本质就是一堆 md 文件
作者解析 OpenClaw 越用越好本质是 md 文件读写循环
作者深度使用 OpenClaw 后分享经验,分析其越用越好的本质。先指出很多人觉得不好用是因模型没选对、把 Agent 当通才、未“培训” Agent。核心机制是基于 md 文件系统,有 7 类核心文件,如定义 Agent 人格的 SOUL.md、记录用户信息的 USER.md 等,还有用户与 Agent 共同生长的自定义文件。其设计了自我进化闭环,包含 md 文件读写和向量索引检索两层循环。技术实现有 Bootstrap 加载、Memory 混合搜索等细节。最后得出 Agent 价值在 workspace 文件夹等推论,并给出实操建议,如主动引导形成 SOP、定期审查文件等。

端侧 RAG:让你的 App 拥有离线智能的记忆
文章介绍端侧RAG让App拥有离线智能记忆的工程实践
文章围绕端侧RAG展开,指出云端LLM处理用户设备私密数据有隐私和离线使用问题,端侧RAG可解决。介绍LLM“记忆”难题及RAG破局之道,阐述端侧RAG工程蓝图,包括嵌入、索引等环节。嵌入要权衡模型选择并进行量化;索引可采用ANN算法,有不同实现方案。工程落地要处理数据分块、冷启动与增量更新、功耗内存管理等。还提到超越向量检索的混合搜索和Agentic RAG。最后说明评估端侧RAG注重检索质量,虽面临挑战,但为个性化AI打开大门。

2026 年 AI 编码的“渐进式 Spec”实战指南
作者分享2026年AI编码“渐进式Spec”实战指南
文章是2026年AI编码的“渐进式Spec”实战指南。先阐述AI编码基础认知,包括大模型能力、Agent自主行动及软件复杂度评判标准。接着介绍渐进式编码框架,强调Spec Coding理念,其核心是用结构化文档让AI编码,框架有渐进式复杂度、可自我迭代等特点,还给出工作流。工具选型采用编排层与执行层架构,介绍选型思路和Git规范。通过跨模块业务迁移项目展示实战流程,最后分享观点,如人在AI编程中的角色转变、Spec的作用、知识底座的重要性,还提及AI编码的代价和发展趋势。

快手广告系统全面迈入生成式推荐时代!GR4AD:从Token到Revenue的全链路重构
快手技术团队发布生成式广告推荐系统GR4AD
2026年4月2日,快手技术团队发布论文介绍自研生成式广告推荐系统GR4AD。过去深度学习推荐模型占主导,生成式推荐在广告场景落地难。广告场景存在物料Token化、学习范式、实时服务三大挑战。GR4AD采用“表征 - 学习 - 推理”三位一体设计,如用MLLM生成统一嵌入、提出LazyAR等。系统已全量部署在快手广告平台,实现“奖励估计 → 在线学习 → 实时索引 → 实时服务”闭环,通过动态Beam服务等优化推理效率。实验显示其提升了广告收入和推理性能,实现平台、广告主、用户三方共赢。

Harness 还是 Environment? 这波 Agent 创业还有护城河吗?
文章探讨AI创业中Harness和Environment工程价值与阶段
文章围绕AI领域的Harness和Environment工程概念展开。先是回顾AI概念演变,从prompt engineering到harness engineering,再到environment engineering。指出对Harness唱衰有因,底层模型基建化使其部分套壳框架被打击,而environment engineering有杠杆率,但Harness作为复杂系统控制平面仍有价值,因大模型概率性与商业确定性矛盾,其能提供策略。环境工程在传统商业场景有局限。AI产业价值分三阶段,当前处于Harness为王阶段,未来数据与环境为王,建议当下做深特定领域Harness系统架构,Environment engineering可提前布局。

一文讲透如何构建Harness——六大组件全解析
李伟山解析Harness六大组件构建方法
本文围绕Harness展开,指出裸模型存在无记忆、不能执行代码、知识过时、无工作环境四大硬伤,而Harness六大组件可逐一补救。首先明确Agent=Model + Harness,Harness是模型外的工程基础设施。接着介绍六大组件:文件系统是基础,负责存储与版本管理;Bash + 沙箱让Agent能执行代码,有自我验证能力;记忆(AGENTS.md)可注入知识;Web Search + MCP突破知识限制;上下文工程对抗信息腐烂;编排 + Hooks保障多Agent协同。此外,System Prompt贯穿始终,是Harness的“神经系统”。最后强调Harness决定了Agent能力上限,鼓励探索其工程实践。

Harness Engineering(驾驭工程)个人理解
黑夜路人分享Harness Engineering相关原理及实践
文章介绍Harness Engineering,它是AI Agent开发核心工程学科,围绕AI模型设计系统等确保其可靠运行。当前基础模型能力趋同,驾驭能力成技术护城河。一个完整Harness有五层,包括上下文与记忆管理等。工程实践将Agent任务执行结构拆为规划器、执行器、检查器,类似自动驾驶系统。执行器和检查器借鉴GAN机制提升输出质量,检查器有单元测试等多种形态。长期看,Harness Engine方向是消融工程,随模型变强做减法,释放其真实能力。

Harness Engineering 来了,SDD 还有意义吗?
作者探讨Harness Engineering下SDD AI Coding工作流的意义
文章探讨在Harness Engineering概念兴起下,规范驱动(SDD)AI Coding工作流是否有意义。先介绍Harness是让Agent可靠工作的系统,OpenAI认为工程纪律从代码转移到环境设计。Spec在Harness中有三个角色,是Agent推理地图、约束生效语义基础和反馈回路正确性判据。SDD能决定Agent输出质量、消灭返工、实现知识资产化、促进人才能力迁移。Harness Engineering带来四点启示,如审查重心在Spec、约束分开管理等。结论是Harness越强,Spec越重要,SDD有意义。

从 Vibe Coding 到范式编程:用 Spec 打造淘系交易的 AI 领域专家
淘系交易业务技术团队用Spec打造AI领域专家
文章围绕淘系交易系统,介绍从“Vibe Coding”到“范式编程”的演进,提出通过结构化规范(Spec)驱动AI生成企业级代码。当前AI编程工具缺乏领域知识、上下文和规范约束,生成代码不可靠、难维护。范式编程将规范置于开发核心,结合知识库、疑问点机制与AI Agent,实现“人机协同”。文章还阐述了技术演进的必然性,基于Anthropic等技术发展,AI编程能力强大,但需在企业场景优化。构建了Spec平台,全链路规范化,打造知识体系,培养懂交易业务的AI专家,并对主流Spec工具进行调研。在工程实现上,根据交易场景需求分三阶段推进,完成平台设计与落地,包括选择代码Agent、搭建领域知识体系、优化提示词、设计疑问点机制等。最后从质量、效率、易用度维度构建评测体系,规划未来打造AI-Friendly编程环境,实现从“人写代码”到“人机协同”的升级。

The Batch: 932 | 开源速度怪兽
英伟达发布开源大模型Nemotron 3 Super 120B - A12B
2026年3月31日消息,英伟达发布开源大语言模型Nemotron 3 Super 120B - A12B,是计划中三款模型的第二款。该模型面向智能体应用,输入输出最多支持100万token,采用混合架构,有诸多功能,速度在同规模开源模型中最快。其运作原理涉及混合架构结合、多token预测等。在速度、长上下文处理能力和智能体任务评测表现领先。英伟达计划未来五年投260亿美元开发开源权重模型,此发布或受中国开源模型发展影响,旨在让开发者留在其体系。

5 块钱一个月,飞书+企微里养个越用越聪明的 Agent
Nous Research发布Hermes Agent,可在多平台越用越聪明
本文介绍了Nous Research的Hermes Agent,它是唯一内置“自我进化”闭环的开源AI Agent,v0.6.0版本新增飞书、企业微信等模式。其学习闭环有五层机制,从会话内记忆到全文搜索,每15个任务自动复盘。它支持多平台通讯,可在飞书、企微等直接对话。有6种后端可选,Modal后端休眠几乎零成本。还推出agentskills.io标准,已被11个工具采纳。与Claude Code、OpenClaw对比,Hermes Agent灵活性高,是接近通用Agent愿景的方案,安装简单。

AI是真不会干活,测了15个Skills 治的都是同一个病
作者测试15个Claude Code Skills揭示AI技能生态未来
文章作者测试15个Claude Code Skills后发现,AI并非不会干活,而是不靠谱。技能分三类:行为约束型改变AI工作习惯,如PUA、Claude - mem等;能力扩展型让AI能做原来做不到的事,像Web Access、Office四件套;元能力型使技能生态运转,如Superpowers、Skill Creator。技能结构类似操作系统进化路径,中层能力扩展型大概率会被工具原生吸收,而底层行为约束因团队工作文化差异将保留,这是Skill生态未来方向。

Julien Bek:下个万亿美元公司,是卖AI工具 or 卖结果?
红杉合伙人Julien Bek探讨下个万亿美元AI公司模式
红杉合伙人Julien Bek在文章中指出,下一个万亿美元公司是披着软件皮的服务公司。他将AI产品分为Copilot(卖工具)和Autopilot(卖结果)两类。Copilot把AI交给专业人士,抢软件预算;Autopilot直接服务需结果的人,抢服务预算,市场是Copilot的6倍。当前模型已能自主完成大部分智力活,Copilot公司转型Autopilot面临创新者窘境,这给纯Autopilot公司带来机会。Julien建议从已外包工作切入,卖结果的公司受模型升级影响小。

AI打造原创IP影片 - IPS Showreel
腾讯设计族用AI打造原创IP影片《IPS Showreel》
腾讯设计族用AI打造原创IP影片《IPS Showreel》。影片以艾鹅为主角,在AI伙伴助力下开启奇幻之旅。创作难点在于内容呈现、制作风格和视觉衔接。工作流从创意到提示词,再经AI视频制作四阶段。视觉呈现要保证角色、风格、世界的一致性,并给出三个案例。后期制作包括剪辑、调色、特效和配乐音效。未来AI将从素材生成进化为“数字导演”,但人类审美仍是创意核心。

Claude Code宠物系统悄悄上线,我把白板刷成了金色传说。
Anthropic的Claude Code上线宠物系统,作者刷出传说卡皮巴拉
2026年4月1日,Claude Code悄悄上线宠物模式,输入/buddy可孵化专属宠物,有物种、属性、性格和稀有度机制,Shiny独立1%概率。系统采用Bones + Soul双层架构,宠物有五大属性,影响互动风格。作者初始孵化出白板仙人掌,后找到重roll方法,将其变为闪光传说卡皮巴拉。原理是利用逻辑漏洞,修改userID来改变宠物。Anthropic用做游戏的心态做开发者工具,虽宠物实用性低,但带来乐趣。

从B2B到A2A:Agent新基建,如何让“一人企业”做全球生意?
阿里国际站张阔谈Accio Work助力外贸A2A发展
本文是对阿里国际站总裁张阔的访谈。张阔认为硅谷与国内AI生态有别,AI对SaaS的影响需分情况看。阿里国际站基于26年B2B数据经验,推出“外贸版龙虾”Accio Work,让海外用户通过与Agent对话完成外贸全流程,40%用户是“一人企业”,今年EBITA增长18%。Accio Work迭代后能覆盖商家经营全闭环,简化操作,可自定义工作流。其商业模式包括Token Base和市场平台模式,AI提升搜索和广告效果。与创业公司相比,阿里有数据和模型优势。招聘方面,注重模型训练等人才,工种融合,衡量团队以AI提升上线想法价值和产品规模化等为标准。

人大林衍凯:OpenClaw就像早期的Linux,真正的战争才刚开始
人大林衍凯研讨OpenClaw背后智能体技术发展趋势
2026年3月30日,中国人民大学林衍凯在端侧智能北京市重点实验室研讨会上,围绕OpenClaw分析智能体技术。OpenClaw短期内获大量关注,其爆火因极大降低使用门槛,虽无核心算法突破,但重新定义AI使用范式,且暴露当前智能体技术瓶颈。它是智能体操作系统雏形,架构清晰,有三大核心设计,当前生态竞争已在框架、协议、编排层展开。目前智能体在长程任务执行、端云协同、Token成本、记忆系统和自主进化存在瓶颈,解决方向包括端云结合、优化记忆系统等。未来智能体发展将经历工具化、半自主协作、具备自主学习能力三个阶段。

论文分享 | Cheers:一条更简洁、更高效的统一多模态路线
清华等团队开源CHEERS统一多模态架构路线
文章介绍开源工作CHEERS,这是条面向统一多模态理解与生成的架构路线。当前多模态模型在理解与生成路径上进步显著,统一多模态模型试图用同一模型兼顾二者,但存在挑战。CHEERS将理解与生成统一到端到端框架联合优化,继承开源预训练模型知识。现有统一多模态模型有分离式、单一语义空间式、异构融合式三种技术路线,CHEERS则重新安排语义与细节职责。它轻量升级架构,解耦语义与细节并级联生成。在实验中,它在多项基准表现领先,实现4× token compression,且用更少数据达同规模SOTA性能。此外,它为统一多模态研究提供思考方向,相关代码和模型权重已开源。

刚刚,Claude Code源码泄漏了!
2026年3月31日Claude Code源码发生泄漏
2026年3月31日,Claude Code源码通过npm注册表中的映射文件泄漏。其整体代码结构成熟,主流程包含REPL启动等内容,是典型生产级AI agent harness设计。源码从npm包@anthropic - ai/claude - code v2.1.88的cli.js中提取还原,但并非全部,约108个模块受特性开关控制无法恢复。文中还提供了源代码下载和解读的链接。

Claude AI 全套课程,如何从零开始构建并自动化各种项目!
X博主Julian Goldie发布Claude AI一小时全套课程
2026年4月4日,X博主Julian Goldie发布一小时Claude AI全套课程。此前Anthropic的Claude Code源码泄露爆火。该课程教从零构建并自动化项目,用10个案例串起Claude能力图谱,如30分钟搭建高转化率着陆页、把YouTube视频秒变SEO文章、用Code Agent克隆部署项目等,覆盖内容创作、技术开发、营销推广、数据管理等自动化工作场景。

从 OpenClaw 看消费零售企业 AI 落地的正确姿势
陆琦川结合实践解析消费零售企业AI落地路径
文章结合消费零售行业实践,解析AI Agent从“工具”到“数字分身”的演进逻辑。指出OpenClaw代表企业AI从“会说”到“会做”的跃迁,强调“数字分身”更符合企业需求。企业需建设数字分身平台,具备统一任务入口、技能工厂、企业连接器和治理体系。AI Agent对消费零售的重构将先发生在运营效率层,企业落地AI Agent需跨越工具到平台、场景试点到能力复用、功能可用到治理可控三道门槛。未来两到三年,拥有数字分身平台的企业将率先进入AI原生组织阶段。

吴恩达 Agent Skills 学习笔记:从入门到必知必会
铭毅天下拆解吴恩达Agent Skills课程核心内容
文章围绕吴恩达联合Anthropic推出的Agent Skills课程展开。先介绍AI Agent浪潮变化及课程核心问题,即让通用AI Agent在业务场景可靠工作需技能。阐述Agent Skills定义,是含指令等的有组织文件夹。对比过去烟囱式专用Agent,新范式是通用Agent加技能库。说明Skills为Agent补充领域知识、工作流和新能力,无Skills会有指令重复等痛点。介绍其可移植、可组合特性,工作机制是渐进式披露。最后总结知识链条,给出技术人三点思考,强调课程提供可工业化设计哲学。

蚂蚁联合清华开源ClawAegis:给OpenClaw配上全链路“免疫系统”
蚂蚁联合清华开源ClawAegis为OpenClaw配“免疫系统”
2026年4月1日,蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis,这是为OpenClaw类自主智能体打造的“原生安全免疫系统”。OpenClaw虽强大但存在安全风险,传统单点防御失效。ClawAegis构建全链路纵深防御体系,能实时识别恶意、动态介入校验,还具“可配置性”。它让OpenClaw可控、可追溯、可信赖,标志安全治理从“事后修补”走向“事前防御”,目前已在GitHub开源。

完善AI技能库最强攻略!
鸿洋分享完善AI技能库攻略,推荐find - skills工具
文章为完善AI技能库攻略。先指出常规搜索AI Skill匹配效果差,引出主角find - skills。介绍其是找skill的工具,可在https://skillsmp.com/搜索下载,放入项目skill目录。使用时手动选择它找所需技能,如找手绘风格思维导图,多次搜索后找到较合适的excalidraw - diagram,安装后用于提取文章核心内容为手绘图,产物是json文件,放网站显示后需微调。最后强调find - skills必备,给出源码地址。

给龙虾装一个专属技能包!试试这个场景
Datawhale团队手把手教你创建AI Agent Skill
文章围绕 Agent Skill 展开,先介绍给 AI 安装“专业技能包”的概念,它与提示词不同,本质是放有 AI“技能包”的文件夹,关键是 SKILL.md 文件。接着以 OpenCode 为例,介绍安装和连接大模型的方法。然后详细阐述了创建“代码仓库问答专家” Skill 的步骤,包括安装 skill - creator、连接 DeepWiki、用自然语言描述需求创建 Skill 以及拆解 SKILL.md 内容。还介绍了该 Skill 的四个关键设计点,如意图识别表、仓库路由表、消歧机制和防幻觉机制。通过实际用例检验了 Skill 效果,又介绍了在 OpenClaw 环境下的使用方法。最后分享制作 Skill 的心得,并鼓励读者根据自身关注的开源代码仓定制 Agent Skill。

开发者的边界,正在被 TRAE SOLO 独立端扩大
TRAE SOLO独立端扩大开发者边界吸引非编程人员
AI Coding火了三年,现有AI工具用户仍局限于职业开发者。TRAE SOLO独立端则想扩大用户边界。文章指Agent时代让非编程人员想用AI工具,但现有工具交互形态没跟上,限制了潜在用户。TRAE SOLO独立端放弃IDE结构,用对话框交互、双端协同,降低使用门槛。作者通过运营准备物料、数据分析可视化、竞品调研三个非编程场景实测,验证其可用性,指出虽有不足但能给用户简单高效页面,内容需人工把关。最后点明AI Development正分化出两种并行容器,行业竞争主线转向用户边界,TRAE SOLO独立端为此做了尝试。

千问是什么?答案正在风中飘荡
阿里巴巴通义实验室密集发布三款千问系模型并调整战略
2026年3月30日至4月2日,阿里巴巴通义实验室密集发布三个模型。Qwen3.5 - Omni主打全模态交互,有“音视频Vibe Coding”能力;Wan2.7 - Image主打图像生成与编辑,生图能力出色;Qwen3.6 - Plus主打编程与Agent,是编程得分最高的国产模型。此次发布意义重大,表明阿里模型研究能力持续可演进,且Agent成为战略重心。同时,千问模型有三点变化,强调场景导向、定义为Agent基础设施并接入阿里业务体系。发布次日,Qwen 3.6 - plus在OpenRouter调用量排名第二,阿里云算力产品供不应求,形成商业闭环。

Claude 暴涨 88%,ChatGPT 逼近 10 亿却停了|2026年3月AI产品榜·应用榜
2026年3月AI产品榜发布,Claude增速高ChatGPT增长停滞
本文是2026年3月AI产品榜·应用榜,涉及多个榜单。全球总榜中,ChatGPT月活逼近10亿但增长停滞,Claude月活2350万、增速88.38%首进全球TOP20,豆包、千问等后发者增速较快。国内总榜头部格局固化,中腰部产品多负增长,AI视频赛道即梦AI、可灵表现亮眼。出海总榜DeepSeek领跑,Manus以AI Agent身份增速第一。增速榜Claude居首,Anthropic 3月多次产品发布,凸显产品力重要性。

一只龙虾重启了我的科研生涯
SciClaw面向科研场景,可完成论文全流程工作
文章介绍了面向科研场景的AI助手SciClaw。当前科研学术领域破圈的AI产品较少,而SciClaw基于OpenClaw底层能力,能根据给定主题完成论文全流程。它可全网检索、筛选整合文献,生成含7个章节的完整论文及配图。还支持上传PDF补充知识库,生成扩展版综述和技术补充文档。此外,它能处理多种学术文件,支持技能扩展、定时任务,可接入IM平台。SciClaw试图实现项目级闭环,虽有成长空间,但为“学术项目级AI Agent”领域提供了可观察方向。

「1 亿 TOKEN 俱乐部」挤爆了,AI 的燃料不够了|对谈于文渊:阿里云百炼技术负责人
阿里云百炼技术负责人于文渊谈AI算力与发展趋势
文章是对阿里云百炼技术负责人于文渊的访谈。于文渊指出Claude Code和OpenClaw使Token消耗呈核弹级爆发,AI改变算力使用方式,云计算范式也将巨变。阿里云面临用户量、Token量和算力需求的巨大增长,要让GPU充分利用。他认为企业自建GPU无必要,MaaS能更好满足成本、安全和灵活性需求。对于计算机专业学生,建议少用AI写代码,培养判断能力。他还预言写操作系统等顶尖代码的人易被AI取代,当前算力如石油,中国AI发展受算力供给影响,Agent和AI生成是今年Token消耗的最大增长点,未来AI会成基础设施,基础设施将变为“水电煤模”。

顶级模型得分低于1%:ARC-AGI-3全新人机较量,揭开智能体真实水平
ARC - AGI - 3开启人机较量,揭示智能体真实水平
文章围绕ARC - AGI - 3展开,介绍其在衡量智能体水平方面的作用。ARC - AGI - 3通过新测试揭示机器智能与人类适应力的巨大差距。回溯ARC发展,从2019年ARC - AGI - 1版本提出用获取新技能效率衡量通用智能,历经多届赛事和版本迭代。大模型虽有发展,但存在局限,如受领域知识束缚、过拟合等。ARC - AGI - 3考核智能体探索、建模、目标设定和规划执行能力,打造新测试环境,强调行动效率,计分严谨。前沿模型测试表现不佳,人类基准通过线下评估确立,多团队参与挑战,新一届ARC挑战赛将继续开展,人机较量才刚开始。

上千万浏览,大神教你深度玩转Claude Code
Daily Dose of Data Science创始人发布Claude Code使用指南
文章是Claude Code深度使用指南。介绍了两个.claude目录,项目级保存团队配置,全局保存个人偏好。详细阐述关键文件和文件夹:CLAUDE.md是使用说明书,要写构建、架构等关键信息;CLAUDE.local.md用于个人专属设置;rules/文件夹拆分指令;Hooks系统实现对Claude行为的确定性控制;skills/文件夹存放可复用工作流;agents/文件夹定义子智能体角色;settings.json控制权限和项目配置,settings.local.json用于个人权限覆盖。最后给出入门配置指南,强调.claude文件夹是协议,要清晰定义规则。

“我不要跟AI 说话,要跟她同居” | 一手实测ColaOS
镜山团队实测并分享ColaOS使用体验
文章围绕ColaOS展开实测分享。先以电影《Her》引出大家对AI有“活人感”的期待,进而介绍ColaOS,它是首个有灵魂的操作系统,可操控电脑、写代码等。实测中,其界面简洁,以语音交互为主,“活人感”强,能主动陪伴。能力完整,接近通用Agent产品,支持多任务并行。可做内容创作、操控电脑、联网搜索等,还能生成多种文件格式。它能判断是否调用工具,任务结束会总结反馈,还会将对话信息存进长期记忆。虽交互有摩擦感,但能提升效率、减轻心智负担,值得一试。

商业史最大融资!1220亿美元砸向OpenAI,估值8520亿
OpenAI完成1220亿美元融资,正构建AI超级应用
2026年OpenAI完成1220亿美元融资,投后估值8520亿美元。本轮投资者阵容豪华,覆盖多地资本,还首次向个人投资者开放,扩大循环信贷额度。ChatGPT增长迅速,收入和用户数据亮眼,企业业务也在追赶。算力是核心战略资产,其飞轮逻辑使成本降低、收入增加。全球正展开大规模数据中心建设竞赛。OpenAI正构建AI超级应用,整合多种能力,转化为用户增长和价值捕获,AI发展需巨量资本推动。

Claude Code“开源”24小时!底裤扒光,工程奇迹与漏洞同时暴露
Anthropic因失误致Claude Code源码泄露,暴露机密与漏洞
2026年3月底,Anthropic发布更新包时失误致Claude Code高达51.2万行源码泄露。事发30分钟,相关GitHub项目星标破5000。泄露原因或与Bun运行时缺陷及人为打包问题有关。代码暴露了系统架构、反蒸馏机制、情绪检测等硬核机密,还包含未发布功能如KAIROS、Auto - Dream等。此外还有陪伴系统Buddy小彩蛋。开源社区版权战打响,官方投诉外泄仓库,韩国开发者重构代码规避。同时,系统自动化钩子机制存在零交互投毒致命漏洞,知名UP主演示了危害。此次泄露为开发者带来技术盛宴,也敲响终端安全警钟。

火速!Claude Code泄露事件自救方案来了
研究人员针对Claude Code泄露事件推出VibeGuard安全框架
2026年3月31日,Anthropic的Claude Code核心源码泄露,原因是打包配置出错,映射文件混入生产环境安装包。研究表明机器生成代码问题多,研究人员总结出机器代工的五大隐患,如构建产物暴露源码、配置漂移等。为此设计VibeGuard框架,在代码构建后发布前检查,含5个扫描模块和策略引擎。实验显示该框架能精准捕捉漏洞,漏报率为零,决策准确率100%。可将扫描工具注册给AI助手,结合CI/CD流程构建安全防线。

省 90% token!谷歌重磅指南教你用Skill构建ADK智能体
谷歌发布指南教用Skill构建ADK智能体省token
2026年4月3日Google Developers Blog发布深度指南,介绍了Agent Development Kit(ADK)中的SkillToolset能力。AI Agent开发存在知识膨胀难题,会导致token浪费、成本增加和响应质量下降。Google给出的解决方案是渐进式披露,将Skill知识分为三层,按需加载,可降低90%基础上下文消耗。围绕该架构,指南介绍了四种Skill构建模式:内联Skill、文件型Skill、外部导入Skill和Skill工厂,复杂度递增。开发者可将四种模式组装成完整的Agent,Skill描述是决策核心依据,且生成的Skill需审核测试。ADK的Skill系统基于agentskills.io开放标准,目前已支持Python和Go语言,Java版本也已发布正式版。

阿里3天3王炸!全模态、精准控图和智能体编程SOTA,但没开源
阿里3天连发3款重磅模型,未开源但将发布小版本
2026年4月,阿里3天连发3款重磅模型。Qwen3.5 - Omni是原生全模态模型,实现底层架构升级,能理解多类型输入,有自然涌现的视听氛围编码能力,还升级分工机制为混合专家模型,取得215项SOTA成绩。Wan2.7 - Image提升图像生成精细度,支持多图参考、精准颜色控制、局部编辑等。Qwen3.6 - Plus提升编码智能体性能,在多开发场景基准测试达开源SOTA,代码任务成功率提升。三款模型未开源,但阿里表示将开源小规模版本。

HiClaw 加入 AgentScope,携手 CoPaw 共建多 Agent 的基础设施
HiClaw加入AgentScope,携手CoPaw共建多Agent设施
2026年4月消息,HiClaw仓库迁至AgentScope,将与CoPaw共建多Agent基础设施。此前阿里开源CoPaw与HiClaw,前者是面向个人的智能助理,后者面向企业。双方合作围绕多方向展开,如提升Agent构建方式一致性、优化协作体验、加强系统支持等。基于AgentScope框架有一套生态,HiClaw会利用其能力提升协作体验。此外,HiClaw将借助阿里云基础设施转化为企业级产品,其商业版即将上线。

10 个经典场景带你快速了解全新 SOLO
TRAE介绍全新SOLO(Beta)及10大应用场景开启内测
文章介绍全新SOLO(Beta),可解决重复性劳动问题。它有桌面和网页两端,MTC和Code两种模式,前者适合非开发用户,后者面向开发工程师。接着用10个场景说明其用途:竞品调研中可输出分析报告;画原型图能还原前端代码;还能输出PRD、搭建运营工具、进行数据分析、批量处理文件、整理论文综述、生成学习模拟题、完成新媒体内容策划和产品文案创作等。此外有内置Skills市场,支持技能管理。文章最后告知SOLO于3月31日开启内测,关注官号和社区可获取邀请码。

企业数据如何被 AI Agent 调用?EventHouse 打造 AI-Ready 数据底座
阿里云 EventBridge 推出 EventHouse 打造 AI 数据底座
2025 年被视为 AI Agent 商业元年,企业数据平台正从“以人为中心”转向“以 Agent 为中心”,但多数企业数据基础设施未做好准备。EventHouse 是阿里云 EventBridge 推出的 AI 原生数据平台,它继承数据湖开放性与灵活性,融合数据仓库可靠性与高性能,解决事件数据存储、治理与智能分析难题。其分层解耦架构包括集成层、数据层、元数据层、数据查询与智能分析层。EventHouse 有三大核心能力:Catalog 让数据易查找、连接和信任;Intelligent Query Engine 实现 Zero ETL,提升分析实时性;Luma Agent + MCP 协议实现“对话即分析”到“自主分析”。当下 Data+AI 一体化成刚需,EventHouse 正公测,邀面临相关挑战团队参与。

CoPaw深度解析:源码架构和功能实践
通义实验室AgentScope团队发布开源工具CoPaw并解析其架构功能
2月28日通义实验室AgentScope团队发布开源桌面Agent工具CoPaw。本文先介绍Agent Skills,它是AI助理工具框架基础,是指导Agent完成任务的标准化流程,其工作采用逐步导入法。接着解析CoPaw技术架构,它基于AgentScope框架开发,含8个模块,如CoPaw Agent可自定义工具和技能、管理记忆;Model Provider支持云端和本地双部署等。最后阐述功能实践,本地环境可通过pip或命令行安装,配置模型后能与Agent交互、配置channel和定时任务;云端环境按Sandbox yaml部署,配置kubectl流量转发和百炼Api - key即可。

阿里云发布 Agentic OS:首个面向 Agent 的操作系统
阿里云发布首个面向Agent的操作系统Agentic OS
2026年3月30日,阿里云推出面向AI Agent的操作系统Agentic OS。它围绕Agent能力,内化运行优化、安全执行等能力,解决智能体痛点,标志计算范式转变。其架构借鉴分层思想,让Agent在统一设施运行。核心突破有:提供原生Skill化封装,降低Token开销;推出Copilot Shell,实现一句话拉起和全程可观测;以AgentSecCore为核心提供四大安全防护。该系统已在阿里云ECS上架并在GitHub开源。

BizGenEval:为商业视觉内容生成建立一把真正有用的“标尺”
微软亚洲研究院推出商业视觉内容生成基准测试BizGenEval
近年来图像生成模型发展迅速,但现有评测基准缺乏对商业设计场景的评估。微软亚洲研究院推出首个面向商业视觉内容生成的系统性基准测试BizGenEval。它围绕五类商业视觉文档类型,构建四个关键评估维度,形成20个评估任务。数据构造采用“人工精筛 + 专业打磨”,评估机制提出结构化检查清单式体系。对26个主流模型评测发现,商业视觉内容生成能力已分层,头部领先但多数模型距真实商业场景有差距,当前模型短板在“可控性”和“可验证性”。BizGenEval为产业指出优化方向。

Agent Skills:打通可复用专业领域知识的最后一公里
Anthropic推出Agent Skills打通专业领域知识最后一公里
文章介绍了Anthropic Agent Skills的发展、定义、应用场景、实践与生态。2025年10月,Anthropic推Claude Skills功能解决通用大模型垂直场景问题;12月开源Agent Skills SpecificationV1.0并发布SDK。截至2026年初,公开Skills超10万。它是含元数据等的文件集合,核心文件SKILL.MD分YAML元数据和Markdown指令。适用于需专业领域知识场景,可让大模型成领域专家。与Prompt、MCP协同,将AI工作流产品化。文中以生成周报为例展示实践,用Qoder CLI替代Claude Code,按SKILL流程生成周报。Skills生态正爆发式增长,如Skills.sh每小时新增550+技能。它重塑与AI协作的能力、工程、交互维度,让AI成行动专家。

Sam Altman:一个人,也能做出一家大公司
Sam Altman确认一人打造十亿美元公司已成现实
2026年4月3日,Sam Altman访谈确认一人打造的十亿美元估值公司已出现。过去复杂业务需团队合作,如今个人借助AI可跑通商业闭环,岗位职责界限渐失。如小龙虾OpenClaw创始人、澳大利亚男子、主持人等案例,都证明个人能完成原本需团队的业务。变革驱动力在于工具能力跃升,现在工具能连续执行任务,且算力集中、模型成熟。Sam建议创业者成AI专家,有心理韧性等。当执行力不稀缺,“做什么”和“为何做”成关键,公司和工作边界在重新划定。

当AI不再只是工具,而是真正懂你的伙伴
作者分享使用ColaOS体验,认为AI可成工作伙伴
本文作者分享使用ColaOS的体验,指出当前AI助手多为工具,存在记忆缺失、缺乏陪伴感、无法真正干活等问题。而ColaOS是操作系统,能操控电脑完成任务,有记忆能力,通过语音交互。它以“你说目标,我来实现”为逻辑,能完成项目交付,还能主动关怀用户、给出判断。使用它后,作者工作方式改变,效率提升、思维转变,有更多精力从事创造性工作。作者认为AI操作系统或成新常态,将带来软件使用门槛降低、工作定义改变等影响。

美国首个AI自主开处方获批,外科医生+技术大神4000万美元赌对了什么?
Doctronic获4000万美元融资,成美首个AI自主开处方公司
美国AI医疗创业公司Doctronic获4000万美元B轮融资,1月成首个用AI自主开处方获监管批准的公司。美国医疗可及性差,药物依从性问题严重,供需失衡。Doctronic由技术与临床背景人员创立,以解决医疗可及性为核心,其产品是医疗系统“数字前门”。技术上采用多agent架构,建机器可读临床指南库,准确性高。从处方续配切入获监管突破,建立真人医生网络,效率高成本低。增长快,业务从A轮到B轮超高速发展,未来将扩大AI自主权,推进B2B合作与国际扩张。

全网爆火的大模型AI知识库,保姆级教程来了
Datawhale分享打造大模型AI知识库的保姆级教程
本文介绍构建大模型AI知识库的教程。Karpathy分享用AI构建个人知识库思路,引发关注。博主Nick Spisak给出实现教程:先创建项目及三个子文件夹;将各类资料放入raw/文件夹,无需整理;用Vercel Labs的agent - browser自动收集网页内容存到raw/;在根目录创建说明文件让AI知晓整理规则;用AI工具按规则将raw/内容编成wiki/;有一定文章量后可向AI提问并保存答案;定期让AI审查wiki/防止错误积累。工具选择上,简单结构更实用。

Andrej Karpathy:完整LLM wiki 构建提示词! 基于Obsidian+AI Agent的个人知识库完整构建指南
Andrej Karpathy发布基于Obsidian+AI的个人知识库构建指南
Andrej Karpathy提出基于Obsidian+AI Agent构建个人知识库模式,并给出详细指南。核心理念是让LLM持续构建维护持久Wiki,区别于传统RAG。系统分原始资料、Wiki、约束架构三层。日常操作包括摄入资料、查询、代码审查等,还有索引与日志辅助导航。还介绍了可选工具、技巧窍门,此模式因LLM维护成本低而有效,文末给出行动指南。

微软加速打造自研尖端 AI 模型
微软加速打造自研尖端AI模型,目标2027达先进水平
2026年消息,微软计划明年前开发大型、尖端AI模型,以构建替代OpenAI和Anthropic的强大工具。微软AI首席执行官穆斯塔法·苏莱曼称,到2027年目标是达最先进水平,涵盖多模态模型。其团队推出语音转录模型,比部分竞品准确,将支持微软产品。微软加大计算能力投入,去年10月部署英伟达芯片集群,未来12到18个月提升计算能力。此前开发受与OpenAI合同限制,该条款已取消。苏莱曼职责转至模型研发,微软首席执行官强调未来三到五年实现AI自给自足,也会继续托管其他公司模型。

完整版|奥特曼最新2万字长访: OpenAI和人工智能的终局 | 图解+视频
山姆·奥特曼访谈探讨OpenAI及AI发展终局问题
这是对OpenAI负责人山姆·奥特曼的深度访谈。访谈回顾其创业历程,探讨AI发展现状与未来。AI发展从“朋克摇滚”式转向系统化,算力稀缺使OpenAI关停SORA,聚焦“下一代自动化研究员”和个人智能体。AI应用有救助宠物狗案例,但带来安全挑战,需构建防御体系。在国家安全上,奥特曼认为政府应比AI公司强大,OpenAI选择与国防部合作。他担忧AI时代教育问题,认为人类成长需“磨练”。未来人类注意力和情感连接将成稀缺资产,他构想新版社会契约,让人人凭公民身份拥有资本主义资产所有权。

AI 7天干完博士生一年的活!西湖大学开源:自动化科研神器DeepScientist!
西湖大学张岳团队开源自动化科研神器DeepScientist
2026年4月3日,西湖大学张岳团队全面开源自动化科研工作系统DeepScientist V1.5。该系统可本地运行,能全方位处理科研任务,包括读文献、改代码、跑实验、写论文等,让原本需博士生一年完成的工作7天即可完成。它能忠实执行命令,复现论文、调试代码、分析数据、撰写论文。还具备本地交互和实战能力,可随时汇报进度,沉淀研究经验,产出超越人类专家的论文,在多个领域取得SOTA成绩。此外,该系统部署简单,1分钟即可完成,项目已在GitHub开源。

Gemma 4 现已发布: 同等规模下性能最强的开放模型
Google DeepMind发布同等规模性能最强的开放模型Gemma 4
2026年4月3日,Google DeepMind推出Gemma 4,这是最智能的开放模型。它基于与Gemini 3相同技术,有E2B、E4B、26B MoE、31B Dense四种规格。31B和26B模型在Arena AI文本排行榜名列前茅,单位参数智能水平高。E2B和E4B模型重多模态能力和低延迟。Gemma 4具备高级推理、智能体工作流等特质,模型权重适配各类硬件。它采用Apache 2.0许可发布,遵循安全协议。开发者可在多平台获取、定制和扩展该模型,还能参加Gemma 4 Good挑战赛。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语
美团发布原生多模态模型LongCat - Next并开源
2026年4月2日,美团发布原生多模态模型LongCat - Next并开源。文章指出物理世界信息由图像、声音、文字交织,当前大模型以语言为中心,而LongCat团队探索让AI用统一方式处理多模态信息。LongCat - Next有三项核心技术:DiNA架构统一多模态底层建模,解决理解与生成不一致问题,实现模态内化;dNaViT技术将图像离散化为可建模Token,支持任意分辨率,实现图像理解与生成闭环;通过构建SAE表征基础和多级残差向量量化,实现语义完备离散表示。该模型在多维度表现优异,验证了离散模型在细粒度感知、理解生成协同等方面的潜力,最后美团开源模型及分词器,期待推动原生多模态智能发展。

能思考、会规划、自主执行:真正的 AI 智能体,已经能替你干活了
NVIDIA讲座拆解智能体式AI本质、应用及搭建方法
本文基于NVIDIA GTC大会「Agentic AI 101」主题讲座,系统拆解智能体式AI。首先对比其与传统聊天式AI差异,指出Agentic AI能自主执行任务。前沿闭源和开源模型实现双重突破,降低开发门槛。其核心构建模块包括规划、工具使用、记忆、评估。讲座还列举软件开发、知识调研等落地场景的价值案例,最后介绍从零搭建应用的实操步骤,强调当下是入门好时机。

Claude Code是怎么知道你在骂他的?这 12 条发现值得关注
Chaofan Shou发现Claude Code源码,揭示12条有趣发现
2026年3月31日,Chaofan Shou发现Claude Code的NPM包包含完整未混淆源码。从中有12条发现:有完整电子宠物系统,具备多种物种、抽卡稀有度等;Anthropic员工给开源项目提PR有“卧底模式”;用正则检测用户是否骂它及是否让其继续干活;内部PR显示“几次提示搞定”;物种名用十六进制编码避扫描;源码注释记录运维事故;泄露内部代号体系;模型靠Prompt打补丁;权限系统有“YOLO Classifier”;Feature Flags泄露产品路线图;Bun编译器会静默删代码;print.ts或为LLM生成代码质量上限样本。文章创作经选题、调研、初稿、多角色Review、准确性核查、修改定稿等环节,人类仅做方向性干预。

Claude Code 源码里有意思设定:伪造、投毒、封号
Anthropic泄露Claude Code源码,暴露多项设定及封号逻辑
2026年Anthropic泄露Claude Code源码,暴露诸多设定。反蒸馏方面,有插入假工具和处理文本摘要两种机制;Undercover mode可去除暴露内部背景信息;用正则表达式检测用户挫败感;Native client技术校验请求来源;auto - compact失败会浪费API调用,解决方案是限制连续失败次数;KAIROS是未发布的自治型后台代理模式;渲染做了性能优化;bash安全检查严格;多代理协调靠系统提示词规则。还分析了封号逻辑及数据采集体系,此次源码泄露或使Anthropic调整策略,目前超8000个相关仓库被删。

多领域最佳性能,阿里模型三连发
阿里巴巴发布Qwen3.6 - Plus等三款大模型
2026年4月2日,阿里巴巴千问发布新一代大语言模型Qwen3.6 - Plus,其性能较3.5进步显著,编程能力强,工程落地能力卓越,具备原生多模态能力,支持百万词元上下文窗口。本周还发布全模态大模型Qwen3.5 - Omni,在音视频理解等215项任务中性能最佳,有音视频Vibe Coding能力;图像生成与编辑统一模型Wan2.7 - Image,能“千人千面”,具备全链路能力、强大组图生成能力和交互式编辑模块。三款模型提升了Agent能力,贴近市场需求,已在阿里云百炼上架,部分接入阿里AI应用和平台。

Nacos 3.2 Skill Registry 正式版发布,让 AI 能力在企业更安全、可控落地
Nacos 3.2 Skill Registry 正式版发布,助力企业 AI 落地
2026 年 4 月 1 日,Nacos 3.2 Skill Registry 正式版发布,助力 AI 能力在企业安全、可控落地。此前,低代码平台灵活性受限,高代码框架幻觉问题突出,而 Skill 成为平衡点,但公开 Skill 市场存在安全隐患。企业落地 Skill 面临安全、权限、稳定性和治理挑战。Nacos 3.2 私有化 Skill Registry 构建治理层,实现企业级 AI 资源控制闭环。它有安全审核、多版本管理、权限管控、全链路审计等功能,还提供多种 Skill 接入与分发方式。Nacos 3.2 与 HiClaw、HiMarket 形成企业私有 AI 管理平台生态。未来,Nacos 期望成为多 Agent 架构网络协作中枢,后续版本还将在资源管理、数据智能等方面持续演进。

AI 应用的下一站,是场景化 | 腾讯会议新功能第一时间评测
腾讯会议智能录制升级,多功能体现AI场景化趋势
文章聚焦腾讯会议智能录制升级。指出当前会议与AI结合成趋势,海外Granola火,国内腾讯会议动作密集。此次升级解决会议纪要上下文丢失问题,让AI输出可溯源,如纪要附时间戳,时间轴分章节。还添加个人笔记功能,方便会后处理信息。AI在会议中角色渐深,从记录到对话,智能录制界面可与元宝对话。其支持多模板总结,有学习笔记、汇报总结等5个模板,不同模板从不同维度整理会议内容,尤其销售场景模板对中小企业意义大,体现AI应用向场景化发展趋势。

逆向深扒Claude Code源码,我发现了什么!?
李伟山逆向深扒Claude Code源码并揭示其核心优势
本文对Claude Code v2.1.88源代码进行深度解析。其优势在于12层渐进式工程包装,核心竞争力体现在工程化、Agent架构、Skills系统三方面。架构上query.ts是核心,核心Agent Loop简洁遵循开闭原则。12层包装机制各有作用,工具系统设计安全,Prompt工程有分层缓存和多种编程技巧。权限、上下文管理、子代理等系统也各有特点。Skills系统按需注入知识,会话可持久化与恢复。还介绍了MCP集成、编译时特征门控。未来将有新模型,KAIROS全自主代理模式待发布,部分功能已实现未上线。最后总结设计模式、工程哲学,为构建AI Coding Agent提供启示,Claude Code正从编程助手向自主开发代理进化。

学习笔记:从 Agent 到 Skills — AI 智能体架构的范式转变
Anthropic推动AI智能体架构从Agent到Skills的范式转变
文章围绕AI智能体架构从Agent到Skills的范式转变展开。首先介绍Anthropic在不到14个月内推出MCP和Agent Skills开放标准,引发行业响应。接着以自动化美化相册项目为例,阐述Agent、Skills、MCP、OpenClaw和A2A等核心概念。对比了Agent、Skills、MCP和OpenClaw的定位、技术架构等。通过实验对比Claude Code和OpenClaw在处理微信驱动的图片营销闭环任务中的表现,得出不同方案的优缺点及适用场景。最后展望未来趋势,如Skills市场化、协议分层标准化等,强调从单体Agent向可组合Skills转变的重要性。

如何在AI时代,找回你被埋没的创造力。
作者分享AI时代找回创造力的经验和方法
文章围绕在AI时代找回创造力展开。作者指出,当下AI工具虽多,但很多人装上后却不知如何使用,根源在于创造力被长期规训掩埋。作者分享找回创造力的经验:一是找到让自己难受的事物,挖掘创造欲;二是主动加约束,如限制工具、时间和范围;三是动手做个烂东西,通过原型思维迭代;四是跨领域收集经验,借鉴其他领域结构;五是每天留30分钟空白时间,让大脑自由联想;六是只为自己爽地创造,摆脱比较带来的习得性无助。最后强调AI时代降低了创造的失败和动手成本,鼓励人们像孩子游戏般去创造。

戴上这枚AI「气味戒指」,通过皮肤气味读懂饮食、运动与健康,准确率可达98.2%
香港科大团队发布AI「气味戒指」监测健康准确率达98.2%
2026年3月27日,香港科技大学等团队在《Nature Communications》发布研究,提出基于微型嗅觉传感芯片的AI可穿戴生物识别戒指。人体皮肤散发的VOCs携代谢信息,戒指能非侵入式读取饮食和活动状态。其核心传感器仅0.0081mm²,攻克灵敏度、选择性、微型化与可穿戴性难题。研发专属AI算法框架,器件性能精度高,KNN模型评估饮食摄入量准确率达98.2%。戒指可提供客观、实时、非侵入性饮食追踪,还能拓展至疾病监测,为数字化健康监测指明方向。

你的蓝牙设备可能正在泄漏你的隐私? Bluehood 如何追踪附近设备并做隐私分析
Bluehood项目展示蓝牙风险并做隐私分析
文章指出日常常开蓝牙可能泄露隐私,如Bluetooth漏洞使设备易被劫持、监听和跟踪。Bluehood作为蓝牙被动扫描和分析工具,能收集分析蓝牙低功耗广播数据,实现设备指纹识别、绕过随机MAC地址追踪、行为模式分析等。还介绍了通过蓝牙广播分析设备信息的例子,如Flipper Zero显示iPhone型号、商场客流分析系统利用蓝牙探针。Bluehood通过被动监听和特征指纹匹配实现功能,代码核心是bluehood/scanner.py,还会分析数据规律,导出实时指标。此外,协议级逆向也常见,蓝牙广播可能泄露隐私,Bluehood直观展示蓝牙出卖信息,解释了精准广告和设备监测的原因。

我们能在培养皿里制造出意识吗?
马修・欧文探讨神经类器官能否产生意识及伦理问题
文章围绕能否在培养皿制造意识展开。科学家培养神经类器官模拟大脑区域,用于多种疾病研究,获美国政府资金支持。马修・欧文关注神经类器官意识问题,他认为布雷特・卡根团队实验中神经元‘感知能力’是适应性反应。论文提出意识本质两种观点,机制论认为复刻神经活动模式类器官会产生意识,主体论认为类器官非完整个体无法产生意识。他还指出类器官产生意识概率大于AI,研究应考虑伦理问题,使用脑类器官比实验动物更符合伦理。

AI时代,教育何往?
腾讯研究院王鹏探讨AI时代教育变革方向
文章探讨AI时代教育走向。AI在标准化认知任务上超人类,冲击教育体系底层逻辑。过去教育核心承诺因人类垄断知识处理能力而成立,如今前提瓦解。教育应随生产力变,当前学校体系与时代需求能力错配。AI引发认知劳动价格崩塌、教育体系承重柱开裂,造成能力错配和认知分流。未来学校职能将转变,文理分科等制度需改革。基础教育应让学生带走学习系统和生存力,选拔逻辑要改写,教师需求更高。此轮AI冲击速度快,教育体系反应不及,人们应主动转向。

裁员 4000 人后,Block CEO 把管理活交给了 AI
Block CEO在裁员4000人后将管理工作交给AI
2月底,Block宣布裁员超4000人,这实际是一次‘重启’。Block管理层通过三个推演得出新人员规模,与常见裁员逻辑不同,这是‘重构’而非‘优化’。公司层级制度源于信息传递难题,而AI打破信息需人中转的限制,使公司内外信息可实时处理。Block将公司层级重新划分为执行者、结果负责人、赋能者三类角色,减少管理层级,管理方式从靠层级关系变为控方向、负结果、带团队,裁掉的是旧的组织方式,这或许只是开始。

失败项目起死回生,a16z为何给这家"追债"公司开出3500万美元支票?
a16z领投Glimpse公司3500万美元A轮融资
文章介绍Glimpse公司获a16z领投3500万美元A轮融资。零售扣款争议是行业痛点,人工处理繁琐,多数品牌放弃小额扣款。Glimpse用AI自动化审查和争议流程,能准确分类、验证扣款,自动提交争议申请,胜率达91%,减少80%人工劳动。其创始团队从失败项目转型而来,2025年业务增长显著。Glimpse已扩展平台能力,未来可能构建“零售财务运营平台”。企业AI应用进入新阶段,Glimpse有望主导零售争议解决品类,未来AI将更多应用于传统行业后台运营。

啃下 Linux 内核最难动的代码:腾讯工程师重构Swap子系统
腾讯工程师Kairui Song重构Linux内核Swap子系统
腾讯工程师Kairui Song主导Swap现代化工程,重构Linux内核Swap子系统。引入swap table替代XArray,性能提升5% - 20%;删除Swap map,统一元数据管理,节省约30%元数据内存开销。还提出Virtual GhostSwap方案实现虚拟Swap空间,统一anon/shmem swap分配路径,消除竞态问题,移除swap cgroup静态数组节省内存。此外,Meta也提出虚拟Swap方案,但存在内存占用增加、复杂度上升等问题。TencentOS团队还在内存管理领域探索,提交MGLRU相关补丁,提升性能、减少OOM问题。

让老手机刷抖音也流畅:我们做对了这三件事
抖音研发团队从三方向优化让老手机刷抖音更流畅
随着业务发展,App 功能增多,给旧手机的体验与稳定性带来挑战。本文介绍抖音从内存、FD、线程三个方向提升旧手机体验。具体举措为:一是 ART 虚拟机 malloc space 扩容,限制 copy gc ,释放 backup space 并创建更大的,最终在 Android 5/6 设备扩容至[740MB,750MB],Android 7 设备扩容至[960MB,980MB],OOM 率降 60.77%;二是 ART 虚拟机 region space 扩容,在原 region space 结束位置后找空间创建,扩容 regions 数组、live-bitmap 等,使 crash 率、卡死率、OOM 率等下降;三是 FD/FD_SET 扩容,扩展内核 fd 限制和 libc 中 FD_SET 上限,解决 android 9 以下版本 FD/FD_SET 超限问题;四是 M:N 透明用户态线程,通过透明代理 pthread、抢占线程执行权、切换上下文等突破线程限制,保障了受 500 线程限制用户的体验下限。

摩根大通 CEO:年轻人面对 AI,3 件事要想清
摩根大通CEO建议年轻人面对AI想清3件事
摩根大通CEO Jamie Dimon在访谈中指出,未来两年内几乎所有公司会因AI裁员,年轻人面对冲击有3件事要想清。一是想清楚自己在市场中的不可替代性,AI重塑岗位,学习能力来自工作环境,要积累不可替代的能力;二是想清真正的“时间窗口”,AI进化非线性,留给年轻人的时间远少于想象;三是想清工作的意义,工作不只为赚钱,要有目标感,明确为何工作。AI演进无法回避,年轻人要做好准备,理解变化并转型。
