Signal #4:复杂度正在离开人,进入系统
过去的软件研发中,复杂问题主要由人来承载:
系统设计、边界划分、异常处理,往往依赖经验更丰富的个体。
复杂度集中在少数人身上,也构成了组织中的关键节点。但随着 AI 参与需求理解、任务拆解、代码生成与验证,原本由人承担的复杂度,正在被逐步外化为结构化表达,并交由系统处理。
执行复杂度,正在从人迁移到系统。
系统一旦开始接管这部分复杂度,原有基于经验和理解建立起来的能力边界,也会随之被重新定义。
变化并不首先体现在执行效率,而是体现在承载复杂度的位置发生了转移。新的分界线也随之出现:
不再是谁更会做,而是谁能把问题转化为系统,并让系统稳定运行。当执行复杂度被系统接管后,系统复杂度开始变得更清晰,也更关键。

基于 Cursor Agent 的流水线 AI CR 实践|得物技术
得物技术实践基于Cursor Agent的流水线AI CR
得物技术介绍基于Cursor Agent的流水线AI CR实践。传统人工代码审查面对大规模变更效率低,AI审查可补充不足。前端研发现有质量保障工具存在漏触发、成本高、误报率高等问题。通过对比分析,采用Cursor Agent CLI在流水线中增加AI CR任务,自动触发检测并生成报告。报告含问题分类和操作,支持添加评论、AI智能解决等。推荐尽早创建MR,结合AI和人工审查。内置提示词工程保障代码质量,优先选Compose 1.5模型。实践表明,有效问题挖掘率达50%,后续将融合报告到IDE插件。

Flutter 鸿蒙 2026 路线发布,加速同步官方生态,进一步优化体验
Flutter鸿蒙社区发布2026年路线规划,加速同步优化体验
2026年3月17日,Flutter鸿蒙社区发布2026年路线规划。目标是让Flutter - OH与官方版本同步不再滞后,提升用户体验。未来将按季度跟进发布,缩短版本落差。2026年由Flutter SIG推动维护,有短期和中期目标。因2025年测试中Flutter - OH在鸿蒙上表现有差距,2026年将进行性能专项优化,包括内存、负载、编译器层等方面。还会增强调试工具链,完善系统特性场景,如平行视界、P3广色域、密码自动填充等。规划适配至少200个高优先级三方库,加强开源治理,完善开发文档等。

Android 禁止侧载将正式实施,需要等待 24 小时冷静期
谷歌9月起限制Android应用侧载,设24小时冷静期
2026年9月起,谷歌将通过开发者验证计划限制Android应用侧载。开发者需提供身份证明、上传签名密钥副本并支付25美元进行验证,未验证应用无法安装。不过,谷歌提供了高级开发者流程,开启开发者选项、输入密码、重启手机后等待24小时,可选择暂时或无限期允许安装未验证软件包。今年9月,开发者验证将在巴西、新加坡、印度尼西亚和泰国率先实施,谷歌认为用户在Google Play商店外感染恶意软件风险是内部应用的50倍,且已向全球设备推送验证器,集成到Android 16.1系统。

AI Coding前端实践后的复盘总结
淘天集团天猫前端团队复盘AI Coding前端实践
文章是对AI Coding在前端研发实践应用的复盘。AI在标准化场景能提升效率,但在复杂业务有局限。实践中存在目标不清晰、信息不全面等问题,需优化提示词、更新知识库。AI Coding工具也有依赖高质量prompt、上下文理解有限等局限。未来AI将融入开发流程,开发者要提升Prompt能力与人机协同能力。

突破手机边界 | JioHotstar 如何针对折叠屏与平板设备优化用户体验
JioHotstar针对折叠屏与平板设备优化应用提升体验
JioHotstar是印度领先流媒体平台,用户超4亿。为给广大受众提供优质体验,它针对可折叠设备和平板电脑优化应用。团队先评估现有应用,实施两次战略更新,解决大屏挑战。其优化策略包括引入WindowSizeClass创建优化布局,用Material 3 Adaptive库调整界面;在可折叠设备上提供桌面模式,通过currentWindowAdaptiveInfo()函数查询并调整布局。目前,JioHotstar符合大屏应用质量指南“第一层级 (Tier 1)”标准,还增加视频发现页面触摸点击区域,实现视频详情页自适应,优化导航功能,为用户带来极致观看体验。

全体起立!AI 版 Chrome 正式推出!前端开发进入新时代!
Chrome团队推出WebMCP,升级前端开发模式
2026年3月16日,Chrome团队推出WebMCP,可在Chrome 146预览版体验。它让AI绕过前端UI与Web应用内核对话,使AI与网页交互从视觉模拟到逻辑直连。此前主流AI Agent操作网页方式笨且脆弱,WebMCP将其淘汰。它由谷歌和微软共建并开源,前端用JS就能实现,提供声明式和命令式API。其核心是网站主动提供操作,控制权归开发者。若成通用标准,Web将分层,重构依赖网页操作的场景,升级前端价值。

写 skill 全靠感觉?新版 skill-creator 用数据说话
Anthropic新版skill - creator用数据驱动技能迭代优化
文章围绕新版skill - creator展开,介绍其升级情况及优势。2026年2 - 3月,Anthropic官方的skill - creator连续更新,架构和设计思路重写,从“教程式”指令变为评估驱动的迭代优化框架。它新增三个能力:多代理评估系统,分工给技能打分;基准测试与防过拟合机制,通过train/test分割避免过拟合;描述触发优化,自动优化技能描述提高触发准确率。其核心迭代循环有7个步骤,文章以设计前端页面生成的skill为例,详细展示了启动、采访需求、生成技能文件、创建测试用例与运行评估、使用Eval - Viewer可视化审查、填写反馈与迭代改进的完整流程。评估结果显示,使用skill的测试通过率更高,平均通过率提升13.3%,且主观反馈也更好。新版形成完整迭代闭环,评估更客观,可视化审查方便,还能防止过拟合,让写skill成为工程化过程。

大禹平台:流批一体离线Dump平台的设计与应用|得物技术
得物技术发布流批一体离线Dump平台大禹
得物技术介绍大禹平台,它是流批一体离线Dump平台。当前Dump开发模式采用流批分离架构,存在问题。大禹平台目标是构建流批一体化架构,实现工程效率、数据质量和稳定性保障的突破。平台分管理与后台系统,有调度和执行框架。采用统一DAG编排引擎保障数据质量,支持小全量模式加速数据Dump,支持任务复用实现数据分层管理。管理平台提供任务开发运维和辅助工具。在社区搜索倒排表和穿搭精选推荐链路有应用。未来将增强平台能力,深化协同共建。

Lalamove 代码瘦身实践
Lalamove交易团队开展代码瘦身计划并分享实践经验
Lalamove国际化业务代码臃肿影响质量和效能,2025年初交易团队启动“大扫除”代码瘦身计划。瘦身范围包括无引用代码、有引用无流量方法、无用DB属性和无效Apollo配置。团队开发3种工具精准识别无用代码,如SA插件利用Spoon和Hotspot VM SA统计分析,BigClean Scanner插件扫描无引用代码,Mybatis Inteceptor拦截器识别DB废弃字段。清理中删除超30%无用代码和100+废弃DB字段,通过读、写接口维度策略保证清理质量。最后强调长期清理意识和有效SOP机制重要性,建立长效通知和监督机制。

时间线拉模式的具体应用
李双、赵冰洋团队基于MMap实现sns feed索引存储系统
文章围绕时间线拉模式展开,先介绍Feed流及关注流实现方式,指出推模式弊端,引出拉模式。对比MySQL、redis等拉取方案,发现MMap文件存储性能更优。基于此设计sns feed索引存储系统,采用二级索引、全量数据入内存和数据落地方式,有初始化、索引生成等模块。该系统解决推模式诸多问题,已成功运行5年。改造后部分指标提升,如大V发feed查看近乎实时、占用redis空间大降等。还提及优化方向,包括内存索引文件冷热分离、考虑推拉结合及通用化出SNS - FileStorage平台。

高可用架构的工程智慧
京东针对电商系统存储层建设高可用架构并升级多业务系统
文章探讨电商系统高可用架构设计,聚焦存储层高可用建设。先介绍高可用架构目标与范式,分析电商业务数据分流水型和状态型。针对流水数据,通过统一单据号生成规则和路由数据库实现无感知扩容和容灾;状态数据按读写特点采用不同策略。单存储节点用多副本机制保障高可用。多机房场景下,将新增流水数据路由至新库规避同步延迟。最后列举京东多个业务系统架构升级案例,展示高扩展性和高可用性架构建设成果。

悠悠有品:RocketMQ 稳扛核心交易,Kafka 驱动海量数据,支撑高并发游戏饰品交易平台
悠悠有品采用阿里云消息队列支撑高并发游戏饰品交易
悠悠有品是游戏生态服务企业,业务增长带来高并发等挑战。其采用阿里云PaaS服务构建云原生架构,引入RocketMQ和Kafka分别解决交易与数据链路问题。但运维仍有挑战,如交易链路面临高并发冲击、稳定性要求高,数据同步链路有实时风控要求高、同步可靠性不足等问题。为此,采用阿里云云消息队列RocketMQ版和Kafka版,前者保障交易链路,后者激活数据链路。方案使悠悠有品在性能、成本和业务价值上均有提升,为行业提供可复用范式。

为什么 PRD + 设计稿,无法支撑 AI 时代的研发协作?当 AI 开始参与研发流程:产设研协作可能会如何变化?
文章探讨AI时代产设研协作变化及Task IR应用
文章基于企业实践探讨AI时代产设研协作变化。传统研发中产品、设计、研发团队分工明确,但AI参与使研发部分环节自动化,引发协作方式是否需重新定义的问题。执行者从人扩展到系统,需求需新表达方式。未来研发系统或分三层,设计资产可能成重要输入。需求建模将自然语言转化为结构化描述,Task IR是需求与执行间的中间层,能让需求被系统理解执行,研发流程或从“信息传递”转向“结构共建”,软件工程核心或从“实现代码”转向“表达问题”。

线上崩了,谁先知道?
团队推出「星盾」智能监控系统保障线上业务
文章围绕线上监控展开,先指出业务监控存在无统一标准、误报多、维护成本高、发现响应滞后等问题。为此推出「星盾」智能监控报警系统,它面向业务场景,能对全链路做分钟级监控与即时告警。其采用四层架构,配置简便。创建监控项需收全多端数据、明确用户行为指标、做精细筛选;添加看板用于参考与定位;创建报警项来定义异常与通知方式。接入AI通用分析可避免手动阈值的滞后和应对流量变化问题。还介绍了监控数据的补充机制,上线后在APP平台和其他业务方都有显著成效,实现先于用户发现问题。

龙虾🦞完全卸载教程,来了!
Datawhale开源团队发布OpenClaw完全卸载教*
文章由Datawhale开源团队发布,介绍OpenClaw卸载教程。因有人使用后觉得无用或被权限吓到,甚至出现付费卸载服务,还有Meta安全总监遇异常。教程分情况,若配置乱用openclaw reset;若不再用,按官方流程。先开终端,Windows按Win + R输cmd等,Mac打开或搜索“终端”;再执行openclaw uninstall --all --yes清服务和数据,可先预演;接着删CLI工具,如npm rm -g openclaw;最后重启电脑,作废旧API密钥。还提醒参考官方文档。

IDEA +阿里 Qoder = 王炸!!
阿里Qoder与IDEA结合助力后端开发提效
文章介绍阿里Qoder与IDEA结合的开发优势,先指出后端开发者阵营,作者属混合派。接着给出Qoder JetBrains插件安装配置教程。通过两个实战案例展示其效果:一是优化电商订单查询接口,传统需一天,Qoder 10分钟搞定,精准定位问题,给出多方案并完成实施、测试;二是重构退款模块祖传代码,传统需2 - 3天,Qoder半天完成,梳理逻辑、重构代码、迭代功能,还沉淀记忆。最后分析Qoder核心能力,对比传统方式优势明显,同时提醒开发者要学习底层原理、阅读经典、培养架构思维。

用去年 github 最火的 n8n 快速实现自动化推送工具
文章教用n8n快速实现内容自动推送工具
本文介绍用2025年GitHub热门项目n8n搭建内容自动推送流程。先说明准备工作,包括n8n环境(本地Docker部署或云端服务)、推送平台(如飞书)、文章源及可选的大模型接入;接着给出流程概览,含定时触发、获取文章列表、控制数量、调用大模型评分、发送消息等;详细阐述各步骤配置,如定时触发频率、RSS URL、大模型请求格式等;还提及可选优化,如评分推送、多源整合等;最后总结n8n能零代码或少量代码实现自动化推送,提升效率。

产品经理 6 大热门 Skills 推荐
TRAE用户运营推荐6款面向产品经理的热门Skills
文章由TRAE用户运营小菠撰写,介绍6款面向产品经理的热门Skills。brainstorming可将模糊想法转化为清晰方案;write - a - prd能生成结构化PRD文档;writing - plans把需求拆解为执行计划;ab - test - setup设计专业A/B实验;analytics - tracking建立数据追踪体系;onboarding - cro优化新用户激活流程。还介绍了在TRAE中手动导入和命令行导入Skills的方法,并欢迎读者留言提场景需求。

58RN 容器启动优化:从秒开到毫开的实践
58同城团队优化RN容器启动,实现从秒开到毫开
本文分享58RN容器启动从秒开到毫开的优化实践。此前秒开方案解决了资源、框架、业务数据准备问题,但容器创建与启动仍是瓶颈。通过在启动链路关键节点打点,发现88.3%时间消耗在RN框架内部,且路由到初始化有379ms空等。优化分四步:提前初始化,消除空等;预加载基础资源;引入容器缓存机制复用容器;预创建完整RN容器放入预热缓存。同时解决了复用带来的返回键失效、路由参数错误等问题。最终冷启动从1.78s降至0.8s,热启动从1.1s降至0.33s。

快手编译优化实践:C++编译优化助力业务性能平均提升10%,Propeller优化方案合入LLVM社区
快手编译器团队进行 C++编译优化,方案合入 LLVM 社区
本文介绍了快手在编译领域的优化实践。快手编译器团队通过 KBuild 提升研发效率,从 IPC 等维度考量编译优化。其 C++编译优化覆盖全流程,在重点业务覆盖率超 30%。为应对编译挑战,采用了 AutoFDO、ThinLTO、BOLT 和 Propeller 技术。AutoFDO 支持流水线 Profile 文件;ThinLTO 引入自研构建系统,将链接时间从小时级降至秒级;BOLT 解决了与 AutoFDO 无法叠加的问题;Propeller 通过 Match & Infer 解决了过期 profile 和与 AutoFDO 协同优化的冲突。目前编译优化带来 10%左右的 CPU 相对收益,延迟降低 4% - 8%,编译时间无显著增加,相关核心代码已合入 LLVM 社区。此外还介绍了团队岗位及要求。

劝软件企业CEO躬身入局
文章劝软件企业CEO躬身入局AI变革
文章发表于2026年3月21日,劝软件企业CEO在AI浪潮中躬身入局。先举硅谷巨头CEO亲力亲为参与AI实践的例子,说明他们深知AI重要性。反观国内,很多企业掌门仅空谈AI战略,依赖专家,未深刻实践。如今AI大潮与以往不同,不仅重塑技术,还颠覆思维和组织。因此劝CEO破除旧念,成为首席AI官,亲手试用AI模型、深入学习底层逻辑,引领企业变革,开创“软件工程3.0”新纪元。

AI能写PRD、画原型了,产品经理还剩下什么?
豆芽悟探讨AI时代产品经理价值与升级路径
文章围绕AI能写PRD、画原型背景下产品经理的价值与发展展开。先指出现状是AI相关应用使产品经理焦虑工作替代问题。接着将产品经理工作分三类,信息搬运和逻辑推演AI能做部分,判断决策型AI目前无法胜任,强调产品经理核心价值是连接技术与用户,在不确定性中决策。最后给出升级路径,包括成为出题人、理解业务、成为决策者,提醒产品经理找到自身真正价值。

数据团队每证明一次AI提效,编制就少一个
数据团队用AI提效却面临编制削减,给出应对叙事法
文章指出数据团队用AI提效后编制常被砍的现象。以年底复盘会为例,团队证明AI提效后编制削减。全行业汇报多聚焦‘降本增效’,却未意识到这为砍编制提供依据。这是因CIO需交差、CFO和HR关注成本、业务方提高预期、数据团队自我折价,形成‘点钞机陷阱’。设计AI价值评估框架也难改变现状。文章给出‘夜视仪叙事三板斧’,包括汇报侧重‘多做的事’、绑定效率红利再投资、立项挂‘三张清单’,还提供三套会议室沟通话术,强调叙事能改变他人看法,避免团队被误判。

黄仁勋:AI 热闹过后,什么人更值钱
黄仁勋谈AI发展后何种人才更具价值
2026年3月19日GTC大会期间,黄仁勋在播客谈及AI发展及人才价值。AI两年跨越三阶段,从生成式到智能体,OpenClaw体现其执行能力,进入工作场景带来颠覆。公司选人以算力消耗为标准,投入算力可放大工程师价值。他认为工具进化让专业人士更值钱,但要会用工具。年轻人应成AI深度专家,有专业深度且擅用AI的人未来更值钱。

Claude code 产品经理Cat Wu亲述:我是如何用AI彻底重构PM工作流的
Claude code产品经理分享用AI重构PM工作流经验
Claude code产品经理Cat Wu分享用AI重构PM工作流的经验。随着模型不断进步,传统产品管理假设失效,需快速实验、持续交付。她介绍自身经历,用Claude Code加速工作。她将工作在Claude.ai、Claude Code和Cowork三款产品间分工。研究显示模型能力提升快,16个月约有41倍提升。团队做出四个转变:短周期冲刺、演示评估替代文档、新模型审视功能、做最简单方案。AI产品要求产品经理放手,各团队自发用工具,组织运转提速。

达摩院 ICLR'26|统一视觉语言模型解决CT理解最大瓶颈
达摩院提出OmniCT统一模型解决CT理解瓶颈
在医学影像理解领域,现有医学大规模视觉语言模型(LVLM)在CT场景中存在2D切片理解与3D体积感知割裂问题,成为向真实临床场景演进的瓶颈。达摩院提出统一的slice–volume LVLM方法OmniCT,通过空间一致性增强(SCE)与器官级语义增强(OSE)两大模块,构建统一语义表示空间,还构建了最大的slice–volume CT混合数据与评测体系MedEval - CT。实验表明,OmniCT在多个2D与3D基准上显著领先,验证了统一建模范式的有效性。

【原创】基于Spec驱动的AI工程化开发指南
黑夜路人发布基于Spec驱动的AI工程化开发指南
文章围绕基于Spec驱动的AI工程化开发展开,旨在将AI Agent升级为可靠开发伙伴。先阐述工程化方案的必要性,指出多Agent协作存在效率和可靠性问题,需工业级方案保障交付质量,并说明适用场景。接着介绍开发各阶段要点:开发前定制Agent环境,包括Rules规则和Skills技能;需求分析与规划阶段,让Agent理解代码库、澄清需求、评审设计方案并生成执行计划;编码阶段注重上下文管理、TDD驱动、并行开发与多Agent协作及后台委托;Review阶段进行多维度审查;测试验证阶段开展接口、集成、E2E测试并生成报告。最后总结全链路质量保障体系原则,还建议将有效提示词沉淀为Skill。

从“工具”到“伙伴”:智能体技术发展前瞻
可心AI发布智能体技术发展前瞻分析
文章围绕智能体技术发展展开,指出其正从“会回答问题的模型”升级为复杂系统,能力向“体系化”迁移。架构上从单体到分层模块化,利于反思纠错,未来是神经符号与元认知组合。学习范式呈现从被动到主动、多模态成标配、终身学习三条主线。协作方面,多智能体进入“社会化协同”,但信任成关键难题。安全治理要把“可信”写进原则、增加风险管理手段、规范“人在回路”。研判指出智能体将走向“体系智能”,C2重构,对抗升级。未来五年,其上限取决于工程体系搭建和稳定性,下限是确保可控。

bili2txt-agent开源,一键解决B站视频内容的自动转录和结构化处理问题,效率提升300倍
bili2txt - agent开源,解决B站视频转录和结构化处理问题
2026年3月16日开源的bili2txt-agent,可一键将B站视频转录并结构化处理成飞书文档,效率提升300倍。它采用模块化流水线架构,经视频解析、音频提取、语音识别、AI精转和文档生成五个阶段。该工具零学习成本,有音频下载快、多语言支持等亮点。使用时需进行环境准备、API密钥和飞书机器人配置,可通过飞书机器人交互或命令行调用。实战案例显示其能大幅提升效率,还对常见问题给出解决方案。

腾讯出手,第一个小龙虾安全管家它来了。
腾讯推出首个小龙虾安全管家,防护功能全面
2026年3月16日,腾讯推出首个专为OpenClaw打造的小龙虾安全管家,它是腾讯电脑管家的一个功能。该管家封装了Skills保护,涵盖脚本、端口、文件保护等。它能记录小龙虾操作日志,方便回溯复盘。其防护全面,包括Skills安全检测、文件安全保护等。如Skills检测可拦截三方镜像站恶意下载;文件保护可手动添加文件夹,限制OpenClaw修改删除。此外,还能防公网暴露,有一键傻瓜扫描功能。作者认为这是目前小龙虾安全最完整、适合普通人的方案,推荐用户安装。

做RAG这一年,最后悔的就是上知识图谱
作者提出MDER - DR框架解决RAG知识图谱问答难题
文章围绕基于知识图谱的RAG在问答任务中的问题展开。指出传统三元组索引会丢失上下文语义,影响多跳推理性能。作者提出MDER - DR双阶段框架,MDER采用四步策略生成上下文感知实体摘要,避免检索阶段显式遍历图边,提升检索效率;DR用分解 - 解析迭代推理策略,由大语言模型驱动,能处理复杂数据。实验表明,该框架比传统RAG基线最高性能提升66%,有跨语言鲁棒性和泛化能力,具备保留语义、优化效率、适应性强等优势,为知识图谱问答提供新思路。

性能飙升42%!人大&字节开源10万级 SWE数据集 Scale-SWE
人大&字节开源10万级SWE数据集Scale - SWE
2026年,人大与字节开源10万级软件工程(SWE)数据集Scale - SWE。它用“沙盒多智能体”工作流从GitHub仓库构建真实SWE任务数据。基于该数据集微调的Qwen3 - 30A3B - Instruct模型在测试中获64%高分。与合成数据相比,Scale - SWE任务类别分布更均衡。它还解决了构建真实SWE数据集的三大难题,通过三种智能体分别实现环境配置自动化、单元测试生成和防泄露问题描述。实验显示,基于Scale - SWE训练的模型性能显著提升,超越多个模型,且其数据优势明显,有望降低SWE方向AI研究门槛。

AI 编码 3.0:人机协作,正在走向多 Agent 协作系统化
AI编码迈向3.0,多Agent协作系统化变革软件交付
文章指出AI编码正从2.0走向3.0,即从人机协作迈向多Agent协作系统化。AI编码2.0解决代码生成问题,而3.0关注系统如何组织AI完成软件交付。当Agent进入交付流程,协作需从经验驱动转向模型驱动。Harness Engineering让执行更可控,Kanban成为控制平面,承担执行控制职责。多Agent系统核心是编排与约束,多Agent协作形成被验证驱动的执行链路。AI编码3.0使软件交付从‘能力问题’变为‘系统问题’,是工程范式的转变。

Entrix 开源了:我们如何用反熵机制治理 Vibe Coding
Entrix 开源并分享用反熵机制治理 Vibe Coding 方法
文章围绕 Entrix 开源,讲述用反熵机制治理 Vibe Coding 的方法。此机制源于 Routa 实践,核心围绕规则定义、质量门槛等。Vibe Coding 虽提升局部速度,但使系统整体可信度判断模糊、完成条件漂移,旧的完成条件和覆盖率指标不再适用,隐性判断权失效。Entrix 将反熵路径分为五个阶段,把规则、证据写进仓库,解释收进执行器。其意义在于重新设计判断结构,让系统从检查器向调度器转变。最后总结出四点方法论,强调 Vibe Coding 需要新的治理基础设施。

【养虾人必读】告别黑盒!让你的 OpenClaw 像水晶一样透明
字节跳动火山引擎发布OpenClaw观测插件提升可观测性
2026年,多会话、多sub - agent并行的OpenClaw使用中存在可观测性问题。火山引擎APMPlus的apmplus - openclaw - plugin插件可将其执行过程变为全链路“白盒”。它提供MTL联动观测方案,有原生支持Sub - Agent全链路Tracing、日志与Trace丝滑联动、跨端指标兼容并包等亮点。还具备监控与告警体系。通过并行查询慢、Token花费异常、工具操作失败等场景,展示其排障优势。接入方式简单,具有极简接入、开箱即用等特点,可从故障定位效率等维度衡量其价值。

OpenViking 实战教程:搭建多仓库代码语义检索系统,赋能 AI 助手 & OpenClaw 记忆插件 2.0 升级
字节跳动Viking团队开源OpenViking并升级记忆插件2.0
文章围绕OpenViking展开,先指出多仓库代码问答存在上下文缺失、语义检索低效、信息过载等问题,引出OpenViking。介绍其可搭建多仓库代码语义检索系统,实现聚合代码、语义索引和赋能AI助手。测评表明引入它后问答效果显著提升、成本降低。还给出安装启动步骤,包括环境和模型准备、安装Python包、配置Server和CLI等。说明了导入多仓库资源、在Agent中启用其能力、与聊天机器人集成的方法。此外,OpenViking面向OpenClaw记忆插件2.0升级,简化安装部署,最后号召开发者共建开源生态。

软件为何越做越乱?万字长文讲透软件的“复杂性”
大淘宝技术团队剖析软件复杂性及管理方法
文章以电商系统“限时折扣”功能为例,剖析软件越做越乱的原因是复杂性累积,由无数小妥协叠加导致。文中阐述复杂性表现为变更放大、认知负荷加重、未知的未知增多,原因是依赖和晦涩。对比了战术性编程与战略性编程,强调战略性编程需有投资心态,建议将10% - 20%开发时间用于优化架构。还介绍管理复杂性的方法,如抽象和细节处理、设计深模块、信息隐藏、合理选择通用或专用实现、处理分层抽象问题、简化异常处理逻辑等,同时提及准备PlanB、迭代型重构、保持系统一致性、使代码易于理解、警惕过早优化性能等要点。

从 “上门安装” 到 “上门卸载”:OpenClaw完全卸载指南!
程序员小灰发布OpenClaw完全卸载指南
文章围绕OpenClaw卸载展开。先指出其存在安全隐患和使用成本高的问题,建议升级或卸载。接着介绍卸载步骤,先验证安装,再按标准流程卸载,包括停止服务、删配置文件等。还提及特殊场景处理,如强制清除后台偷跑、清除多环境分身。最后通过命令验证卸载,强调安全收尾,如删浏览器扩展、重置密钥等,以规避风险。

谷歌开源官方CEL Python库,对测试工程师意味着什么?
谷歌开源CEL官方Python库,为测试人员带来实用工具
2026年谷歌开源cel-expr-python项目,它是通用表达式语言CEL的官方Python实现。CEL以简洁等为理念,已成策略执行等场景主流技术,此前Python生态仅有社区非官方版本。cel-expr-python基于C++核心封装,有语义一致、自动同步升级优势,使用轻量易上手。它对测试相关从业者有实用价值,如替代自定义校验解析器、简化多语言项目测试、提升稳定性、无缝集成Python生态、降低维护成本等,完善了CEL跨语言生态。

英伟达GPU全系列硬核科普手册:一文读懂NVIDIA芯片的定位、规格与应用场景
腾讯程序员发布英伟达GPU全系列硬核科普手册
文章是英伟达GPU全系列科普手册。介绍覆盖消费级、工作站、推理卡、训练卡及中国特供版五大产品线,核心逻辑围绕显存、算力和互连带宽。阐述架构演进史、命名规则、核心概念等内容,还从多方面对比各产品线参数、性能,给出算力排行,最后提供应用场景推荐、模型参数与GPU选择对照及选购决策指南,助读者秒变选型高手。

同样的模型,为什么大佬做出来的游戏比你的好十条街?|对话 TapTap 制造负责人姜黎
TapTap制造负责人谈游戏开发Agent优势及发展
文章围绕TapTap制造(TTM)这款游戏领域的agent展开。先指出在基础模型能力趋同下,专业数据决定AI项目好坏,TTM能助开发者接近大佬。实测显示,TTM有经典NoCode界面,执行任务时先文档研究,学习专业知识,开发中自主编程、处理问题认真,完成后主动复盘,还支持上传自定义文档和素材,且做好的游戏可直接在TapTap平台发布。对话TapTap制造负责人姜黎时了解到,TTM转向纯代码AI引擎架构,注入专业技能,应对多轮对话问题有方法,对代码隐藏、项目规模等有考量,有拟人化设计,目前无可玩性评估模块,不担心游戏同质化,有独特护城河,现阶段免费,团队大量用AI,AI将给游戏行业带来变革。

AI agent 聊久了就忘事?这个插件让它过目不忘
Martian Engineering推出Lossless Claw插件让AI agent不忘事
文章介绍了Lossless Claw插件解决AI agent聊天忘事问题。AI agent因模型上下文窗口有限,长对话时会丢失早期消息细节。Lossless Claw基于LCM论文,用DAG组织对话历史,消息压缩但不丢弃,原始消息存于SQLite。它为agent配备三个工具用于找回记忆,如全文搜索、查看节点结构和子agent检索。安装需OpenClaw 2026.3.7以上版本,一行命令即可,还可按需改配置。官网有交互式动画助理解原理。实际体验显示长对话不易掉链子,压缩无感且数据本地存储,但安装时可能遇注册顺序bug,升级可解决。该插件由Martian Engineering开发,理论源于Voltropy的LCM论文。

学会“吃一堑长一智",性能飙升11%!XSKILL让AI积累经验和技能
XSKILL框架让AI积累经验技能,性能提升显著
文章介绍了XSKILL框架,它让AI像人一样积累经验和技能,实现持续学习。该框架将任务级技能与动作级经验统一到双流设计,通过视觉接地提取和检索知识,使多模态智能体不更新参数也能进化。其工作分积累和推理两阶段,积累阶段提取技能和经验,推理阶段检索适配知识。研究团队在五个基准测试评估,结果显示XSKILL比基线有显著性能提升,消融研究验证了各组件贡献,还发现技能和经验互补、推理次数影响性能、零样本迁移表现优异。不过,强大能力也带来潜在风险,需人类监督。

你的小龙虾频频出现幻觉,还在瞎编 API?吴恩达出手解决
吴恩达推出Context Hub解决大模型API瞎编问题
文章介绍吴恩达推出的CLI工具Context Hub。指出大模型存在幻觉问题,如写代码时参数名乱编、调用废弃方法等。Context Hub思路是给agent提供审核过的文档仓库,命令行工具chub供agent使用,可搜索、获取文档。它还能记笔记,包括标注和反馈,标注可存本地,反馈给维护者改进文档。安装后在提示词告知agent使用方法。与其他工具不同,其文档存GitHub,有审核流程,能留踩坑记号。吴恩达此举是补agent工具链短板,提升写代码体验。

养龙虾从狂热到冷静:OpenClaw卸载潮背后的理性回归
OpenClaw现卸载潮,暴露AI Agent行业问题
2026年,OpenClaw出现卸载潮。此前二手平台有“技术黄牛”提供卸载服务,Meta AI研究总监试用两小时后卸载,Meta AI安全研究总监使用时遇Agent删邮件问题,工信部发布安全警报。卸载潮源于五大问题:安全风险、隐私泄露、恶意技能、成本黑洞、稳定性危机。其问题是AI Agent行业缩影,踩中权限失控、缺乏沙箱隔离、幻觉与不可信、缺乏反思机制等雷区。设计“超级智能体系统”需强化多层安全校验等内容。OpenClaw卸载潮是行业成熟开始,《从零构建AI Agent》提出“超级智能体系统”框架。

最强人形机器人全身遥操作系统!十大AI机构人员联手推出,单块消费级GPU即可运行
十大AI机构人员联手推出OmniClone人形机器人遥操作系统
2026年,北理工、北大等10大机构研发人员合作推出OmniClone全身人形机器人遥操作系统。该系统在单块消费级GPU上可实现高保真、多技能控制,平均关节位置误差降低超66%,计算资源消耗低。当前遥操作系统存在评估不细、软硬件配置异构等弊端。研究人员构建OmniBench评估基准,在此基础上提出OmniClone,解决模型覆盖范围狭窄问题,加入系统级机制应对扰动,门槛低且泛化能力强。实验表明其性能优于SOTA基线,还能实现小数据场景下自主策略学习。团队认为未来可扩展数据方案、增强OmniBench诊断价值,让具身智能高效学习。

这是迄今为止我用过最好的 AI 技能,YC 掌门人开源了自己的 AI 编程全套工作流
YC掌门人Garry Tan开源AI编程全套工作流gstack
2026年上周,Y Combinator现任CEO Garry Tan在GitHub开源gstack项目,即其用Claude Code写代码的全套工作流。该项目9天获32000+ Star、3900+ Fork。gstack把Claude Code变成虚拟工程团队,将软件开发拆成流水线,有21个Skill。其浏览器部分跑常驻Chromium进程,选Bun因可编译成单个二进制文件、内置SQLite、支持原生TypeScript。Garry Tan称自己每天写1 - 2万行代码引争议,不过gstack流程设计值得借鉴。安装简单,支持多种AI编码工具,其核心是AI辅助开发方法论,证明AI编程天花板远未到头。

TRAE 技术专家推荐:6个技巧让你的 Agent 更听话
TRAE技术专家分享让Agent更听话的6个技巧
TRAE技术专家分享让Agent更听话的6个技巧。输入设计方面,通过合理默认值、Schema验证、宽松解析、分页参数设计、参数分组与嵌套等降低出错概率;输出设计上,依据数据类型选JSON或Markdown,控制输出大小,提供有意义上下文;错误处理要将错误作为输入,提供可操作信息和替代方案,区分错误类型;工具粒度需权衡,避免太细或太粗,按场景聚合,提供便利函数;脚本执行要保证跨环境一致性,可选用UV、npx等;高级模式中,Skills与MCP互补,还可借助MCPorter转换为CLI工具或TypeScript API。最后提及相关延伸阅读。

Agent/Skills/Teams 架构演进过程及技术选型之道
作者分享Agent架构演进过程及技术选型之道
文章结合作者实践经验,探讨Agent、Multi - Agent、Agent Skills、Agent Teams的架构演进与选型。因大模型在领域知识注入和记忆管理有局限,Agent架构不断演进。Single Agent实现成本低,但有上下文窗口瓶颈,RAG可部分解决;Multi - Agent分工协作,但有路由和上下文割裂问题;Agent Skills复用能力、渐进披露信息,轻量精准;Agent Teams并行探索、共享上下文,适用于复杂未知问题。Google论文给出架构选型建议,如模型强效果好、降低沟通成本等,作者总结出‘由简入繁、按需升级’的选型方法论。

AI 推理精细化流量治理实战:RocketMQ LiteTopic 的“千人千面”流控方案
Apache RocketMQ 5.x用LiteTopic实现AI推理流量“千人千面”治理
文章围绕AI推理场景下消息队列流量治理展开。AI推理与传统应用差异大,消息队列面临队列头部阻塞、并发效率受损问题,传统限流方案失效。Apache RocketMQ 5.x推出LiteTopic,其流量治理方案优势明显。毫秒级实时限流方面,为用户创建独立LiteTopic,实现物理隔离、弹性扩容、精准流控和消费挂起,代码示例展示了“消费挂起”机制,契合实时流量治理需求。分钟级忙闲调度可将延迟不敏感任务错峰调度,扩展了延迟任务处理能力。LiteTopic底层有创新存储和分发机制,支撑百万级管理和物理隔离。该方案已与阿里云百炼网关合作,核心能力在阿里云RocketMQ 5.x实例发布。

我给 OpenClaw 杀了 47 次僵尸进程,终于想明白了一些事
作者分享使用OpenClaw经历并反思AI应用工程化
作者分享使用OpenClaw的经历与思考。部署和二开时,Gateway常出问题,僵尸进程霸占端口,钉钉通道集成也有问题,大模型推理服务稳定性差。OpenClaw能将多种能力融合,把“个人AI助理”具象化,靠叙事和技术链条获30万Star。它坚持本地主义,有自主权但不安全,与Manus云端沙箱模式不同。开发上,它基于Skill模式,对比传统RAG各有优劣。测试体系庞大但难保障产品可用性,OpenClaw虽活跃但缺架构师和产品经理,AI无法替代人做架构决策和产品取舍。最后指出AI应用工程化仍重要,场景决定模式选择。

工程知识引擎:Harness Engineering体系下的工程知识底座
息羽团队构建工程知识引擎赋能AI编程智能体
文章指出当前AI编程智能体虽能写代码但难理解代码,缺乏结构化工程约束与上下文支撑。为解决此问题,构建了工程知识引擎,它整合多维数据源,为AI智能体赋予深度上下文理解能力。Qoder自动构建数据层,形成知识正循环机制。该引擎具备向量检索、代码图谱等六大能力,经效果演示、离线评估和线上A/B测试,证明其能提升智能体执行效率、减少消耗、提升代码保留率和降低对话不满意率。工程知识引擎推动AI编程向工程协作者转变,完善工程底座是提升软件开发效率的务实路径。

移动端里的AI,用户到底要什么?---权衡性能和体验之战
京东付佳分析移动端AI应用需权衡用户体验
文章从一线开发者视角探讨移动端AI应用问题。先指出AI新模型上线后出现手机发烫、卡顿、耗电快等问题,根源是缺乏系统思维。接着分析用户需求,包括爽点、痛点和痒点,强调AI若处理不好会成痛点。还提到移动端设备和场景碎片化,多数用户非用旗舰机,使用特点是短平快且易被打断。随后指出AI应用的三个误区,并给出正确打开方式,如轻量化优先、优雅降级、端云协同等。最后以AR手势交互为例,说明分层适配的设计思路,总结AI应用要具备同理心、克制、分层和保底的特点。

OpenClaw 之后,为什么大多数人还是感觉差一截
Violoop项目针对AI Agent执行层缺失问题展开探索
文章指出OpenClaw虽火,但使用时仍差一截,原因是AI Agent生态执行层缺失。过去AI基础设施讨论集中在模型能力和Agent框架,工位层执行基础设施被低估。现实工作环境复杂,需底层感知和执行能力。Violoop项目是桌边触屏原生AI硬件,获取三类数据构成工位级运行时,主动感知工作状态。其录屏学习、端侧云端分工、硬件级权限隔离等设计有独特考量。该项目此时出现因边缘端推理、大模型任务理解能力成熟,且市场需求显现。执行层是Agent生态未来两三年需补的基础设施,Violoop是此方向较清晰的项目。

AI时代的三大护城河:为什么你只有12个月时间
深思圈分析AI时代三大护城河及12个月窗口期
文章指出多数AI使用者陷入提示、接受、发布的陷阱,真正竞争才开始,且只有约12个月建护城河。“AI slop”泛滥致消费者信任危机,因内容缺人的痕迹。真正能建护城河的是品味、传播分发和高主动性。品味需时间和练习,要明确拒绝默认,合理分配AI工作;传播分发核心是信任,主动社区是护城河,好内容可反哺;高主动性是关键人格特质,AI是乘数,高主动性者能深入探索。当下多数人用AI懒惰,12个月后差距将缩小,建议构建三个护城河。

美团 BI 在指标平台和分析引擎上的探索和实践
美团技术团队在指标平台和分析引擎上展开探索实践
美团技术团队构建了以指标平台为核心的新一代BI架构,解决传统BI平台问题。自动语义能力实现“定义即研发”,贯穿指标全流程,结合指标仓库预计算模式,满足业务需求。增强计算能力平衡运营监控与灵活分析场景,通过智能查询服务和智能物化提升性能,探索增量计算引擎。目前平台支持百余业务线,查询量达百万级,成功率超99.9%。未来,美团将在自动语义、增强计算深化演进,发展智能化能力,提升产品效率。

Harness Engineering 为什么是 Agent 时代的“控制论”?
George Zhang解读Harness engineering与控制论模式
本文是 George Zhang 对 Harness engineering 的解读。今年 2 月 OpenAI 提出 Harness engineering,引发广泛讨论。工程师关注点从“与模型对话”转向“构建持续运行系统”。这种演变类似从瓦特离心调速器到 Kubernetes 控制器的转变,Norbert Wiener 将此模式命名为控制论。代码库底层有反馈回路,但关键决策层面缺乏自动化机制,LLM 或能闭合该层面反馈回路。让 agent 工作的关键是校准传感器和执行器,需将判断标准写成机器可读形式。Agentic engineering 让忽视文档、测试等工程实践的代价增大,必须关注生成之外的验证环节。

火山 AI 生态新玩法:ArkClaw 一键生成漫剧,效率直接拉满
作者分享火山ArkClaw一键生成漫剧玩法及体验
2026年,作者分享火山AI生态中ArkClaw一键生成漫剧玩法。先给AI助手装技能,结合万有商城资源,在火山方舟买个人版试用。介绍漫剧生成技能包四个核心技能,包括图片、视频生成等。实战流程为:先调用大模型自动编排剧本逻辑,再用生图功能设定主角与风格,最后用image - generate编排分镜生成漫剧。ArkClaw结合生态伙伴能力可搭建工作流,新用户买Lite Plan有7天免费使用权益。

达摩院 ICLR'26|可追溯多模态链式推理助力高风险肿瘤临床分析
阿里巴巴达摩院提出TumorChain框架助力肿瘤临床分析
2026年3月17日消息,阿里巴巴达摩院提出面向高风险肿瘤分析的全新框架TumorChain。现有医疗大模型在肿瘤等高风险领域应用有瓶颈,如难以完成复杂决策链条、因果推理深度不足等,且数据稀缺、评测方法不完善。TumorChain从数据、任务设计、模型结构和评测协议四个维度突破,打造高质量数据集TumorCoT - 1.5M,设计交互式分层推理架构,创造三层逻辑链评测协议。实验显示,该框架能力远超主流模型,未来将持续优化助力肿瘤智能诊断和精准治疗数字化升级。

吴恩达来信:建立为人类服务的智能体社群
吴恩达倡导建立为人类服务的智能体社群
2026年3月16日,吴恩达来信探讨建立为人类服务的智能体社群。提到Context Hub(chub),这是为编程智能体提供API文档的CLI工具,可解决智能体使用错误或过时API问题,社群对其热情高。chub愿景是收集智能体反馈以助更新文档。类似Reddit的AI智能体社交网络Moltbook发展迅速且被Meta收购。受Moltbook和Stack Overflow启发,认为让编程智能体贡献反馈帮助其他智能体很有价值。目前处于chub构建相关能力早期,团队正开发定制智能体编写文档,文档数量一周内从不到100份增至近1000份,强调智能体社交分享及隐私安全保护的重要性。

The Batch:924|GPT-5.4:性能更高,价格也更高
OpenAI发布GPT-5.4,性能提升但价格也更高
2026年3月17日消息,OpenAI更新旗舰模型GPT-5.4,提供Thinking和Pro两个版本,有更大上下文窗口。它可原生使用计算机,具备工具搜索能力。输入输出支持文本、图像,架构为混合专家transformer,有多种功能。其在多项测试中表现出色,在部分测试中略逊于Gemini 3系列。GPT-5.4已超越Claude,挑战Gemini领先地位,虽每token性能提升,但要达Gemini 3.1 Pro Preview性能需约两倍token,高价抵消了效率优势。GPT-5.4 Pro是先进编码模型,完成编码任务成本低于Claude Opus 4.6。在自动化办公复杂问题解决上表现出色,或具高性价比。

The Batch:925|移动端AI应用爆发式增长
Sensor Tower报告显示移动端AI应用下载和收入爆发式增长
市场研究公司Sensor Tower发布《State of Mobile 2026》报告,追踪智能手机上AI应用增长。去年全球AI驱动应用收入超50亿美元、增长超三倍,下载量超38亿次、翻倍。OpenAI、DeepSeek占近50%下载量,下载前十全是AI助手,生成式应用也增长强劲。用户使用时长达480亿小时,约1.1亿美国用户仅用移动应用。移动端AI助手出现不久,用户行为变化快,AI成日常习惯,与其他应用争夺用户时间,其收入增长令人鼓舞。

The Batch:927|极速扩散学习
Apple团队提出FAE扩散图像生成器,训练快性能佳
研究表明扩散图像生成器学习重建预训练编码器嵌入可加速训练,缩小嵌入训练速度提升更显著。Apple的Yuan Gao等人提出Feature Auto - Encoder (FAE),学习重建视觉编码器DINOv2生成的嵌入,先缩小再重建解决了DINOv2嵌入尺寸大导致训练受阻的问题。介绍了FAE推理和训练阶段的工作流程,其测试性能与先进扩散模型相当且训练更快,能让图像生成器以更实际方式利用编码器知识,缩短生成高质量图像时间。

Vibe Coding来了!斯坦福CS146S引领编程新范式
斯坦福CS146S课程引领利用AI编程新范式
2026年,斯坦福大学新开设的《现代软件开发者》(CS146S)课程爆火。该课程是头部大学首个聚焦人工智能软件原理与实践的课程,强调利用AI工具完成软件开发全流程,不写或极少手写代码。课程体系涵盖AI基础、开发环境、质量与安全、部署与运维、未来展望等方面。主讲Mihail Eric是机器学习领域专业人士,还有多位AI大佬客座演讲。最后文章还推荐了AI+交叉学科的idea。

AI,正在吞噬所有软件。
10年经验设计师谈AI对软件、组织的冲击与变革
文章从用户体验设计师和公司创始人视角,探讨AI对软件的影响。如今AI让人人可造软件,开发成本降低,软件开发从专业技能变为基础能力。软件正从资产变耗材,SaaS模式受冲击。OpenClaw让大众理解Agent,其填平人机交互鸿沟,UI和人机交互或失去存在理由。Agent时代产品形态是Skill,用户可能不再是人,企业需重估价值。从人类商业史看,AI吞噬软件,软件和组织中间层逐渐消亡。变革速度快,人们需积极应对。

刚刚,小云雀的短剧Agent上线了,背后是字节自己的Seedance 2.0。
字节上线基于Seedance 2.0的小云雀AI短剧Agent
2026年3月19日,字节基于Seedance 2.0的小云雀AI短剧Agent上线。Seedance 2.0是世界第一的AI视频模型,但使用有局限。小云雀Agent可根据剧本或设定全自动生成高质量短剧,作者测试显示其效率极高,半天能直出4集,且不挑风格。文中介绍了其使用流程,还提到剧本创作可结合人类审美与AI执行力,先让AI参考好剧本总结规律再创作,长文可先出事件列表。最后指出AI影视工业化虽在发展,但人类从生活中获取的创作灵感不可替代。

AI 不会杀死软件,但会杀死一大批“软件生意”
张艾拉解析AI时代软件生意变革及未来方向
文章指出AI不会杀死软件,但会颠覆传统SaaS按功能收费模式。80%的app将消失,大量靠界面和单点功能的软件会被后台化。未来软件竞争核心是上下文记忆、数据调用权和行动代理权,入口权至关重要。真正危险的是无网络效应等能力的软件公司。强创作环境、强网络效应和强现实连接的app会留在前台。未来五年,更有机会的方向是抢agent时代入口层和接高价值垂直结果场景。

刚刚,被扒套壳Kimi的Cursor公开了自家强化学习技术~
Cursor被指套壳后公开强化学习技术训练Composer
2026年3月21日,被指套壳Kimi的Cursor公开自家强化学习技术。此前,其Composer 2模型套壳事件引发热议。抛开事件,Cursor分享自我总结强化学习流程训练Composer处理长程任务。该流程可从超模型最大上下文窗口轨迹获取训练信号,让Composer学习处理复杂编码任务。传统压缩技术有局限,会使模型遗忘关键信息。而Composer自我总结流程能工作更久、总结更短。测试显示,自我总结在CursorBench上结果更好,token压缩效率更高,还能解决长推理链难题,如Terminal - Bench 2.0中make - doom - for - mips问题。未来,将在更复杂过程中训练Composer。

兄弟!你真的懂 Skill 吗?
李小宇分析Anthropic官方Skill执行模式及应用建议
本文围绕Anthropic开源的16个官方Skill展开,分析其执行模式。首先介绍Skill系统核心链路和执行流程,包括框架层和应用层分析,提炼出5种执行模式。纯Prompt注入型以SKILL.md为核心提供领域知识;脚本执行型以SKILL.md为教程,用scripts脚本;库调用型让LLM现场写代码import库;参考文档渐进加载型按需加载文档;编排型用SKILL.md编排多阶段工作流。这些模式共用部分框架机制,官方Skill不用function calling,而重SKILL.md。最后给开发者实操建议,强调写好SKILL.md是基础。

QClaw重磅来袭,微信入口全面升级,码管够!
腾讯QClaw重大更新,微信入口升级且上线灵感广场
2026年3月18日,腾讯QClaw宣布重大版本更新。其基于OpenClaw极简封装,是易上手的AI Agent。此次微信入口升级为小程序,支持上传或接收电脑端文件,后续还将支持语音、图片传输等多模态交互,以及快速创建定时任务等功能。同时,「灵感广场」全新上线,围绕多种场景预置常用任务与skills,用户无需编写指令即可一键使用。此外,内测期间优化了使用体验,也欢迎用户反馈不足。邀请码获取方式为官网下载软件,经安装、登录等步骤后申请。

从架构到代码:深入理解 OpenClaw 的双源记忆系统
刘学楷深入解析OpenClaw双源记忆系统架构与代码
文章深入剖析OpenClaw双源记忆系统。先介绍其背景,指出它类似个人AI助手,有使用便捷、主观能动和长期记忆优势。接着明确OpenClaw对“记忆”的定义,将其从上下文中剥离,构建分层、可搜索、持久化架构。记忆系统采用双源架构,分动态和静态记忆,详细说明两者产生方式。在记忆检索与调用方面,介绍索引构建、搜索、加权融合及Agent交互方式。还给出典型交互流程,探讨C端用户对高性能模型的需求。附录阐述记忆索引实现流程和token消耗计算,指出记忆层虽实现轻量化上下文,但仍有成本问题,需从精简提示、禁用工具和换模型降低成本。

一文了解|火山引擎 OpenClaw 安全最佳实践
火山引擎梳理OpenClaw安全风险并给出加固方案
本文围绕火山引擎OpenClaw安全展开。先介绍其是强大开源AI代理平台,但有安全风险。接着阐述六大常见风险,如不安全访问控制、提示词注入等,给出对应加固手册。然后介绍火山引擎三种OpenClaw解决方案,分析不同场景威胁建模。云上保障分默认配置、纵深防御、持续运营三维度,有防护矩阵和工具准入管控,还有ClawSentry方案。办公终端保障从存量管理等四维度出发。最后展望未来,OpenClaw发展会带来新挑战,火山引擎将坚持原则迭代方案,建设可复用和监测响应能力,与伙伴释放智能体红利。

如何让你的 Agent 更准确:MCP 工具设计技巧
字节跳动技术团队分享让 Agent 准确使用 MCP 工具设计技巧
文章由字节跳动技术团队撰写,围绕如何让 Agent 更准确地使用 MCP 工具展开。首先指出开发者用写 API 的思维开发 Agent 工具存在问题,强调 Agent 工具是其用户界面。接着介绍 LLM Tool Calling 的完整链路,包括工具定义、LLM 决策、应用程序执行等步骤,以及工具定义被 LLM “看到”的方式和工具数量对模型的影响。然后阐述 MCP 作为标准化工具协议层的定位、转换机制及存在的问题。还从 Agent 视角分析其对工具的感知,提出设计工具应减少其认知负担。最后从命名、描述、输入、输出、错误处理、工具粒度等方面给出设计建议,如命名要完整自解释、输入设计降低出错概率等。

给龙虾装一个专属技能包!试试这个场景
Datawhale团队教你创建Agent Skill让AI成代码仓库专家
文章由Datawhale团队的曾浩龙撰写,手把手教读者创建Agent Skill,让AI成为“代码仓库百晓通”。首先解释Agent Skill是给AI安装的“专业技能包”,能让AI在特定领域成专家,关键是SKILL.md文件,有元数据区和正文区,介绍了触发和存放位置。接着以OpenCode为例,介绍安装及连接大模型的方法。然后详细讲解创建“代码仓库问答专家” Skill的步骤,包括安装skill - creator、连接DeepWiki、用自然语言描述创建、拆解并完善SKILL.md。还介绍了其关键设计点,如意图识别、仓库路由、消歧和防幻觉机制。最后通过OpenCode和OpenClaw环境测试技能效果,分享制作心得并鼓励读者定制自己的Agent Skill。

让你的 OpenClaw 带你学习,清华开源 AI 私人导师 OpenMAIC
清华开源AI私人导师OpenMAIC并支持与OpenClaw融合
近日,清华开源AI互动课堂平台OpenMAIC,能将主题或文档转化为互动学习场景,自动生成AI互动课,有AI老师讲解、同学讨论,还可导出课件,且适配OpenClaw。项目基于Web技术栈,前端用Next.js 16和React 19等。核心架构主流程基于Job,两阶段生成流程对应课堂内容结构化。多智能体编排引擎通过Director Graph协调对话流。用户可通过讲授、讨论、问答三种模式互动,支持与OpenClaw深度融合,有托管和本地部署两种模式,官方提供多个使用案例。

阿里这个Token Hub想的挺明白:用悟空认真面对企业Agent市场
阿里钉钉发布原生AI Agent新品悟空面向企业市场
2026年3月16日阿里成立Alibaba Token Hub事业群,目标是创造、输送和应用Token。3月17日钉钉发布原生AI Agent新品悟空,可图形界面与命令行操作电脑,天然嵌入钉钉。悟空一人团队版内置多种技能,未来企业版功能将更丰富。企业场景是AI Agent主战场,悟空试图让Agent从个人助理进化成企业生产力工具。钉钉为悟空打造企业级Agent地基,底层能力CLI化,有六层安全体系,还有AI原生文件系统。悟空想做阿里企业工作场景AI原生入口,整合多方能力。

可能是国内最好的编程养虾利器,自我进化模型 MiniMax M2.7 来了
MiniMax发布自我进化模型M2.7,工程及协作能力出色
2026年3月19日消息,自我进化模型MiniMax M2.7发布。作者此前用M2.5完成RSS - Reader项目,现升级到M2.7。M2.7加强指令遵循、Skills调用和复杂任务拆解能力,能实现Agent Teams研发模式。其工程能力强,为RSS - Reader项目给出详尽分析报告;Agent Harness能力出色,多Agent协作开发效率高。在养虾场景中,M2.7能解答问题、生成笔记。它还展示了自我进化路径,可跑研发流水线、改造工具箱、优化其他模型,正从大模型走向生产力工具,作者推荐大家体验。
从小龙虾到"驾驭工程":我迫不及待想看看2027年的这个世界是什么样?
熹乐科技创始人剖析AI驱动流程再造现状与破局法
本文特邀熹乐科技创始人范维肖,剖析AI驱动流程再造现状与破局之道。OpenClaw爆火让AI从对话接口变为行动者,引出“驾驭工程”概念。其核心思想是为智能体构建正确运行环境,包括知识系统化、提供长期Runtime、以Agent Loop为核心产品。过去一年,工具调用成熟使软件从UI - native转向Tool - native,行业走向Agentic System。企业应关注Hand - Off Rate指标,其降低体现AI商业价值。同时,Agentic System进入企业流程会使组织结构从Org Chart向Work Chart演变。

GLM-5 Turbo 抢先实测!!我用它做了一个魔兽争霸!!
作者实测AutoClaw和GLM - 5 turbo并制作网页游戏
本文作者对AutoClaw和GLM - 5 turbo进行了实测。AutoClaw配置简单,对新手友好,菜单功能全,内置多技能,支持接入多种外部模型,采用免费+积分模式。作者拿到GLM - 5 turbo实测权限后,与某匿名模型对比,围绕OpenClaw数据看板任务,从需求理解、任务拆分、代码质量、环境适应等方面测评,发现GLM - 5 turbo表现更优,有闭环执行能力。还用其打造支持自然语言交互的房价查询CLI工具,在多维度测试中表现卓越。最后作者用它制作了《王冠战争》网页即时战略游戏,测评认为其能满足核心Agent引擎要求。

泥腿子“小龙虾”翻身记:各大厂 OpenClaw 一键部署方案超全盘点
国内大厂推出OpenClaw一键部署方案并进行盘点
文章盘点国内大厂OpenClaw一键部署方案。OpenClaw曾是极客专属,部署复杂,如今大厂推出方案推动其国民化。本地部署方案数据不出本机、延迟低且多免费,如腾讯QClaw适合社交和远程办公人群;智谱AutoClaw性价比高,适合网页数据处理;360安全龙虾重安全,适合办公族;猎豹EasyClaw轻量,适合低配置电脑用户;腾讯WorkBuddy全能,适合全场景办公。云端部署方案7x24小时在线、不占本地资源,如字节ArkClaw适合飞书企业;百度DuClaw零部署,适合小白;Kimi Claw长文本记忆强,适合专业人士;飞书妙搭零代码,适合飞书企业用户;阿里云×QoderWork双线并行,适合企业和开发者;MiniMax MaxClaw多模态处理强,适合自媒体等。还有百度“红手指Operator”手机App。最后给出选款指南,指出OpenClaw正从“玩具”变“工具”。

逐项解读黄仁勋GTC演讲:Vera Rubin、token王、英伟达“龙虾”、太空计算和雪宝|甲子光年
英伟达黄仁勋在GTC 2026演讲发布多项AI技术
美国当地时间3月16日,英伟达创始人黄仁勋在GTC 2026主题演讲发布五项重要技术。一是下一代AI计算平台Vera Rubin,整合7款芯片、5种机架,提供强大AI计算能力;二是AI工厂参考设计Vera Rubin DSX,提升token产出与能源利用;三是企业版OpenClaw——NemoClaw,为OpenClaw提供企业级运行管理软件栈;四是太空计算计划,延伸AI计算到轨道空间;五是物理AI数据蓝图,降低训练成本。黄仁勋强调AI是基础设施革命,推理是核心,Token是商品,算力即收入。英伟达正从芯片公司向AI基础设施公司转型,其商业天花板被重新打开。

2026京东零售技术国际顶会论文合集第一期 CVPR/WWW/ICLR等收录
2026京东零售技术国际顶会论文合集第一期公布
2026年京东零售技术有多篇论文被CVPR、WWW、ICLR等国际学术会议收录,本文精选11篇解读。研究覆盖多模态多智能体系统等方向。如在广告生成上,探索基于历史点击联合生成个性化图文广告;图像恢复方面,提出噪声对齐扩散桥解决欠拟合;推荐系统里,有面向工业级的统一排序框架、大模型驱动的多智能体框架等;还在点击率预测、强化学习等领域有新方法和成果。后续会邀请作者深度解析。

社区说|极速出海工作坊: 基于 Gemini 和 Cloud Run 实现应用的 "分钟级" 发布
上海GDG社区举办活动,基于Gemini和Cloud Run发布应用
在出海开发者竞争激烈的当下,将创意落地成全球可访问的生产级应用存在诸多工程门槛。本期“社区说”聚焦实战,拆解Gemini与Google Cloud Run组合,助开发者体验“分钟级”发布AI应用。谷歌专家会介绍Google AI Studio平台、计费梯度和免费额度政策。还会演示Vibe Coding模式实现从Prompt到代码的精准转化,通过Google Cloud Run一键容器化部署。活动于3月19日19:00 - 20:30举行,有主题分享、讲师介绍等环节,参与活动有同步编码环节,完成个人应用开发有机会获礼品。

当 Gemini 3 成为《历史模拟器:崇祯》的世界引擎: 以逻辑推演重塑大明兴衰
《历史模拟器:崇祯》团队与Google Cloud用Gemini 3驱动游戏
在AI原生游戏爆发的当下,《历史模拟器:崇祯》技术团队与Google Cloud合作,让Gemini 3作为游戏世界引擎,进行基于纯逻辑推演的“硬核历史模拟”。该游戏采用全模型驱动的世界,突破传统策略游戏预设代码的边界。选择Gemini 3,是因其有浩瀚文史知识、突破极限的长上下文和强大逻辑推理能力。游戏设计“诏书 - 奏折”交互机制,玩家输入指令,Gemini 3会进行逻辑推演并更新数据。未来,双方将继续合作,探索AI在游戏领域更多可能。

LibTV 实测:人类用户再也不是产品的全部
LiblibAI推出LibTV,以精细工具和Agent革新AI视频创作
2026年3月18日,LiblibAI推出AI视频创作平台LibTV。过去两年,AI视频工具经历“对话式”到“节点式”发展,但各有局限。LibTV有两大特点,一是有大量精细化创作工具,如九宫格抽卡、多角度三视图等,能让创作者精准把控创作意图;二是可接入Agent,通过自建Skill理解任务、编排工作流,兼顾专业和普通用户。其解决了节点式工具精准控制难和对用户要求高的问题,用户用“人+精细化工具”“Agent+Skill”方式创作,降低创作难度,实现从素材生成到视频剪辑全流程处理,让人和Agent在画布上协同,填补创作者需求与模型能力间的差距。

OpenClaw不重要,重要的是它以后跑在哪里
飞书围绕OpenClaw进行产品升级,推出智能伙伴
今年3月,OpenClaw安装热潮涌现,后闲鱼出现卸载帖子。多数用户仅止于安装,想让其发挥作用的用户多选择飞书,因其使用便利,且与OpenClaw早期用户圈子重合。飞书在开发者使用后跟上,春节组建插件团队,进行一系列产品动作。3月19日飞书举办发布活动,推出智能伙伴aily,兼容OpenClaw生态,还有专业版及妙搭、多维表格升级。实际使用中,智能伙伴能完成文档汇总分析、搭建系统等任务。海外Slack也有类似转变,飞书也往此方向探索,未来竞争焦点转向离权限等更近的平台,AI更多价值在于接管流程。

首发实测 Floatboat:一人公司的工作方式,可能要变了
十字路口团队实测AI工作环境Floatboat
本文首发实测Floatboat,它专为一人公司打造AI原生工作环境。随着AI发展,一人公司潜力渐显,但工具需提升信息处理与工具切换效率。Floatboat把电脑变Agent运行环境,实现信息流转。其工作空间可让信息自由流动,基础交互支持多栏并排、自由拖动;上下文生产能基于文件生成报告,支持分享;上下文抓取可拖取保存内容;能利用积累素材做任务生产。还有Combo Skills模块,可固化操作流程。此外,它可调用macOS原生工具,有龙虾Claw模式,且开源Selfware和IACT协议,虽为初代版本有不足,但方向值得关注。

Lovart 发布两个重要新功能,离「替代摄影棚」又近了一步
Lovart发布多角度和矢量化功能,靠近设计工作流
2026年AI生图进入「工作流之争」。Lovart发布多角度和矢量化两个新功能,离「真正的设计工作流」更近一步。多角度功能可随意更改主体和摄影机角度,如同虚拟摄影棚,能快速生成多角度商品套图、手办360度套图等,还能一键生成朋友圈九图并可调整。矢量化功能可将位图转化为可无限放大的SVG矢量图,让生成的图片成为数字资产,打通灵感生成到生产力资产交付的闭环,降低了重新拍摄和描线成本,使创作者专注决策。

火山联网搜索Skill接入ArkClaw,让你的龙虾不再“离线”
火山引擎将联网搜索Skill接入ArkClaw并提供免费调用
2026年3月18日消息,火山引擎将火山联网搜索Skill接入ArkClaw。火山联网搜索是为AI Agent打造的信息获取引擎,已在多场景落地。其封装的Skill可在ArkClaw和OpenClaw中调用。该Skill有三大优势:信源权威丰富、中文覆盖广;Agent原生适配,省token更高效;多模态检索输出,结果直观,在权威测评集上表现领先。ArkClaw搭配此Skill可完成浏览、分析等任务,如热点追踪、竞品分析等。个人用户注册账户可每月免费调用500次,介绍了开通步骤,免费额度用尽可手动确认开通计费。

Liblib 发布 LibTV,我们第一时间深度实测
LiblibAI发布AI视频产品LibTV并进行深度实测
2026年3月19日,LiblibAI推出AI视频产品LibTV,同时面向人类和Agent。人类创作者可在画布上创建工作流,精细控制创作;Agent则通过Skill接口自动化完成任务。实测中,人类端利用LibTV无限画布创建工作流,内置丰富模型库,有聚焦、剪辑等实用功能,还能借助辅助工具拓展灵感。Agent端通过开放的Skill,可根据指令自动完成剧本、角色设计、分镜、视频生成和剪辑。此外,LibTV定价有优势,年卡低至39折,部分模型6折,订阅赠免费额度。不过,它尚处早期,效果待时间验证。

清华开源教育龙虾,沉浸式互动课堂,运行成本仅为传统的千分之一
清华大学团队开源OpenMAIC打造多智能体AI互动课堂
2026年3月,清华大学团队将自研的AI课堂系统开源为OpenMAIC。该平台能把输入转化为互动课堂,有幻灯片讲解、测验等活动。它采用两阶段流水线,支持多种课堂组件。其核心是多智能体协作引擎,有AI老师、助教和同学,通过LangGraph管理,支持多模型和网络搜索。前身MAIC已在校内多轮验证,2024年春秋季课程参与人数递增,学生反馈良好。系统成本仅为传统MOOC千分之一,2025年上线国家平台,开源版本新增功能,降低使用门槛,有望改变在线教育模式。

碳基和“悟空”组队烧token,炸出新物种
钉钉发布悟空平台,展现AI对工作方式的变革潜力
文章围绕AI对工作的变革展开。以钉钉程序员为例,展示AI使人类工作产出大幅提升,由此引发对人价值和企业运转方式的思考。介绍与AI共生的“新物种”案例,如刀仔、“等登等蹬”等,他们通过不同模式与AI协作,但普通人运用AI仍有困难。“龙虾”热潮凸显AI Agent在企业场景的困境,而钉钉通过“CLI化”和封装“Skill”套件,让AI能直接调用系统,解决了部分问题。此外,指出AI时代“会想”能力更重要,强调要管理与AI的协作节奏。最后表明AI正重新定义工作,鼓励人们与硅基组队进化。

你的第一个 Agent,我们为你充值
真格基金与十字路口发起Token Grant支持AI创业者
2026年3月19日消息,「真格基金」与「十字路口Crossing」共同发起「Token Grant」,为入选项目提供五万人民币Token费用,支持构建下一代AI原生产品。当下AI创业者常缺模型、算力资源和试错机会,该计划源起真格投资总监分享。真格投资团队和合伙人会全程参与,支持创业者。还介绍了该计划常见问题解答,如不要求用特定厂商模型,申请后一周邮件回复等,优先支持未完成机构融资、处于产品早期探索阶段者。

极客大神构建了LLM架构画廊,AI大神Karpathy点赞
极客大神Sebastian构建LLM架构画廊获AI大神点赞
2026年,极客大神Sebastian Raschka构建LLM Architecture Gallery(大语言模型架构画廊),将复杂模型结构化繁为简,获AI大神Karpathy点赞。该画廊在Hacker News引发讨论,高度视觉化且互动性强,展示2019 - 2026年各大科技公司开放权重模型架构图,标注核心参数、配备数据表,内置前沿概念解释,源数据托管在GitHub。社区开发者认为,顶尖开放权重模型宏观结构有早期影子,微观设计为节省内存和提升效率各有创新。Sebastian有超10年AI和机器学习经验,著书分享技术,新作探讨为系统注入推理能力。

阿里成立Token Hub事业群,打碎钉钉,做成龙虾!
阿里巴巴成立Token Hub事业群并发布企业平台悟空
2026年3月16日,阿里巴巴宣布成立Alibaba Token Hub事业群,由CEO吴泳铭挂帅,未来3年将投入超过去10年总和的资源用于智能基础设施建设。该事业群以创造、输送和应用Token为核心目标,旗下有通义实验室、MaaS业务线等5大事业部。此前,阿里云在1月推出云服务及相关应用。新事业群成立次日发布企业级旗舰应用悟空,它是全球首个以企业智能体为核心的原生工作平台,将钉钉等提升至战略位置。悟空兼容开源生态,内建安全机制,重写底层架构,还搭建原生文件系统Realdoc,推出Skill套件。发布会展示了DingTalk A1 Pro录音卡等智能硬件,助力个体进入超级个体时代。

Skill制作和使用秘诀!Claude Code工程师的官方宝藏经验
Anthropic工程师发布Claude Code的Skill使用教程
Anthropic工程师发布《Claude Code的经验教训:我们如何使用Skill》教程。Skill是智能体开放标准和扩展点,在Claude Code中广泛使用。文章介绍其概念,强调非简单文本文件,有多样配置。制作技巧包括不陈述显而易见之事、建立易错点部分、利用文件系统和渐进式披露等。还将其分为库与API参考、产品验证等9类,并给出示例。分发方式有提交到代码仓库和制作插件上传到市场。管理市场需有机发现有用技能,同时要策展审核。组合技能可按名称引用,Claude用PreToolUse hook衡量其表现。

OpenAI推出GPT-5.4 mini/nano;MiniMax发布M2.7;小米发布MiMo-V2系列模型
OpenAI、MiniMax、小米发布GPT - 5.4 mini等多款新模型
2026年3月20日,OpenAI、MiniMax、小米陆续发布新模型。OpenAI推出GPT - 5.4 mini与nano,延续核心能力,优化速度和成本,适用于高吞吐量场景,已上线API等。MiniMax发布M2.7,能自我演化,在软件工程等多方面表现出色,还在低资源场景测试有成果。小米发布MiMo - V2系列三款模型,MiMo - V2 - Pro定位智能体核心,排名靠前;MiMo - V2 - Omni实现全模态理解;MiMo - V2 - TTS支持多风格语音合成。

超 60 万开发者围观的谷歌 Agent 内部开发规范,5 种设计模式
谷歌发布AI Agent Skill设计的5种开发模式
Google Cloud Tech 在X上发布的AI Agent的Skill设计模式长文,24小时内获60万次浏览。开发者上手时纠结YAML格式和目录结构,但<SKILL.md>格式规范已统一,难点在内容设计。Google团队提炼出5种设计模式:工具封装器将库或框架最佳实践打包;生成器用模板生成文档;审查员拆分审查清单和方式;反转控制先收集信息再行动;流水线用硬检查点卡住步骤。还给出决策树指导选择,且五种模式可组合,Agent Skills规范已开源。

被 Karpathy 下场推荐的 NanoClaw 是什么来头
Karpathy推荐NanoClaw,其具小巧安全等优势
2026年1月底,OpenClaw一夜爆红,虽技术无实质突破,但产品形态有趣,可远程操控电脑,还具活人感。不过,它存在安全风险和权限问题。在其火热时,衍生出如NanoClaw等小Claw。Karpathy推荐NanoClaw,因其代码量少、运行在容器里且用“skill改代码”代替传统setup流程。NanoClaw小巧易懂、安全可靠,安装和扩展依赖AI,实现原理包括Node.js调度进程和Linux容器、文件系统IPC、Skill架构等,还营造出“活人感”。对比OpenClaw,NanoClaw安装简单、安全有保障,但权限和生态不如前者。作者对开源社区的Claws项目处境悲观,认为它们距成熟还有段时间。

AI x 大前端性能稳定性:快手亿级DAU下的智能诊断实践
快手借助「柯南AI」实现大前端性能稳定性智能诊断
文章整理自快手移动端稳定性负责人李锐在2025年QCon全球软件开发大会的演讲。快手在大前端性能稳定性保障面临挑战,其稳定性演进历经四阶段。引入AI打造「柯南AI」平台,定位为团队产出放大器,从问题处置切入。通过真实案例展示AI辅助根因排障,建四级胜任度评估体系;开发Holmes工具结合AI分析崩溃问题,处理性能问题则优化火焰图方案。应急处置方面,开发“Ekko”工具和借助AI降低风险,提高效率。开发过程需思维转换,AI不会取代人,要驾驭它,流程也将向“human - on - the - loop”延伸。最后介绍快手主站技术部及热招岗位。

速递丨Claude 小龙虾化?手机秒变AI指挥官
Anthropic为Claude Cowork推出Dispatch新功能
2026年3月17日,Anthropic为Claude Cowork带来新功能Dispatch。用户拿出手机扫二维码与电脑上的Claude Desktop配对,手机成指挥中心,可向电脑上的Claude Agent下达任务,Claude能在电脑上实际操作,记住上次进度。该功能先向Max订阅者推出,Pro版随后上线。Dispatch建立持久对话通道,突破设备限制,有丰富应用场景。它面向普通用户,零配置即用。同时具备完善安全机制,但目前存在电脑需持续运行、单线程、无完成通知、处理速度慢等局限,不过展现了AI助手发展方向。

LLM-in-Sandbox:深度融合计算环境,让通用智能体具备“动手能力”
微软等机构联合提出LLM - in - Sandbox激发通用智能体能力
微软亚洲研究院与中国人民大学、清华大学联合提出LLM - in - Sandbox,实现大模型与计算环境深度融合。它给模型一台“虚拟电脑”,采用轻量级通用沙盒、最小化工具集和探索式工作流。实验显示,该范式在多个非代码领域无需额外训练就能提升表现,减少token消耗。此外,还提出LLM - in - Sandbox RL增强泛化能力,在多方面展现优势。LLM - in - Sandbox在效率、功能上也有出色表现,有望成为通用数字创作系统。

速递丨OpenAI重组:将迎“三合一”Superapp!
OpenAI重组产品,将推“三合一”桌面超级应用
据《华尔街日报》消息,OpenAI正进行产品大重组,将ChatGPT、Codex、Atlas合并成桌面端“超级应用”,核心是“Agentic”能力,可自主工作。应用业务主管Fidji Simo主导,总裁Greg Brockman协助。公司内部因精力分散、研发慢而拉响“红色警报”,叫停“支线任务”。其焦虑源于对手Anthropic在B端市场表现出色。二者均考虑年底上市,有业绩对赌。OpenAI欲借“超级应用”翻身,重塑工作方式。

别让AI在部署后停滞:OEL重塑大模型进化之路
微软亚洲研究院提出OEL框架重塑大模型进化之路
当前大语言模型部署后难以持续提升能力,主流离线训练范式存在性能上限受限、部署后经验无法使用等问题,且在线学习方法落地有技术障碍。微软亚洲研究院提出在线经验学习(OEL)框架,其有严密双阶段迭代逻辑,即经验提取与整合,形成在线进化引擎。实验表明,OEL能让模型在线学习、提升推理效率、避免灾难遗忘,对不同模型均有性能提升。该框架标志AI进入新阶段,为构建终身学习AI系统提供路径,有望成下一代AI核心能力。

速递丨腾讯QClaw开启全量公测:20秒装好你的专属AI助手
腾讯QClaw开启全量公测,20秒装好专属AI助手
2026年3月20日,腾讯QClaw开启全量公测,无需邀请码,官网下载后20秒即可安装。它打通五大通讯平台,手机发消息电脑自动执行,企业微信端可自动回复、整理内容等。“像素工作室”亮相,可视化呈现AI工作状态。定时任务可视化,支持复杂条件设置,方便生活管理。QClaw零门槛使用,数据本地存储,支持双系统、多模型,有丰富技能生态。

阿里云 EventHouse 正式公测!连接企业数据与 AI Agent,释放实时数据价值
阿里云EventHouse公测,连接企业数据与AI Agent
2026年3月19日,阿里云事件总线EventBridge的EventHouse开启公测。它将事件数据升级为可沉淀、治理、分析和被AI Agent使用的数据资产。EventHouse有三大关键能力,即无感集成、透视治理、对话分析,还提供一键分析入口。其由数据目录、数据分析、数据智能三大组件构成,可用于跨源数据统一治理与查询、从消息流直接开启实时分析、AI驱动的自然语言交互分析等场景。EventBridge借此形成完整事件数据服务体系,未来阿里云将增强其AI原生能力。

深入理解OpenClaw技术架构与实现原理(上)
作者深入解析OpenClaw技术架构与实现原理
文章详细解析OpenClaw技术架构与原理。首先介绍背景,指出其为热门个人助理,改变软件开发范式。其总体架构以Gateway为核心,具多模块功能。各系统模块方面,Gateway网关是统一控制平面,有多种特性、模式和配置;Agentic Loop是事件驱动的推理循环架构,控制运行逻辑;定时任务系统满足长任务需求,有完整架构和调度机制;工具系统采用分层架构和策略管道;Channels实现社交生态连接,采用分层抽象和适配器模式;上下文管理涵盖窗口管理、压缩剪枝等;SubAgent架构的子智能体独立运行、有结果通告机制,支持嵌套编排,可处理多种场景。

企业级 Agent 多智能体架构与选型指南 -- 来自1000+行业应用实践积累
基于超1000+实践发布企业级Agent多智能体架构与选型指南
文章基于超1000+智能体应用实践经验,介绍企业级Agent多智能体架构与选型。当前企业关注如何让AI驱动业务闭环,多智能体协作架构处理复杂问题更具优势。AgentScope社区积累众多多智能体模式,沉淀为框架抽象与代码示例。构建AI应用应单智能体优先,当业务复杂度超阈值再考虑多智能体。其支持多种多智能体模式,分为工作流和对话模式,各有优劣,生产中常采用混合工作流。文中详细介绍Pipeline、Routing等核心模式,给出架构选型指南,还说明Spring AI Alibaba与AgentScope定位协同,Graph引擎为多智能体提供编排等能力,最后提供官方示例供体验。

Andrej Karpathy 最新2万字神级访谈:我已彻底停止手写代码!陷入“AI精神错乱”,看到了传统教育的终结与Token吞吐量的绝对霸权
Andrej Karpathy谈编程范式转变及AI多领域发展趋势
2026年,前OpenAI创始成员Andrej Karpathy在深度访谈中表示编程范式正从手写代码转向向智能体传达意志,传统软件工程走向消亡。他指出Token吞吐量成为新生产力指标,未来软件将转向API驱动,智能体取代传统应用。科研上,自主研究可实现递归自我改进,让人类脱离决策瓶颈。不过当前AI存在“参差感”,强化学习有局限。开源模型与闭源前沿差距缩小,可形成权力平衡。在教育领域,智能体将重组传统教育,人类负责产出核心直觉。

AI的边界,就是人类的领地
盛思鑫探讨人工智能对人类想象力、职业、学习的影响
文章围绕人工智能与人类的关系展开探讨。在想象力方面,人类想象力由好奇心驱动,在“不可言说”世界及应对不确定性上优势明显,人工智能则依赖数据,对确定性想象有优势。职业领域,人工智能冲击大,多数职业知识商品化,不过教育、高级需求、审美、陪伴类职业受影响小。学习教育上,人工智能使学历贬值,学习需兼顾广度深度,培养新型“通才”,同时要重视经典学习,避免知识资源枯竭。
离开meta三个月后的国内首访:田渊栋的科学与诗
Creekstone访谈Meta前研究员田渊栋谈AI及科研见解
文章是对离开Meta三个月后回国首访的田渊栋的专访。他分享成长与职业经历,称一直在追求打开黑箱、发现底层机制。他认为AI正划定“费米线”,重复性技能价值归零,有创造力和解决难题能力的人才能幸存;硅谷巨头有“组织病变”,Transformer架构需推倒重来,盲目堆算力不可取,现有模型或无法模拟人类“顿悟”。还探讨文学创作、科学与工程权衡等问题,提及对开源、AGI等看法,并给中国开发者和创业者寄语。
当AI学会了验证自己的推理
MiroMind发布AI agent家族,实现可验证的准确推理
本文介绍了MiroMind发布的研究型AI agent家族MiroThinker-1.7和MiroThinker-H1。当前多数AI系统是聊天机器人,缺乏解决问题的能力,而MiroMind提出“重型AI agent”概念。MiroThinker-H1在多基准测试达业界先进水平,其设计理念颠覆传统。MiroMind从深化推理和加强中间决策两方面提升交互质量,引入升级agent原生训练和验证为中心的重型推理模式两大技术。实际案例显示其在金融、体育、娱乐预测上准确性高。MiroMind的AI推理平台已发布,App具备多种功能,未来有望助力各领域,推动AI成为人类解决复杂问题的可靠伙伴。

一文总结刚刚的飞书新品发布会 - 向Agent平台的跃迁。
飞书新品发布会升级aily和妙搭,向Agent平台跃迁
2026年3月19日飞书新品发布会对AI助手aliy和飞书妙搭全面迭代,向Agent原生平台跃迁。飞书aily从问答式AI助手升级为常驻联系人列表的Agent,原生支持调用企业内数据和用户分层权限,可继承小龙虾记忆、迁移技能,还能自动处理工作、生成周报、设置定时任务,有普通版和专业版。飞书妙搭底层升级为原生Code Agent,有灵感探索和应用开发两种模式,能助力开发合同填写等应用,深度集成飞书身份和权限体系。此外飞书还更新了多维表格Agent,可对表格数据进行可视化处理和智能分析。飞书具备Agent所需的上下文、工具和权限,是适合发展Agent的平台。

Sive AI 数据可视化新玩法
AntV团队推出Sive AI实现对话式数据报告生成
AntV团队人员分享做数据时工具切换折腾、AI工具修改不便的困扰。为此,团队推出Sive AI,它能通过对话逐步完成数据报告,无需推翻重做,跟上思路变化。该工具无学习成本,图表表达空间足。官网已有其生成的报告示例,平台刚上线较轻便,使用体验流畅,官网https://sive.antv.antgroup.com/可体验。

我们用 MiniMax M2.7 改造了「十字路口」的整套内容工作流
「十字路口」团队用MiniMax M2.7改造内容工作流
本文介绍用MiniMax M2.7改造「十字路口」内容工作流。此前PinchBench榜单中,MiniMax M2.1排名第二。此次未跑通用benchmark,而是将M2.7接入真实工作流。一是开发Chrome扩展,实现Notion文档一键转公众号排版,M2.7自动拆分任务、抓取DOM结构、排查问题,完成项目并PR到GitHub;二是将播客下载工具接入OpenClaw,M2.7排查项目、修复代码,工具可高效下载播客;三是让M2.7对短视频自动发布工具迭代,补上封面自动适配,多Skill串联表现良好。M2.7处理问题更稳,部分能力由模型自主迭代,迭代有了复利效应。

打破信息过载牢笼!自带亿级研究知识库的Notebook,开放公测
AMiner「Research Labs」自带知识库,开放公测
AI加速时代信息过载引发焦虑,Google NotebookLM的Source - Grounded RAG范式仍有效。AMiner践行此哲学,其「Research Labs」开放公测(https://www.aminer.cn/v2/litmind )。它有三种添加来源方式构建个人知识库,支持本地上传、导入AMiner学术空间文献、闭源检索科研数据。问答限定来源且有出处,支持复制保存笔记。还有七种工具可直接抽取核心成果,如「代码」工具能解析算法论文。公测期间「对话」不限次,七大工具每日免费使用5次,生成结果支持下载,可填问卷反馈建议。

MiniMax M2.7: 开启模型的自我进化
MiniMax稀宇科技发布M2.7模型开启自我进化
2026年3月18日上海消息,MiniMax稀宇科技发布M2.7模型,开启模型自我进化。M2.7能自行构建复杂Agent Harness,完成高难度生产力任务,在软件工程、专业办公、互动娱乐等领域表现出色。软件工程上,擅长代码生成、故障调试,可完成完整项目交付;专业办公里,提升专业知识和任务交付能力,能处理办公文件,与复杂环境交互;互动娱乐方面,加强人设和对话能力,开源OpenRoom项目。此外,公司还用M2.7参与机器学习任务测试,展现良好性能。

LitClaw:一只真正替你高效干活的 AI 龙虾
LitClaw发布,可高效完成多种任务且保障数据隐私
文章介绍了AI工具LitClaw,它能像靠谱研究助理一样独立完成任务。与开源框架OpenClaw相比,LitClaw即装即用。它是通用AI Agent工作系统,可整理文献、做竞品分析PPT、进行数据分析等,还能远程遥控。LitClaw注重交付质量,有上百个专业调优技能,采用本地运行架构保障数据隐私。用户可通过访问官网下载、注册绑定后使用。

杨斌:确定token的中文译名,已经迫在眉睫了
杨斌提议推广“模元”作为AI领域token中文译名
2026年英伟达GTC大会上,黄仁勋演讲中“token”出现超70次。作者杨斌年初提议其AI领域中文译名为“模元”,如今觉推广愈发必要。“模元”是AI时代核心经济标尺,具信息、算力、货币单位三重属性,全球大模型日均模元消耗巨大,中国模型调用量占比超60%。当前行业交流多用英文“token”,给大众带来认知隔阂。此前多种中文译名有局限,“模元”意译适配AI时代,对大众、产业、未来都有优势,作者期待大家采用该译法推动AI普及。

LibTV 上线,首个同时面向人与 Agent 的专业视频创作平台
LiblibAI上线首个面向人与Agent的视频创作平台LibTV
2026年3月18日,LiblibAI推出首款专业AI视频创作产品LibTV,它是首个同时面向人与Agent的视频创作系统。对创作者,它是专业工具,可容纳AI视频创作全流程,提供创意赋能、专业控制等能力,还有全流程闭环、自由组合节点等特点,且有性价比高的模型Hub。对Agent,可通过Skill接口调用创作能力,自动完成剧本生成到剪辑等工作,还能实现多种创作场景。此外,LibTV定价优惠,年卡最低39折,部分模型有额外优惠,创作者成本更低。

全球首个企业级Agent平台“悟空”来了
阿里巴巴发布全球首个企业级Agent平台“悟空”
2026年3月17日,阿里巴巴发布全球首个企业级AI原生工作平台“悟空”。它是独立应用,开启邀测且会内置到钉钉,支持连接企业账号等。与其他产品不同,它诞生于企业组织,有安全保障。上线后全球用户可下载,支持连接主流IM平台,能多端使用。同步推出AI能力市场,打造Skill生态,阿里旗下B端商业能力的Skill也将接入。还发布OPT十大行业解决方案,覆盖电商等十大场景,让用户一键拥有“Agent团队”。

GLM-5-Turbo:Agent原生,龙虾增强
智谱推出GLM-5-Turbo模型及龙虾套餐等相关服务
2026年3月16日,智谱推出面向OpenClaw龙虾场景深度优化的基座模型GLM-5-Turbo。该模型从训练阶段针对龙虾任务核心需求优化,增强工具调用等核心能力,在自研基准测试ZClawBench中领先。同时发布龙虾场景端到端Agent评测基准ZClawBench。内测中,多家大厂给予高度评价。智谱还推出基于GLM-5-Turbo的龙虾套餐及企业级安全管理体系。GLM-5-Turbo现已上线,开发者和企业用户可通过多种方式接入使用,还有限时福利。

Unity 中国 x 小牛 携手开启两轮车 AI 智能化时代
Unity中国与小牛电动携手开启两轮车AI智能化时代
2026年3月17日,小牛电动召开科技新品发布会,推出旗舰新品系列和自研的NIU AiOS操作系统。其深度技术合作伙伴Unity中国,首次将实时渲染与数字孪生技术引入两轮电动车领域,为小牛电动全系新品带来次世代数字交互体验。搭载NIU AiOS的小牛旗舰车型革新了交互界面,用户操作能获如3A游戏般的视觉反馈。小牛电动与Unity中国还将共同探索实时3D渲染技术,构建两轮出行数字生态。

当每个人都能想出100个产品idea,更重要的是什么?
Mio的AI商业观察剖析AI时代产品idea判断要点
AI时代可能性供给爆炸,人们易产生大量产品idea,但真正挑战是在信息噪音中保持判断力。信息多使人陷入认知兴奋、路径犹豫、误把知道当验证等状态。多数idea因只是概念、兴趣点、功能表、短期冲动而不值得做。此时更重要的是定义问题、建立优先级、快速验证和反复校准,在复杂世界做出清晰判断。

意义的陷阱
大石繁宏探讨生活意义及“意义陷阱”问题
文章围绕生活的意义展开探讨。先指出有人质疑幸福,提出美好生活可能是有意义的生活,其由重要性、目的和连贯性定义,无意义生活则相反。以亚当斯 - 皮克特为例说明有意义生活的样子,但人们也面临“意义陷阱”,一方面伟大成就难企及,另一方面很多人误解获得意义的条件。多数美国人认为自己生活有意义,宗教信徒、具特定人格特质者更易有此感受。不过,生活意义也会带来问题,如“意义错位”。最后提出避免意义陷阱的方法,还指出心理富足的生活是通往美好生活的第三条路。

我们也许不该再投资 GUI 思维的软件公司
真格投资总监钟天杰建议勿投资GUI思维软件公司
2026年初,一批主流软件公司支持和开发CLI和官方MCP服务,已有CLI界面的企业面向Agents提供官方skills。作者认为人类是效率更低的Agent,GUI是弥补人类认知缺陷的补丁,是一种界面税。Agent完成任务时需信息获取、信任授权、决策判断、算力执行,软件应站在Agent执行长程任务的必经节点上。协议竞争靠成为标准,最有价值的软件公司是成为Agent工作流默认协议的公司。GUI在Agent时代会降级为控制面板,不应再开发仅存在于执行层的GUI产品,应将资源投入到CLI、API、官方Skills上。
[A's周刊 20] 能看看你的宠物吗
腾讯ART IPS发布周刊介绍多领域科技设计动态
这是腾讯ART IPS发布的周刊,介绍2026年3月2 - 15日的设计与科技动态。包括苹果宣传MacBook Neo时,蓝白3D小人偶走红;年初开源AI智能体框架OpenClaw引发“养虾大战”,多家公司推出相关产品;3月2日,Anthropic为Claude Code推出语音模式;JKR工作室为Yahoo品牌焕新,强调90年代怪趣气质;小米在MWC 2026上发布Vision GT电动超跑概念车,参与游戏概念车项目。

2026 年,塌房最快的 AI 公司出现了
AI互动游戏平台「幕间」融资后遭创作者集体反噬
2026年,AI互动游戏平台「幕间」官宣两轮千万美元融资仅一周,就遭创作者集体反对。该平台主打“类酒馆”“免费社区”定位吸引玩家创作内容,但融资后,创作者认为平台将创作内容变现、对商业化暧昧,还删帖、解散群聊、对API收费,且让创作者承担内容违规风险。此外,网友指责其抄袭。这反映出AI时代技术开源与商业化的矛盾,以及对版权和创作者成果的漠视,类似现象在AI创业中普遍存在。文章强调需重新审视版权、用户贡献和开源参与者权益,保障贡献者权益,维护商业和社区生态健康。

[视频] 企业浏览器进化论:「伴随式AI」的探索和实践
360集团杨丽香分享企业浏览器「伴随式AI」实践
2026年3月20日消息,360集团杨丽香在Web进化论2025年度大会分享企业浏览器进化。回顾其发展,从聚焦合规到与业务融合,如今全面拥抱AI。针对政企AI落地痛点,360提出「伴随式AI」,以浏览器为基座嵌入工作场景,并完成系统升级。未来企业浏览器将朝入口价值强化、操作系统化演进、任务自动化升级三个方向进化,正从被动工具变主动伙伴,为企业智能转型开辟新路径。

鹅厂员工都Vibe Coding出了什么好玩的东西?
鹅厂员工用Vibe Coding开发众多有趣项目
文章介绍了鹅厂员工用Vibe Coding开发的各类有趣项目。如有人开发了「鹅厂饭友」date小程序、年会街机小游戏、AI出片神器等。不同岗位员工也各有成果,像开发监控电脑硬件状态摆件、寿司相关小程序、管理对话记录的「问渠」工具、班前休闲小游戏、本地相册搜索app、AI短剧制作工作台、超级工具箱、约饭小程序、收租管理小程序、macOS原生小工具AgentCrew、3D打印监控界面渲染引擎、音频效果器、划词翻译插件、噗噗健康打卡小程序等。最后邀请读者体验并分享作品,还设置了抽奖活动。

Robotaxi商业化落地前夕,曹操出行运营资产开始兑现潜力
曹操出行启用3600个Robotaxi虚拟站点并布局未来
Robotaxi商业化落地前夕,曹操出行运营资产开始兑现潜力。当前Robotaxi只能在固定站点上下车,3月17日曹操出行在杭州启用3600个虚拟上下车点。全球市场规模预计2030年达666亿美元,众多企业纷纷布局。Robotaxi要跑通商业闭环需提升订单量、降低成本。曹操出行有完善线下运维网络、成熟运营能力和良好口碑,能吸引更多订单。成本上,其采用“智能定制车+智能驾驶技术+智能运营”模式,通过定制车降本、协同研发车型、利用换电网络和打造绿色智能通行岛等方式,降低技术和运营成本。2020年曹操出行开始探索,现投放百辆,计划2030年投10万辆。

春节AI热潮之后,网民真的开始用AI了吗?|T-ask调研
T-ask调研春节AI热潮,揭示用户使用情况及留存因素
T-ask调研平台春节期间收集1098份问卷,研究网民AI使用情况。近九成受访者注意到春节AI活动,红包等福利促使用户尝试,社交媒体是主要触达渠道,男女接触渠道有差异。春节场景使AI能力具象化,亲缘场景参与度高,为首次使用者提供任务线索,新用户留存率高。超八成网民对活动反馈正面,'惊艳感'决定用户是否留存,经济激励有强化作用,但'超预期体验'才是关键。现金红包类活动最受认可,71.9%网民认为AI进入生活。节庆场景或成AI社会化重要入口。
