Signal #2:AI 工具正在获得长期记忆
近期,多种 AI 工具开始引入长期记忆能力,AI 的交互模式正在从“无状态对话”逐渐走向“持续状态协作”。
例如:
- Anthropic 在 Claude 中加入自动记忆功能,使系统能够在长期任务中自动记录用户偏好与关键上下文。《How Claude remembers your project》
- Visual Studio Code 在 1.110 版本中引入 Session Memory,使 AI Agent 能够在多轮交互中持续保存计划与执行指引。《February 2026 (version 1.110)》
- 在 Agent 框架领域,诸如 Mem0 等记忆系统也逐渐成为基础组件,用于实现跨会话、跨 Agent 的长期知识管理。《别再硬扛原生记忆了!OpenClaw内置Mem0,让Agent更省token、更智能》
这些变化背后的共同趋势是:
随着 AI 开始承担越来越多的长期任务与复杂协作,系统需要具备持续记忆能力,以避免每次交互都从零开始。
在这种情况下,AI 工具的交互模式也正在发生变化——
从一次性的“无状态交互”,逐渐演变为具备持续上下文的“持续状态系统”。长期记忆的引入,也为 AI 作为长期工作助手和复杂任务执行者提供了重要基础能力。

折叠屏适配的天坑,苹果给了一个绝妙的解法
苹果折叠屏似iPad mini,解决屏幕适配难题
文章围绕苹果折叠屏设备展开。先指出科技圈传苹果折叠屏预计2026年9月量产。折叠屏虽已出现多年,但市场渗透率低,难被大众接受,主要问题是用户体验痛点,如折痕和屏幕适配。屏幕适配难是因比例变化大,增加App设计工作量,且用户量少,不值得研发团队认真优化。而苹果折叠屏类似折叠版iPad mini,折叠前后屏幕比例相近,可复用iPad系统,无需额外适配,解决了屏幕适配痛点。最后探讨消费者是否会为折叠平板买单。

Maps UI-Kit上新:RoutePlan组件,从地点搜索到路径规划,加速构建您的地图Agent
百度地图发布Maps UI-Kit RoutePlan组件加速地图Agent构建
2026年3月6日,百度地图发布Baidu Maps UI-Kit第二期RoutePlan组件。此前首发的Places组件开放3.4亿个地点信息,而RoutePlan组件深度集成路线规划计算能力,有出行方案、复杂路况感知等核心能力。它是‘Agent时代’标配,可构建低代码Agent闭环,实现‘Place + Route’组合,且性能优、视觉统一。该组件适用于本地生活/社交App、企业内勤/物流管理、AI出行助手等场景。已安装UI-Kit的用户可一键升级,文中还提供使用文档API和AI Skills项目链接,最后发起福利活动,征集用户对下一个上新组件的期望。

🧨不仅仅是动效:实时交互系统如何打造极致沉浸的语音拜年体验
小红书社交技术团队打造实时交互系统用于语音拜年活*
2026年春节,小红书社交业务推出「语音拜年」与「表情烟花」活动。为实现跨端一致的沉浸式音画体验,团队构建「实时动态交互系统」。该系统面临实时语音识别、高性能粒子渲染等挑战,为此从架构、调度、体验三方面治理。架构上五层解耦,实现能力复用等;调度层基于多维特征融合计算,引入二次动态调度和双阈值模型;选用自研Predy引擎,实现动态性与高性能兼得。语音识别采用自研FireRedASR2S系统。系统构建四维核心指标体系,春节活动中触达成功率达99.9%,后续将引入更智能决策能力。

2026 Flutter VS React Native ,同时在 AI 下对比原生开发,你没见过的版本
2026年文章对比Flutter、RN及AI与原生开发优劣
文章从多方面对比了2026年Flutter和React Native,并探讨AI下跨平台与原生开发。渲染架构上,Flutter用Impeller引擎,React Native新架构用JSI和Fabric;性能测试显示Flutter帧率、启动性能更优。外观一致性上,Flutter有优势但缺平台特性。运营风险上,React Native热更新曾有优势,现需付费;Flutter热更新能力弱但Shorebird方案有价格优势。成本方面,二者各有优劣。AI时代,原生开发虽有性能优势,但AI在中大型项目能力有限,跨平台开发在某些场景更有优势。

Flutter 发布官方 Skills ,Flutter 在 AI 领域再添一助力
Flutter发布官方Skills助力AI领域开发
2026年3月6日,Flutter发布官方Skills,补全其在AI编程缺乏官方技能的短板。flutter/skills是供AI Agent使用的技能库,为AI提供决策逻辑、详细指令和严格约束。其所需数据来自Skills CLI,CLI调用Gemini将官方文档转化为SKILL.md,有generate - skill和validate - skill两个核心命令。目前项目覆盖20多个技能,涉及基础环境、核心架构等类别,能帮助AI完成项目管理和迭代,降低开发者使用AI辅助开发的门槛,让AI更专业。

Next.js 16 微前端新玩法:Multi-Zone 本地搭建全流程
搜狐技术介绍 Next.js 16 微前端 Multi-Zone 本地搭建流程
文章介绍 Next.js 16 微前端 Multi-Zone 本地搭建流程。Next.js 16 移除基于 Module Federation 的微前端支持,可通过 Multi-Zones 或 Vercel Microfrontends 实现微前端应用。应用代码库存放有 Monorepo 和独立仓库两种方式。以电商和商品应用为例,创建两个 Next.js 应用并配置端口。本地测试可借助 Nginx 或 Node.js 代理实现同一域名下访问。同一 zone 内跳转用 Next.js ,跨 zone 跳转用普通 标签。部署到 Vercel 时平台负责路由。 
前端如何写出优秀的 AI Agent Skills
搜狐技术分享前端写优秀AI Agent Skills的方法
文章围绕前端如何写出优秀的AI Agent Skills展开。先介绍Agent Skills是开放标准,由Anthropic发起,主流AI编码工具已采纳,其核心是SKILL.md文件,包含元数据、指令正文和可选资源,工作机制采用渐进式加载。接着说明不同工具Skills存放位置不同,还详解了SKILL.md文件写法,包括YAML头信息和Markdown正文。然后总结写好Skill的10个核心原则,如只写Agent不知的事、按风险调管控力度等。还拆解了GitHub上的优秀案例,最后进行前端实战,给出组件生成Skill示例,并提供避坑指南。

开启一码五端,NutUI 组件库助力黄流跨端实现
NutUI组件库助力黄流业务实现一码五端并邀共建
在“京东订单鸿蒙-回跨iOS/安卓”项目中,NutUI组件库助力实现一码五端。此前,NutUI在2024 - 2025年做了鸿蒙和iOS/安卓适配,推动了黄流业务基础组件库@hlfe/ui落地。该组件库整合Taro Components和NutUI,为开发者提供统一入口。其实现采用双层组件架构,智能导出组件。使用时需创建项目、确认包引入和配置项。核心能力优化包括五端适配、扩充组件功能、完善无障碍支持和升级Icon库。如今@hlfe/ui已开放30 + 组件,未来会开放更多,还邀请伙伴共建。

养虾只需丢给 Qoder 1 个 Skill:安装、配置、上手 OpenClaw 一次性搞定
Qoder助力用户安装、配置并上手OpenClaw
文章围绕使用Qoder安装、配置和上手OpenClaw展开。养虾者可将Skill文件交给Qoder,让其完成相关操作。首先要下载安装Qoder IDE,在官网注册账号并激活,领取Credits;接着安装OpenClaw、配置机器人、对接Qoder CLI。然后介绍把Qoder CLI接入OpenClaw的方法,ACP是对接协议,与OpenClaw自带的Sub - Agents分工不同。对接分三步:装ACPX插件、打开ACP开关、配置Qoder CLI。对接成功后,可通过打命令或说人话在OpenClaw里派活给Qoder,还介绍了线程绑定和排查问题的方法。

深大智能:基于阿里云 MSE 实现云原生高可用微服务架构,释放运维人力拥抱 AI 时代
深大智能基于阿里云MSE构建云原生微服务架构转型AI
浙江深大智能科技是智慧文旅方案提供商,业务扩张和AI转型使核心系统面临挑战。如版本发布缺灰度能力、业务高峰易雪崩、自建Nacos运维难、传统运维难支撑转型。为此采用阿里云MSE构建云原生微服务体系,有无损上下线与预热、全链路标签路由、Nacos全托管上云等方案,成果显著,实现运维人力释放和智能化转型,提升了稳定性、发布效率,优化成本,加速战略转型。

一站式值班运营功能线上化实践
京东物流郭忠强实践一站式值班运营功能线上化
文章介绍京东物流郭忠强的一站式值班运营功能线上化实践。大型复杂系统值班的Data Correction工作,新手上手成本高、老手也易出错。为此,借助XBP流程功能建设线上化系统运维小助手。功能落地方面,包括运营与XBP流程规划,如确认表单内容、多场景字段复用、按场景展示表单字段等;审批消息监听处理,不同处理类型对应单独处理器;编码上要做并发防重和幂等性支持,进行表单数据校验和通知提示等。最后展示了使用案例、审批效果和消息通知情况。

2026 年,万物皆 Coding Agent 的平台工程新范式(A2A / ACP / MCP / Skill)
2026年平台工程将迎来万物皆Coding Agent新范式
文章指出2026年智能Agent网络化协作将成企业DevOps核心趋势。过去几年DevOps工具链复杂,AI正重塑其为Coding Agent。当前平台工程面临Agent孤岛化问题,成本高、效率低。其AI化历经0到4阶段,正处3到4过渡。介绍连接Agent孤岛的三层协议:A2A解决跨平台协作,ACP管理进程生命周期,MCP统一工具调用接口,Skill描述Agent能力。阐述外部编排和Workspace Agent两种编排模式及特点。还介绍Routa编排架构,采用混合模式,实现多Agent编排,让平台工程成为智能体网络。

58数科UXD年终重磅:我们给金融业务造了一个"操作系统",让设计效率暴涨300%
58数科设计团队发布FVOS 2.0提升金融设计效率
2026年,58数科设计团队打造FVOS 2.0金融视觉操作系统。此前,多业务线面临品牌碎片化、重复造轮子、AI能力不足等问题。FVOS 2.0从金融场景定制、全链路视觉触点、硬软协同管理三方面定义。硬件基建含4大手册和组件库,实现色彩体系、设计语言、信任体系和组件复用;软件动力有3个AI Agent,搭建自动化工作流;系统动力为底层知识库,沉淀经验并外溢方法论。通过58好借、营销活动、乐业贷等案例,证明其提升设计效率和业务指标,还重新定义设计团队角色,释放人力、重构关系、外溢经验。

小团队高效能:Android Studio 中的 Gemini 助 Ultrahuman 实现 15% 研发提速
Ultrahuman 借助 Android Studio 中 Gemini 实现 15% 研发提速
消费级健康科技初创公司 Ultrahuman 的应用由八人团队维护,处理积压工作耗时久。该团队借助 Android Studio 中的 Gemini 改善工作流程,用其聊天功能快速构建低功耗蓝牙连接的 GATT 服务端原型,改进数据同步、延长设备续航。Gemini 还在多场景发挥作用,如优化算法、分析日志等。这些改进每周为团队节省数十小时,使向测试版用户提供新功能的速度提升 10 - 15%,如构建新应用内 AI 助手。Gemini 集成于 Android Studio,能助开发者节省时间、投入创新。

测试基础|质量保证部门是否应该有单独的需求文档?
文章探讨质量保证部门是否需单独需求文档及解决办法
文章探讨质量保证部门是否应设单独需求文档。现代产品团队需求存在不足,导致质量保证与产品经理间有差距。有两种方案:不创建单独文档,优点是无重复、成本低等,但有歧义等缺点;创建扩展版本,能增强覆盖等,但有文件偏差等问题。更智能方法是注重结构化可追溯性,包括协作明确需求、转化差距为测试用例、确保清晰可追溯性、使用支持需求链接工具。缺乏可追溯性会引发诸多问题,质量保证应成为质量架构师,关键是清晰性、协作性和可追溯性。

Xcode 要被干掉了?一句话生成 Swift App,我试了一下
Rork Max平台可一句话生成原生Swift App
文章介绍了网页端AI开发平台Rork Max,它能通过自然语言生成原生Swift App,支持多设备,流程简单,无需Xcode。官方demo显示其生成代码质量有保证,但价格较贵。它对非开发者和创业团队验证MVP有用,不过生成代码存在安全性等问题,复杂业务难以处理。它不会取代Xcode,而是降低简单工具类App开发门槛,对专业开发者是效率工具。

2026年不会指挥AI,你会被AI替代|开年必读AI指南(一)
李开复谈2026年多智能体上岗及人类应对之法
李开复在2026年指出,今年是企业多智能体上岗元年,AI正从“一人一工具”迈向“一人一团队”。多智能体可分工协作,沉淀业务资产,在核心办公场景将扮演关键角色。基于数字、重复性工作易被AI取代,多智能体实现从“执行”到“思考”跨越。未来职场,人与AI边界将重新划分,人类应进化“战略定义力”与“价值判断力”,未来企业架构是“人类架构师+智能体集群”,复合型员工是人机协作核心。

从“做事”到“成事”的分水岭:管理预期
老齐剖析产品开发预期管理缺失问题并给出实战原则
文章指出产品开发中产品经理常因预期管理缺失成背锅侠。先解释预期管理是让各方对未来有合理一致看法,达成“做什么、何时做、做成什么样”的共识。接着分析管理难的原因是产品经理权力小责任大,各方期待不同。然后给出四条管理原则:提前识别预报风险,透明胜过承诺;及时对齐需求与设计,高频沟通、可视化表达并留存记录;管理期望值而非只盯需求,提供多方案;预留缓冲空间,包括时间、需求缓冲和风险预案。最后强调预期管理在各工作中都重要。

AI到岗我下岗:牛马贬值,血洗中层,应届生成了AI助手
AI冲击就业,多位打工人被裁并面临职业困境
2026年是AI大年,美国金融科技公司Block以AI支撑小团队完成高产出为由裁员40%,打破旧规矩。文中追踪四位被裁打工人,95后七七、小艾、筱筱因AI先后被裁,00后翩翩因便宜被留,但工作压力大且担心转正被裁。AI冲击下中层加速贬值,因其性价比不如AI和初级员工。当下AI有缺陷,员工要扮演多种角色。被裁人员有不同打算,国家层面已考量AI对就业的影响,人们需在与AI的竞合中找准位置。

职场|开发者(包括测试)如何避免与产品经理产生争执
trivago提出SLO方法助力开发者与产品经理协作
文章源于trivago技术博客,为开发者、测试人员提供与产品经理协作思路。开发与产品经理因视角不同,在“速度vs质量”上易起争执。服务等级目标(SLO)是基于用户期望的服务可靠性量化目标,以错误预算为落地抓手,能让决策有客观依据,减少冲突。trivago在多业务模块落地SLO,兼顾技术与业务指标,开发工具并搭建仪表盘。落地SLO要基础学习、小范围试点、贴合实际定指标、持续迭代,拒绝100%可靠性。开发和测试人员应重视可靠性,用数据沟通,将SLO作为协作框架,推动跨角色达成共识。

从 DeepSeek 到 o3,AI终于可以帮你干活了
极思TopMinds创建社群助职场人将AI应用于业务
2026年AI应用成职场晋升硬性指标,但职场人存在“懂AI”和“能落地”的鸿沟。很多教程只教工具,忽略解决业务问题。AI技术迭代快,个人独自摸索成本高、效率低。为此创建TopMinds社群,它是持续进化的学习生态,拒绝单向灌输,关注AI赋能具体职场角色,通过拆解问题、专家共创和成员互助形成实战方法论,让成员获得职业能力资产。

当 AI 开始参与开发之后,软件工程正在重新学习“如何表达”
AI参与开发后,软件工程重新学习‘如何表达’
文章探讨AI参与开发后软件工程的变化。过去软件开发以人类编写代码为中心,AI出现使开发者将任务交予Agent,实现变快,但在团队环境中,消耗时间在补充背景等以确保系统理解。开发重心从实现功能转向如何向系统表达问题,因为自动化依赖可共同理解的中间形态。自然语言利于沟通却难稳定协作,团队引入更多约定,表达从语言转向结构。中间表示(IR)走出系统内部,成为研发流程中心,协作围绕表示展开,软件工程出现设计表示本身的新工作方式,未来发展取决于如何设计表示。

一起奔跑,奔赴下一站:构建AI时代的工业数据基座
涛思数据构建AI时代的TDengine工业数据基座
涛思数据的TDengine TSDB时序数据库全球安装实例数超百万。在AI浪潮下,涛思数据思考自身价值,决定构建AI时代的工业数据基座。工业数据有强实时性等特征,AI难处理,需强大工业数据基座。IDMP工业数据管理平台负责数据目录、标准化和情景化,让AI发挥作用。可视化从展示走向洞察,IDMP可视化围绕数据洞察。TDengine是开放系统,保障数据安全。TSDB+IDMP组合成完美工业数据基座,未来软件形态是Agent Interface+数据基座,涛思数据希望TDengine成为工业数据基座。

「软件工程3.0」十大开发原则
朱少民提出软件工程3.0十大开发原则
文章介绍软件工程3.0十大开发原则。在大模型与智能体技术发展下,软件工程3.0是核心价值观重塑。原则包括意图优先,将业务意图转化为可执行验收标准,降低信息不确定性;人机共生,人类负责价值判断等,AI负责执行;强调意图设计和高价值问题驱动;数据先行,沉淀高质量私有数据和知识;流程自动化,提升反馈频率;全链路集成大模型;异构对抗保障质量;以可执行验收测试为活文档;模型资产化管理;构建持续自适应系统。这些原则是对软件工程未来探索的行动指南。

软件工程3.0的理论基础 (1)——信息论
朱少民阐述软件工程3.0信息论理论基础
文章从第一性原理出发,指出软件工程是将人类意图转化为软件系统,要化解意图与实现、复杂性与可靠性两对张力。软件工程3.0理论基础需解释三个核心命题,本文聚焦信息论。信息论中,软件工程核心是降熵,自然语言需求高熵,代码和测试低熵,“意图优先,验收为纲”可降低不确定性。不同时代软件工程降熵手段不同,LLM是强大“意图降熵引擎”。知识图谱可替代有噪的“人脑信道”,提升知识传递效率。AI智能体决策基于信息增益,要权衡信息价值与成本,多智能体协作信息交换很关键。信息论为软件工程3.0核心实践提供理论支撑。

吴恩达来信:DeepLearning.AI Skill Builder工具隆重上线!
吴恩达团队发布AI技能评估工具Skill Builder
2026年3月2日,吴恩达宣布DeepLearning.AI Skill Builder工具上线。该工具可帮助使用者了解自己在AI各领域的优势与提升空间,并给出提升技能的建议。它能针对不同阶段用户提供个性化反馈,从初学者到高级用户均可获益。工具完全免费,对话后会生成总结报告并推荐学习内容,DeepLearning.AI Pro会员还能获得更详尽反馈,可辅助用户在评估技能、规划项目等方面清晰前行。

pdf2skill:让计算机视觉初学者把PDF文档变成AI技能包
pdf2skill技术可将计算机视觉PDF文档转化为AI技能包
文章介绍pdf2skill技术,它能将PDF文档知识转化为AI可调用的结构化技能包。先指出计算机视觉研究和工程中的困境,引出该技术。接着说明常见误区,介绍其五大核心模块原理。通过YOLO论文实战案例展示效果,给出Python代码示例。还列出关键要点,包括与传统工具对比、架构优势、PDF类型识别等,给出性能数据对比。最后提供工具使用指南和参数调优建议。

深入剖析Spark UI界面:参数与界面详解|得物技术
得物技术深入剖析Spark UI界面参数与界面
文章由得物技术发布,深入剖析Spark UI界面。先介绍其是Apache Spark内置Web监控界面,能提供Spark应用实时可视化洞察。接着阐述一级入口,如Executors展示集群资源使用等,Environment展示任务配置项,Storage监控缓存数据,SQL监控优化结构化查询,Stages和Jobs分别从阶段和作业层面定位问题。二级入口的SQL详情页解析操作度量指标,Stages详情页含DAG、Event Timeline和Task Metrics,可据此优化调度和Shuffle问题。实战环节给出两个案例,一是scan表慢和内存问题,可通过设置表切片大小、调整内存解决;二是shuffle后并行度不足,可用万能参数增加并行度。最后总结优化需考虑内存与并行度相互影响,给出配置建议。

200行代码实现Claude Code青春版
陈铭豪分享AI Coding Agent本质并给出200行代码实现
作者分享AI辅助编程体验,介绍AI Coding Agent本质与实现。起初用AI写代码遇问题而退订,后因提效案例重新入坑。指出Coding Agent本质是while循环加上下文工程,其流程为用户提目标,系统读取信息,模型输出行动,调用工具执行并反馈结果,直至任务完成。复杂性在于上下文工程,如今因LLM能力提升才“工程可用”。还解析了MCP、Rules等概念本质是处理上下文。作者提醒使用时掌控上下文,避免不当操作。最后给出200行代码实现Claude Code青春版,强调理解Agent本质可明确人需完成的工作。

深入解析OpenClaw上下文窗口压缩方案 :一切都是为了效果与省钱
文章深入解析OpenClaw上下文窗口压缩方案
文章深入解析OpenClaw上下文窗口压缩方案,用于解决AI Agent长会话中上下文窗口溢出问题。该方案分三个阶段管理上下文,采用渐进式降级原则。预防性裁剪在LLM调用前进行,包括限制历史轮次、裁剪旧工具结果和截断单条工具结果。Compaction是核心的压缩机制,在接近上限或溢出时触发,通过摘要替代原始消息,有详细流程和算法,还考虑了安全保护。溢出后恢复会进行检测并依决策树操作,有相关约束。此外,方案使用chars/4估算token,给出了配置项汇总和全景流程图,核心思路具有渐进式、保护信息、自适应等特点。最后分析了对Provider KV Cache的影响及成本。

Agent Team 实践与架构设计:在约束下构建可演进的一个人开发团队
Phodal 分享 Routa 多 Agent 系统实践与架构设计
本文围绕在约束下构建可演进的多 Agent 系统展开。构建多 Agent 系统面临 Token、流程复用、工具选择三大约束。作者结合 Routa 分享实践,其架构类似人类团队,有团队领袖和不同成员。核心原则包括跨 Agent 通信、上下文工程等。还介绍可演进设计,如 ACP 协议让工具可灵活替换,Specialist 按需组合,状态外置与上下文隔离,流程代码化。采用事件驱动,EventBus 像神经网络,EventBridge 统一事件格式,Workflow 梳理任务秩序。同时提到分层资源管理、通信分离等原则,并以 Issue Enricher 为例验证多 Agent 协作工程化。

3D数字分身的奇幻舞台:火山引擎空间视频技术解密
火山引擎空间视频技术助力2026春晚实现3D数字克隆
2026年总台马年春晚,火山引擎空间视频技术实现“3D数字克隆”。其数字分身有透视随镜、光影共生特征。技术底座是空间视频解决方案,先通过70台相机和4D高斯泼溅算法进行四维重建生成4D资产,再导入游戏引擎,与导播、灯光系统联动。面对多人同台和近景特写难题,引入豆包大模型,用影子几何优化减少计算量,用法线先验消除光影闪烁。该技术正将数字分身从实验场景推向国家级舞台。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题
火山引擎多媒体实验室提出GenDR系列模型探索扩散模型落地难题
火山引擎多媒体实验室在ICLR 2026提出GenDR系列模型,探索扩散模型超分落地难题。扩散模型虽在图像生成任务有突破,但推理步数多、处理分辨率有限,在实际业务难落地。GenDR基于16通道VAE和小模型训练,通过VAE迁移和基于一致性的步数蒸馏提升效率和生成细节真实性,在1080p输入能1s内实时处理。GenDR - Pix去掉VAE,用Pixel - (Un)Shuffle替代编解码,经多阶段训练和优化,处理4K图像时可减少耗时、显存占用和计算量,支持高分辨率图像高效处理,为扩散模型落地提供可行路径。

聊聊DeepMind创始人哈萨比斯:一个科学家与失控的AI竞赛
DeepMind创始人哈萨比斯在AI领域经历起伏终获突破
本期播客对话《哈萨比斯:谷歌AI之脑》译者周健工,探讨DeepMind创始人哈萨比斯。他4岁下国际象棋,13岁成大师,后投身AI。他创立DeepMind,目标是发明AGI。早期因执念强化学习,错失大语言模型先机。但在谷歌支持下,AlphaGo击败李世石,AlphaFold破解蛋白质折叠难题,他也获2024年诺贝尔化学奖。后来谷歌调整策略,DeepMind追上对手。哈萨比斯认为AI有益,能助人类解决挑战,但近期也开始警醒AI风险。

为什么顶尖投行都选择了 Rogo 这个金融 Agent?
Rogo公司推出金融Agent,获超50家顶级金融机构青睐
文章介绍专为金融领域打造的AI工具Rogo,分析它受顶尖投行青睐的原因:全球投行业务交易量大,初级分析师工作重复且压力大,金融AI落地因容错率、数据壁垒和接管成本等问题进展缓慢。Rogo由普林斯顿校友创立,从传统NLP转型为基于LLM的生成式AI架构。其核心是金融分析工作台,涵盖研究助手、数据集成等四部分,采用多模型并行架构和单租户部署方案,能提升效率。它按席位收费,客户和投资方豪华,增长快。市场潜力大,欧美渗透率低。用户满意度高,能养成AI使用习惯。Rogo融资顺利,团队专业年轻。行业内还有Hebbia、Boosted.ai等AI native玩家,以及Anthropic、OpenAI等大模型厂商推出的金融服务产品与之竞争。

用OpenClaw打造一支24小时无休的AI团队,实战来了!
Shubham Saboo公开用OpenClaw搭建AI Agent团队方案
Google Cloud高级AI产品经理Shubham Saboo公开用OpenClaw搭建6人AI Agent团队方案。他原本工作重复耗时,用超级Agent失败后,决定用OpenClaw让6个Agent各负责一项工作。每个Agent核心定义在SOUL.md文件,通过文件系统协作,采用两层记忆系统管理记忆。该方案支持多系统,安装简单,月成本不到400美元,还能每天节省4 - 5小时。不过系统也存在网关崩溃等问题,需相应解决办法,作者给出4周渐进式搭建计划,强调系统优势在于模型周围的体系。

移动端开发稳了?AI 目前还无法取代客户端开发,小红书的论文告诉你数据
小红书联合高校发布论文评估 AI 在移动端开发的能力
近期,小红书联合高校研究人员发布《SWE - Bench Mobile》论文,提出针对移动端应用开发的基准测试 SWE - Bench Mobile。该测试从小红书真实产品流水线提取 50 个任务构建数据集,有严格规则和关键指标。论文评估 22 种“智能体 - 模型”配置,发现当前 AI 在生产级软件工程力有局限,成功率低,智能体架构重要,商业模型占优,存在复杂度陷阱,“防御性编程”提示词更有效。还对失败类型归类,指出当前 LLM Agent 未达企业生产标准,分析各配置成本和耗时,显示 AI 智能体离独立完成中大型移动开发距离远,测试采用托管模式且仅针对 iOS 开发。

Apple 的 ANE 被挖掘,AI 硬件公开,宣传的 38 TOPS 居然是个"数字游戏"?
maderix挖掘苹果ANE,公开底层AI逻辑及测试结论
近日,大佬maderix挖掘Apple Neural Engine(ANE),公开苹果芯片底层AI逻辑。他通过常用手段获取数据,实现内存中将MIL编译为ANE binary,绕过官方限制。测试发现:一是算力“38 TOPS”是数字游戏,M4 ANE真实物理硬件峰值算力为19 TFLOPS (FP16);二是ANE是卷积引擎,非矩阵乘法引擎;三是ANE硬件缓存约32MB的SRAM;四是需利用计算图填满流水线提升利用率;五是ANE有0mW空闲功耗。作者认为ANE是卷积优化机器+深流水线架构,M4上理想的LLM推理策略是ANE预填充、SME解码。此外,项目还有极限性能体现,如优化计算、解决内存泄漏等,M3 Ultra的ANE算力接近3090且有功耗优势。

手把手带你构建第一个业务本体(Ontology):为 Agent 绘制业务地图。
秋山墨客手把手教你构建业务本体用于Agent业务推理
文章围绕构建业务本体展开。先回顾Agent需本体的原因,它能解决“有数据,缺业务语义”问题,为其提供“业务地图”。接着介绍本体的TBox与ABox,前者定义业务概念和规则,后者记录真实业务数据。构建业务本体的流程包括梳理业务范围、抽取概念与设计关系、本体建模、迭代完善和部署应用。还讲解了本体构建的标准(RDF/OWL)与工具(Protégé、推理引擎、图数据库)。通过实战,构建“订单加急交付”业务本体,用Protégé建模并验证。最后介绍用Python程序加载本体、创建实例数据和调用推理机,总结本体可提供业务“导航”,减少幻觉,增强系统可维护性。

出海技术挑战——Lalamove端云协同审核实战揭秘
货拉拉构建端云协同审核体系应对出海审核挑战
货拉拉在全球化扩张中,司机运营团队面临海量审核需求,传统审核模式痛点多。为此,货拉拉建设AI赋能的“端云协同”审核体系,端侧保障数据质量,云端聚焦决策分析。该体系应用于三个场景:人脸比对审核,前端拦截低质量数据,后端精准识别比对;司机注册证件审核,前后端引入OCR技术,后端结合大模型;海外市场车辆月度审核,前端自研轻量级模型,后端用多模态大模型,经迭代有了分组+结构化方案,并注重工程化落地。此体系取得了显著成效,未来还有深度、广度、安全等方面的展望。

货拉拉海豚平台-大模型推理加速工程化实践
货拉拉海豚平台开展大模型推理加速工程化实践
文章介绍货拉拉海豚平台大模型推理加速工程化实践。背景上,大模型在货拉拉核心业务场景规模化落地,推理面临高并发等挑战,平台实践降低50% - 60%机器资源成本。架构方面,海豚平台是一站式云原生机器学习平台,构建完整加速工程体系。关键能力上,资源分配策略基于业务画像,为不同模型和请求划定显存与算力边界;推理优化从模型层(量化、蒸馏)和框架层(PD分离、投机采样、显存和算子层优化)进行;模型测评能力通过客观指标量化优化收益。未来,平台将以工程化推理能力为底座,释放大模型长期价值。

没想到整个二月,我们最有价值的投资是这个
池建强为团队购买TRAE企业版并推荐相关实践手册
作者春节后给团队购买TRAE企业版席位,认为这是有价值的投资。他用AI编程做项目,惊叹Coding Agent进化快。TRAE企业版功能强大,有SOLO模式、Agent Skills等,能让AI成为可管理的生产力。字节跳动大量工程师用TRAE,说明工具贴合工程会自然扩散。企业对AI Coding需求不同,TRAE企业版满足企业对代码资产、权限等要求。其还提供管理能力,如知识库、用量管控等。此外,TARE团队推出《2026企业级AI编程实践手册》,提供方法论和实战案例。

AI Coding思考:从工具提效到范式变革,我们还缺什么?
天猫技术团队探讨AI Coding从工具提效到范式变革缺什么
文章围绕AI Coding在企业级软件研发场景的应用展开思考。指出当前AI Coding工具多、执行能力提升,但企业级业务生产未实现“质变式提效”,瓶颈是目标传达复杂度高,本质是专家知识未体系化沉淀。业务研发应构建分层统一、可自治更新的专家知识库,推动向“知识驱动的智能研发范式变革”。还分析适合AI的工作,强调关注目标传达环节,介绍AI Coding现状、专家知识分层、长期方向及程序员职责变化,指出构建专家知识沉淀机制是业务研发重点。

AI工作流在淘宝交易舆情巡检上的探索与实践
淘天交易业务团队探索AI在淘宝舆情巡检的实践
淘天集团交易业务技术团队分享AI在淘宝交易舆情巡检应用。传统人工巡检有局限,团队借LLM构建智能系统。方案设计按“采集→清洗→AI判断→预警→分发→归因→复盘”流程,AI经“识别→判定→匹配→学习”实现反馈分类。预警有新增、激增监控,通过钉钉推送和可视化看板实现快速响应。方案历经三阶段迭代,确定“预置打标+语义匹配”。团队强调AI是辅助,当前方案待完善,未来将提升性能。

从 if-else 到策略模式:Kotlin 高阶程序员必经之路
搜狐技术探讨Kotlin从if - else到设计模式的转变
文章围绕Kotlin开发中从if - else到设计模式的转变展开。指出随着项目复杂度增加,if - else会成‘代码泥潭’。介绍多种设计模式:策略模式封装运费计算规则,密封类为业务状态建模,工厂模式解耦对象创建与使用,构建器模式简化对象配置,单例模式实现全局管理,高阶函数与Map重构分支逻辑,观察者模式简化事件流处理。还提醒勿过度设计,给出团队重构推动建议,强调思维升级对开发者成长的重要性。

从 if-else 到策略模式:Kotlin 高阶程序员必经之路
文章介绍 Kotlin 从 if-else 到设计模式的重构方法
文章从 Android/Kotlin 开发场景出发,探讨如何将常见的 if-else 逻辑重构为设计模式。介绍了策略、密封类、工厂等多种模式,分析了 if-else 的弊端及模式优势、潜在坑点,还提到不必用设计模式的场景,给出团队重构建议,强调从 if-else 到设计模式是思维升级,思考逻辑变化、职责单一等问题是从初级到资深的关键。

Claude Code、Gemini CLI 与 Codex,三款终端 AI Coding 工具该怎么选?
作者实测三款终端AI编码工具并给出选择建议
文章对比Claude Code、Gemini CLI和Codex三款终端AI编码工具。Claude Code是“前辈”,安装顺畅,理解项目上下文能力强,高级功能完善,有“回退”功能,但不支持AGENTS.md标准;Gemini CLI由Google推出,开源免费,免费额度足,功能复刻Claude Code,但编码效果差,免费额度易耗尽;Codex由OpenAI推出,轻便够用,权限管理智能,适合日常开发。最后给出场景化选择建议,指出没有绝对“最好”,只有“最适合”。

AI编程的下半场来了?学会用Agent Skill解决编程的痛点问题
腾讯云开发推出CloudBase Skills解决AI编程痛点
文章围绕用Agent Skill解决AI编程痛点展开。先指出Vibe Coding下AI代码难上线问题,引出Skills。介绍Skills是含指令等的能力包,工作原理是渐进式加载,行业已有应用。腾讯云开发CloudBase推出CloudBase Skills,为AI提供全栈底座,如身份认证、数据安全等场景案例。还对比了CloudBase MCP和Skills,前者解决连接问题,后者让AI懂规矩,二者结合是“终极形态”。此外分享实战中解决AI不调用Skill的方法,最后提及未来规划。

移动端里的AI,用户到底要什么?---权衡性能和体验之战
京东零售技术探讨移动端AI性能与体验权衡问题
文章探讨移动端AI应用中性能与体验的平衡问题。通过真实冲突场景引出话题,指出AI功能上线后常出现手机发烫、耗电、卡顿等问题。分析用户需求,如爽点、痛点、痒点,强调AI若处理不好会成痛点。提到移动端设备和场景碎片化,多数用户非旗舰机,对卡顿、发热、耗电敏感。阐述AI常见误区,提出轻量化优先、优雅降级、端云协同等正确做法,以分层体验满足不同用户需求。还给出AR手势交互方案示例,总结AI在移动端的核心洞察,强调技术应为人服务,要做体验、有同理心,合理运用AI可提升用户体验,反之则会变差。

游戏数据分析Agent的全栈架构演进
哔哩哔哩技术团队分享游戏数据分析Agent架构演进经验
本文由哔哩哔哩技术人员撰写,分享游戏数据分析Agent全栈架构演进。首先介绍背景,指出游戏数据分析门槛高,结合LLM可助力深化数据理解,但面临诸多挑战。接着阐述架构演进,历经v1.0(LangChain Chain)、v2.0(Dify Workflow)、v3.0(LangGraph)三版方案,前两版因局限性失败,v3.0结合LangGraph和Dify,优势明显。然后说明核心工程实践,涵盖Graphs设计、领域知识处理、状态管理、上下文工程、开发效能、Agent安全等方面。还讲述落地与可观测性,包括内网部署、整体架构、网络设计、补齐开源短板、WebUI设计等。最后进行总结与展望,提及项目经验有长期价值,并规划未来发展方向。

“懂你”的广告从何而来?快手广告商品智能理解系统详解
快手技术团队详解广告商品智能理解系统
文章介绍快手广告商品智能理解系统。广告行业正从“投广告”转向“投商品”,但人工填报数据质量低制约精准投放。为此,快手磁力引擎技术团队构建系统,含两大核心模块:“慧眼+外脑”预处理,用小模型过滤噪音、结合RAG与知识蒸馏,降本提效;MoM混合模型协作,按任务动态路由,平衡精度与成本。业务应用案例显示,系统能在复杂场景下精准理解商品,为精准投放提供支撑。引入该系统后,广告商品信息质量和数量提升,推动行业范式演进。

分享几个 AI Coding 非常实用的 Commands,高效省钱
阿里云分享Qoder AI Coding实用Commands,高效省钱
文章分享AI Coding实用Commands,以提高效率、节省成本。使用Slash Commands斜杠指令可避免Qoder工具搜索项目文件、网页等,直接调用大语言模型给出答案,如/java指令。通过流程图展示代码智能体处理斜杠指令和用户问题的过程,用户可按需求激活或屏蔽工具。还分享了/java、/spring等指令,介绍/llm指令用于直接让大语言模型回答问题,/Programming language指令可指定编程语言生成对应代码。最后总结使用斜杠指令的要点,鼓励在Qoder中使用。

Team 版 OpenClaw:HiClaw 开源,5 分钟完成本地安装
阿里云开源 HiClaw,解决 OpenClaw 落地难题
阿里云开源 Team 版 OpenClaw:HiClaw,可 5 分钟本地安装。OpenClaw 虽有交互创新,但存在安全风险、记忆爆炸、多 Agent 协作低效、移动端体验差和配置门槛高的问题。HiClaw 引入 Manager Agent 角色,按需启用管理系统。它解决了 OpenClaw 的落地挑战,如安全上 Worker 不持真实凭证,移动端内置 Matrix 服务器,多 Agent 协作共享上下文、有防惊群设计等。架构设计上把外接组件变内置,具备 LLM 接入和通信接入能力。安装跨平台兼容、智能检测、Docker 封装、配置少。展示了用 HiClaw 实现 SaaS 产品的流程,适合独立开发者等人群,是开源项目,给出了相关链接。

打造高可靠 AI 助手:Skill 编排、Workflow 设计与 Spec Coding 的深度实践
作者分享打造高可靠AI助手的深度实践经验
文章围绕打造高可靠AI助手展开深度实践探讨。先介绍2025年AI辅助编程发展,对比Vibe Coding和Spec Coding,认为后者更适用于真实项目。阐述上下文工程及Skill概念,分析Skill与Subagent区别,指出使用Skill做AI Coding存在任务复杂、执行准确率低、编写耗时等问题,为此推出kuspec工具,提出Workflow概念。介绍Workflow结构、WorkflowRepo及在Agent中使用工作流的步骤。最后总结工作流适用场景,如特定框架开发、前端UI开发、小众技术栈业务开发、跨团队业务协同等,强调应让AI成为工程师助手,解放人力做更有价值的事。

让问题不过夜:交易领域“问诊”Agent实践
阿里构建交易领域‘问诊’Agent系统提升工程效能
文章围绕交易领域‘问诊’Agent实践展开。先指出研发支持工作碎片化、依赖经验、效率低的痛点,提出构建可持续运营的智能Agent系统。将问题抽象为业务答疑和问题诊断两类,分析做该系统的收益。系统采用四层架构,按子域独立建设专用Agent。Agent构建从‘流程编码+提示词堆砌’演进到‘技能化+原子化’,提出新范式将排查能力封装成可召回的排查文档。知识体系采用公共知识库和场景技能文档双层召回。建立质量评估与闭环体系,用Q-score评分,实现反馈回灌。该系统已在多领域落地,最后指出当前依赖专家、长尾问题覆盖不足等边界,提出降低产出门槛、增强实时反馈等下一步方向。

Skills:从编程工具的配角到Agent研发的核心
阿里云探讨Skills在AI Agent场景中的价值演变与适用场景
文章探讨了Skills在AI Agent发展中的价值演变与适用场景。最初,Skills在Claude Code编程工具中表现平淡,因Commands和SubAgent更契合开发者需求,且编程场景标准化、缺乏复用需求。但在Agent研发场景,Skills价值凸显,可解决传统开发痛点,如重复造轮子、能力孤岛等。它通过建立标准化接口、实现复用和促进生态协作发挥作用。其设计采用上下文工程思想,与传统方案有本质区别。判断是否用Skills可从能力复用频率、复杂度、协作规模和生态开放性考量,它适用于企业级Agent平台等场景,而原型验证等场景不适用。最后指出Skills价值具场景依赖性,其发展还有诸多探索方向。

告别先开发后治理:Agent 驱动的数据质量一体化交付
DataWorks 以 Data Contracts 驱动数据质量一体化交付
文章指出离线数据开发中数据质量建设核心挑战是质量规则融入研发交付全流程。当前开发与治理分离,存在治理滞后、迭代不同步等问题,导致质量保障难工程化。DataWorks 借鉴 Data Contracts 思想,将质量规则以 YAML Spec 形式嵌入开发流程,实现“代码即质量”。介绍了其核心思路、完整工作流,包括在 IDE 配置规则、开发测试、提交发布、查看结果和迭代开发等环节。未来将多引擎覆盖、降低 Spec 门槛、更深融入 IDE,推动数据质量治理工程化。

适老化生命安全监护情境下|独居老人无感跌倒监测
多家公司推出独居老人无感跌倒监测产品
老龄化社会中,独居老人跌倒问题严峻,传统监护方式有局限。文章介绍多款适老化无感跌倒监测产品:旭化成微电子的毫米波雷达跌倒检测方案,针对浴室,保护隐私且检测快;慧眸无忧帮团队的瞳芯颐护系统,集成跌倒、服药及久坐检测功能;上海希卡立科技的毫米波跌倒监测传感器L4,可精准判断卫生间老人是否摔倒;上海三思电子工程的跌倒侦测护眼吸顶灯,将雷达与AI算法集成于灯具,实现无感监护,突破传统监控局限。

Java循环你真的用明白了吗
文章分析Java不同循环方式性能并给出场景选择建议
文章围绕Java循环展开,先从项目老代码优化引出问题,本地测试发现不同循环方式耗时差异大。深入分析底层,普通for循环无额外开销、JIT优化好最快;增强for循环有迭代器检查和方法调用开销;list.forEach有Consumer接口调用和modCount检查开销;stream.forEach有Stream框架和Spliterator管理开销。再次测试显示JIT可优化后两者性能。jdk17下,forEach和stream.forEach性能提升,因C2编译器优化、Stream API底层改进等。最后给出不同场景循环选择建议,强调循环选型应适配场景,平衡性能与可读性。

Skills 真的可以帮我干活了:把工单分析变成一个可复用的 Skill
阿里云开发者将工单分析固化为可复用的 Skills
本文围绕将工单分析转化为可复用 Skill 展开。起初 Anthropic 推出 Skills 但难以在真实环境运行,Claude Code 2.1.3 版本解决部分问题,让其价值渐显。作者把需登录内网、手动操作的工单 SOP 固化成 Skills。工单分析存在数据在内网、高频重复、角色关注点不同等痛点,传统思路获取数据难。作者尝试 playwright - mcp 和 agent - browser 均有问题,后发现 SPA 页面本质是接口渲染,提出 Copy as fetch + agent - browser eval 方案。介绍了 Skills 实现、目录结构、核心工作流程,对比 Skills 与 Workflow,指出 Skills 更灵活、可进化、版本管理友好,最终实现 AI 自动完成数据采集与分析。

完整代码仓库的自动生成:图结构如何让LLM突破代码片段的局限
微软研究用图结构让LLM突破代码片段局限构建仓库
Microsoft Research提出用图结构(RPG)解决LLM生成代码仓库难题。当前LLM生成代码仓库存在计划混乱等问题,RPG用图节点和边表示代码元素及关系。在RepoCraft基准上,其生成代码规模近Claude Code的4倍,功能覆盖率和测试通过率大幅提升。方法上,通过三层图结构解决传统自然语言规划的不足,实验显示其在规模、正确性和定位效率上表现优异。落地建议包括架构规划工具化等,工程实现涉及知识库、探索策略等。未来架构表示将转移,还可与传统工具融合,虽有成本和测试问题,但已具工程价值。

AI“破壁人”李国豪|甲子光年
李国豪团队开源Eigent AI探索人和AI共存社会
本文围绕AI开源多智能体协作平台Eigent AI创始人李国豪展开。1月13日Anthropic发布Claude Cowork,6小时后李国豪宣布Eigent开源。Eigent源于2023年3月的开源项目CAMEL,其社区发展成创业公司。李国豪强调“Local - first”,认为AI应属用户,且“AI的PC时代”已加速到来,目前Eigent已盈利。在探索Agent的Scaling Law方面,他提出“AI Society”概念,在意解锁新应用场景和模拟复杂系统的能力,认为多智能体在并行任务上不可替代。此外,他所在团队开源400多个Terminal Agent训练环境SETA,目的是反哺产品、繁荣开源生态等。最后,文章介绍了李国豪从沉迷游戏到投身AI研究的经历,以及他对大语言模型Transformer架构的看法,推荐阅读《The Society of Mind》。

2026,写给 AI 创业者的慷慨、残酷、与迷雾
AI创业者作者分析2026现状及创业应对策略
文章写给AI创业者,分析2026年AI发展加速现状及影响,结合印刷术、电力、云计算历史变革,阐述AI coding商品化规律。指出当前AI处于安装期早期,供给过剩、马太效应强。程序员定义将改变,最大受益者是重新定义规则者。创业者面临竞争加剧、注意力难获取等困境,建议不用AI做旧事、建护城河于代码外、注重方向、拥抱unbundling并找re-bundling机会,接受持久战。强调核心能力商品化会使价值链重组,新玩家有机会。

一句话点外卖:AI时代的智能语音点餐实践
淘宝闪购与天猫精灵合作推出智能语音点餐项目
文章介绍淘宝闪购与天猫精灵合作的“智能语音点餐”项目。合作模式是天猫精灵负责“听和说”,淘宝闪购Agent负责“想和做”,但实际应用面临模型耗时长和幻觉难以避免的难题,目前模型主要做意图理解,按固定任务流执行并使用固定话术模板。还分析了GUI和VUI在点餐场景中的设计差异,包括行为心智、信息处理等方面。当前模式存在复杂问题处理能力弱、新功能依赖开发、对话机械等问题。后续将探索模型自闭环,实现“一句话点外卖”的极致体验。

GPT-5.4、OpenClaw冲击波:未来2-3年内,80%的测试工程师会被裁掉?
OpenAI发布GPT - 5.4,未来多数测试工程师或被AI取代
2026年3月6日,OpenAI发布GPT - 5.4,拥有原生计算机使用能力,OpenClaw框架爆火。二者结合带来软件测试行业变革,未来2 - 3年80%测试工程师岗位或被取代。GPT - 5.4与OpenClaw结合告别脚本编写,可并行工作、具备视觉感知和自我修复能力。文中设想产品经理直接与AI对话的测试场景,虽提高效率,但AI有局限性。未来20%资深专家将成“驾驭者”,承担架构设计、质量监督等职责,测试人员需提升能力适应变革。

The Batch: 916 | Gemini 强势领跑
谷歌推出Gemini 3.1 Pro Preview,多测试表现佳成本优
2026年谷歌更新旗舰Gemini模型,推出Gemini 3.1 Pro Preview,以相同价格提供更优性能。它支持多模态输入输出,采用混合专家Transformer架构,有工具调用等功能。在多项基准测试中表现出色,在Artificial Analysis智能指数中超越竞品,但在部分测试中落后。其性能提升源于模型质量改进,成本效益显著,建议将Deep Think用于高挑战任务。

The Batch: 919 | 本地 AI 能否替代云端?
斯坦福与Together AI研究本地AI替代云端的可行性
文章探讨本地AI能否替代云端。研究人员提出“单瓦特智能量”指标,发现笔记本作云计算替代方案能力增强。研究团队在笔记本和服务器运行多款开源大语言模型,输入百万条查询请求,测量准确率、记录能耗并模拟路由。发现本地系统单瓦特智能量未达云端,但差距缩小。云端仍具能效优势,本地系统单瓦特智能量提升5.3倍,单轮对话与推理查询表现好。未评估闭源模型单瓦特智能量,本地模型准确率低于部分闭源模型。研究揭示功耗与性能权衡关系,本地AI推广有经济学论据。

业内首发,TRAE 正式上线 Windows 轻量级沙箱,补齐 AI Agent 最后一块拼图
TRAE团队上线Windows轻量级沙箱补齐AI Agent拼图
2026年3月7日,TRAE团队上线Windows轻量级沙箱,是业内首个专为AI Agent打造的此类产品。随着大模型发展,AI Agent能执行多种任务,但在Windows平台缺乏合适运行环境,宿主机风险高,传统虚拟机和开源沙箱有缺陷。TRAE团队深入系统底层,为其定制轻量隔离环境,沙箱有极致轻量、精准防御、专为Agent场景打造三大核心体验。该沙箱默认开启,也可在特定模块调整运行方式。TRAE实现跨平台安全执行环境覆盖,新版本已全量上线。

滴滴自动驾驶成立深穹远航实验室,携手清华大学开展前沿研究
滴滴自动驾驶成立实验室,携手清华开展自动驾驶研究
2026年,滴滴自动驾驶成立深穹远航实验室,与清华大学李升波教授课题组达成产学研合作。双方聚焦多模态大模型等前沿方向,推动多模态端到端自动驾驶技术突破与落地。实验室采用特定模式攻关前沿技术,打造产学研合作新范式,既培养高端人才,又加速科研成果应用。清华李升波教授称合作可提升成果工程化效率,滴滴张博表示这是开放协作重要布局。未来,滴滴会加大AI研发投入,深化合作,以实验室汇聚资源推动产业创新。

[A's周刊19] 将世界知识注入像素
谷歌、Anthropic、Pika等发布多款新模型及产品
此周刊介绍2026年2月23 - 28日设计与科技动态。谷歌发布图像生成模型Nano Banana 2,有世界知识联网等能力,登顶文生图榜单;Gemini 3.1 Pro推理能力跃升;Gemini app集成音乐生成功能。Anthropic推出Claude Sonnet 4.6,编码等性能突出。Pika推出AI Selves数字分身。2026设计趋势是‘不完美即设计’,注重情感与文化表达。还介绍纽伯瑞奖获奖作品封面设计、巴黎大皇宫设计特色及切斯特动物园新品牌形象。

FireRed-OCR 开源发布:端到端方案新SOTA!小红书提出低成本文档识别训练范式
小红书开源FireRed - OCR,提出文档识别训练范式
2026年3月2日,小红书研究团队开源智能文档处理模型FireRed - OCR。它针对视觉语言模型“结构性幻觉”问题,引入“三阶段渐进优化”策略与“几何 + 语义”数据工厂,基于Qwen3 - VL架构完成“驯化”。该模型构建自动化数据生产工厂把控数据质量,在OmniDocBench v1.5评测中综合评分及细分指标领先,展现出卓越结构化解析能力。此外,通过四个应用案例证明其全场景、多模态理解能力,还提出“通用多模态模型 → 专用结构化文档模型”可复用范式。

美团悄悄上线的AI浏览器Tabbit,我觉得它更适合普通人。
美团光年之外团队发布AI浏览器Tabbit并获推荐
2026年3月2日,美团光年之外团队发布AI浏览器Tabbit。作者使用近半月后将其设为默认浏览器,因其Agent能力强、产品完整、细节好且免费。AI浏览器与类OpenClaw产品是互补关系,前者处理场景式任务,后者处理高难复杂任务。Tabbit兼容性好,支持Windows和Mac,可迁移Chrome和Edge数据,适配Chrome插件。首页对话框可搜索或当Agent用,模型多且免费。它还有多源引用、截图、Agent等功能,能处理刚需任务,如采集公众号数据填到飞书表格、找租房信息等,还可沉淀操作流程为智能代理妙招,有提示词和脚本妙招,能去除广告。作者认为AI浏览器场景驱动需求多,推荐大家使用Tabbit。

Qwen3.5实战教程:从0到1掌握本地部署与微调
阿里通义千问团队发布Qwen3.5小模型并给出实战教程
本文是Qwen3.5实战教程,介绍其本地部署与微调方法。阿里通义千问团队发布Qwen3.5系列小模型,打破“大模型=高成本”惯例。核心特性包括四款小模型覆盖多场景、架构创新、性能优。本地部署需准备软硬件,提供三种下载方式和部署方案,有性能对比数据。模型微调介绍LoRA等方案,以图像分类任务为例,含数据准备、配置、训练、合并部署及效果评估。还介绍常见错误排查、性能优化技巧和资源占用控制策略,并给出参考资料。

我们给OpenClaw加了一双眼睛,来记录我们这平凡的一天。
内容创意组开展OpenClaw人类观察计划
文章讲述内容创意组开展“OpenClaw人类观察计划”。他们用Pocket 3作OpenClaw的眼睛,俯拍工位区,每隔2 - 5分钟截图,通过OpenClaw喂给多模态模型描述画面。下班时将数据喂给OpenClaw分析当天趣事,记录会在晚12点自动删除。OpenClaw部署在单独Mac上,连接Claude Opus 4.6的API Key,在飞书群互动。开发过程简单,通过对话式开发,小龙虾自动测试模型和连通性,运行中出现的问题也能通过对话修复。该计划让普通工作日变得特别,让大家下班前能开心一笑。

GPT-5.4深夜发布,最适合OpenClaw的天选模型登场了。
OpenAI发布GPT - 5.4,成OpenClaw天选基座模型
2026年3月6日凌晨,GPT-5.4发布,被认为是适合OpenClaw的首选模型。一个优秀的Agent基座模型需代码能力、世界知识、多模态理解强且价格合理。此前Claude Opus 4.6较出色,GPT-5.3-Codex代码能力强但世界知识差。且Claude使用成本高,而OpenAI支持第三方调用Codex额度。GPT-5.4代码能力与GPT-5.3-Codex齐平,世界知识比GPT-5.2强,还能使用订阅额度。跑分显示其在各方面表现优秀。它还有特性更新,如100万token上下文窗口、原生计算机使用能力、支持工具搜索。GPT-5.4 Pro更强大但贵,API价格比Claude Opus 4.6便宜。目前ChatGPT和Codex已上线,作者体验后认为其输出能看懂,等OpenClaw支持后将成天选模型。

阿里事儿|“千问AI眼镜”全球发布;阿里云百炼专属版登陆国际市场
阿里3月发布多款产品,达摩院与巴方合作推广AI技术
2026年3月,阿里有多项成果发布。3月2日,千问首款AI硬件“千问AI眼镜”全球发布并开启全渠道预约,还将接入千问App;同日,阿里发布两款语音新模型。3月3日,四款千问3.5小尺寸模型系列开源;阿里云推出面向国际市场的百炼专属版;桌面Agent工具QoderWork上线Windows版;淘宝上线“宝贝动物派送员”系统。此外,阿里巴巴达摩院与巴基斯坦多机构合作推广多癌筛查AI技术;新版闲鱼上线,拍照可识别物品行情价。

OpenClaw:爆发、生态、关键词和新时代
投资人分析OpenClaw爆发、生态及新时代机遇
本文从AI投资人视角,介绍OpenClaw及其生态。OpenClaw带来全新体验,推动模型、Skill、MacMini和数据库等Infra爆发性增长。它类似AI时代的Linux,以开源为基石,通过“核心框架 + Skill插件”扩展功能,形成“社区 + 商业”循环。短期生态方面,OpenClaw或成交互入口,通信、群聊协作、交易市场、物理世界接入等存在机会。如通信需AI-Native系统,群聊协作涉及组织架构和管理问题,交易市场受交互入口改变影响,物理世界需合适载体融合交互方式。

金融时报对话李开复:中国AI为何能够领跑全球C端市场?
李开复谈中美AI竞争及中国AI产业发展趋势
《金融时报》对话李开复,探讨中美AI领域竞争及企业AI转型。美国巨头闭源押注“赢者通吃”,中国以开源和工程能力破局。李开复认为企业AI落地是“一把手工程”,零一万物为企业提供定制化服务。目前中国模型与美国有差距但能快速追赶,差距动态起伏。中国企业更关注商业产出,在C端应用将领先美国,2026年将开启“AI原生设备”元年。

从世界工厂到智能体工厂,为什么是中国?|开年必读AI指南(三)
李开复解析中国从世界工厂迈向智能体工厂原因
李开复分析中国在全球AI竞赛中的机会。中美处于双雄时代,但路径不同,美国公司试图攻克AGI,且闭源保密;中国大模型企业‘多快好省’地进入世界第一梯队,坚定拥抱开源,构建全球技术影响力和应用生态。这使得大模型门槛降低,企业可专注深度行业应用,此为‘底座平权’。同时,中国有全球最齐全的制造业门类和超大规模消费市场,为多智能体落地提供场景,可将工业经验和服务逻辑重构‘智能体团队’。2026年政府提出相关行动,中国正从‘制造’向‘智造’跃迁,有望换道超车。

李开复:我从政府工作报告里得到的四个判断
李开复分享政府工作报告中智能经济四个发展判断
李开复分享从政府工作报告得到的四个判断。一是产业智能时机已到,但需组织深刻变革配合,企业AI转型应是“一把手工程”,零一万物深入产业ToB。二是2026年是“企业多智能体上岗”元年,多智能体可封装智慧,中国有望成“全球智能体工厂”。三是中国是AI原生硬件最佳爆发地,应定义具备五大特质的下一代AI硬件,中国制造业供应链优势明显。四是开源是中国AI全球竞争“换道超车”关键路径,能降低大模型应用门槛,繁荣开源生态助力智能原生应用。

从0到1拆解,什么才是真正的AI原生应用?
噜噜猫剖析AI原生应用本质及产品经理工作流重构
文章指出很多AI项目停留在表面创新,深度剖析AI原生本质区别。以“灵感旅行家”为例,阐述产品经理工作流重构:需求分析从“功能清单”到“场景意图池”;交互定义从“点击路径”到“多模态感知”;架构设计从“瀑布流页面”到“Agent编排”;交付物定义从“静态展示”到“实时生成的逻辑流”。还给出产品经理做AI原生应用的三条建议,包括拒绝“对话框依赖症”、拥抱“灰度需求”、别追求100%确定性。

概念梳理:Agent、Workflow、Skills、MCP…
作者梳理AI概念并推荐产品经理转岗特训营
文章梳理了Agent、Workflow、Skills、MCP等概念。最早通过API调用LLM开发Chatbot,后发展出RAG。接着出现Function Calling等,衍生出AutoGPT和Dify。2024年下半年sonnet - 3.7发布后,Agent成为生产力,Claude提出MCP标准。之后Claude推出Claude Code,引入Skills概念。还提到OpenClaw属于Agent分支,Dify类Workflow属于ChatBot分支,企业可按需选择。最后推荐AI产品经理转岗特训营,介绍课程内容和实训项目。

第一批玩OpenClaw的人,已经开始清醒了
OpenClaw受全球关注,使用者反馈其利弊并存
文章介绍开源AI Agent框架OpenClaw,它热度席卷全球,在GitHub获星超250K+。其能24小时响应指令、处理复杂任务,吸引各行业人群。软件开发者杨明锋开发中文分支版,社区上线后访客众多。使用者反馈它有记忆能力,可多场景应用,如辅助投资、法律业务等。但它也有局限,对普通人门槛高,运行依赖本地环境,能力取决于调用的大模型,成本高,执行机制不够灵活,还存在安全风险。尽管如此,它仍让很多人接触到AI Agent,有人将其视为下一代AI OS雏形。

今天,意外被字节Seed 2.0的多模态Agent能力惊到了
字节发布豆包大模型2.0,多方面能力升级且有订阅服务
2026年3月4日消息,字节发布的豆包大模型2.0(Doubao - Seed - 2.0)是原生多模态Agent大模型。其模型家族有Pro、Lite、Mini三款通用模型和Code模型。它在多方面全面升级,原生多模态做到从底层统一视觉和语言表示,“真理解”语义,代码能力在前端开发领域显著提升。Coding模型已上线,能完成复杂任务,如生成龙虾主题OS界面、新春Agent小镇代码等,还具备项目级代码理解和维护能力。在企业级应用上,能做科研写作辅助。此外,因coding编程token消耗大,推荐使用方舟Coding Plan订阅服务,性价比高,新用户首购优惠多。

超5亿人在用生成式AI!用户规模背后藏着哪些未被满足的需求?
超5亿人用生成式AI,剖析痛点并给出产品改进建议
文章指出国内生成式AI用户已超5亿,但存在诸多痛点。超60%是尝鲜用户,深度用户也面临个性化缺失、使用门槛高、可信度堪忧等问题。用户真正需要自然语言零门槛交互、专业级输出和可信AI。产品人可从场景驱动、打通全流程、建立可信标准三方面满足用户需求,提供好用的AI产品。

2026 AI Memory最新综述:从理论到实战,一文读懂AI记忆的进化全景
北邮百家团队联合华为发表AI记忆最新综述
2026年北邮百家AI Memory OS团队联合华为发表《Survey on AI Memory》,梳理AI记忆全景。综述涵盖理论基础、4W分类体系、单/多智能体架构、评估方法与前沿趋势。AI记忆是AGI关键,打破传统AI局限。文中介绍理论基石,区分相关概念;用4W分类法对记忆系统分类;阐述单、多智能体记忆架构及协作机制;提出评估分类法和代表性Benchmark;分析单、多智能体应用场景。当前AI记忆发展面临架构、理论、安全运维挑战,未来将朝类脑建模、记忆 - 经验升级、自进化集体记忆方向发展。

FlagOS 镜像登陆腾讯云 HAI社区,快速部署OpenClaw 实现“养虾”自由
众智FlagOS联合腾讯云HAI上线Qwen3-4B模型镜像
2026年3月5日,众智FlagOS联合腾讯云HAI,将Qwen3-4B-hygon-flagos模型镜像上线腾讯云HAI社区。以往云端方案有数据隐私风险和高昂成本,本地化部署成趋势。FlagOS是开源AI系统软件栈,支持多芯片快速部署。文章介绍基于该镜像部署FlagOS版Qwen3-4B的过程,含安装Qwen3-4B-hygon-flagos、配置OpenClaw、设置channel为QQ等步骤。测试发现小模型进入Agent执行层,Agent上限更多由系统决定,4B级模型或成合理选择。还介绍FlagOS社区和HAI社区相关信息。

全面解析“世界模型”:定义、路线、实践与AGI的更近一步
硅谷101团队深度解析世界模型的定义、路线与应用
文章由硅谷101团队深度研究产出,解析世界模型。先介绍其起源,它源于人类心智模型研究,在AI领域发展,2018年正式提出名称及框架。与大语言模型相比,世界模型更适合机器人等需进入真实世界的任务。因大模型遇瓶颈、多模态时代到来,世界模型成AI竞赛核心。当前推进有三层结构,世界生成是热门,含视频生成和3D生成路线。智能体训练有基于虚拟世界训练(如Google SIMA)和直接学习世界抽象结构(如Yann LeCun的JEPA)两条路线。世界模型将改写机器人、自动驾驶等行业,但也带来模型幻觉、权力集中等风险,虽面临挑战,但为AI走向通用智能提供可能。

最受欢迎的10个小龙虾🦞 skills安装来了!
Datawhale整理OpenClaw 10个热门Skills及安装方*
文章介绍OpenClaw的“技能包(Skills)”系统,它像万能工具箱,社区已有几百个“工具”。作者整理出10个被多次推荐的Skills,包括tavily - search(联网搜索技能)、find - skills(让Agent自搜并安装技能)、proactive - agent(给Agent加主动性和自我迭代能力)等,还给出每个技能的安装命令,如npx clawhub@latest install tavily - search 等。

你用的 Claude 可能是虚假 Claude ,论文数据告诉你,Shadow API 中的欺骗性模型声明
论文揭示Shadow API欺骗性,建议科研谨慎使用
文章围绕论文《真金白银,假货模型:Shadow API中的欺骗性模型声明》展开。因前沿闭源模型有价格、支付、地区限制,出现第三方“代接入”Shadow API服务。研究团队识别17个主流Shadow API,发现其缺乏透明度。对三大模型家族测试显示,Shadow API在高难度推理、敏感领域表现差,安全表现偏差不可预测。经LLMmap和MET调查,近半接口挂羊头卖狗肉,提供商有信息溢价、折扣替代、转售加价三种欺骗机制。约30%相关论文或需重实验,损失大。论文建议科研不使用Shadow API,若要用可四阶段验证。还提到Claude反代接口有问题,部分非官方。

豆包 Seed 2.0 来了:字节模型跨越鸿沟
字节发布豆包Seed 2.0多模态大模型,展现强大能力
2026年春节前字节发布豆包大模型2.0(Doubao Seed 2.0),其Dola - Seed - 2.0 - Preview进入模型榜单Text领域前十。该模型国内综合第一,视觉能力全球第四,成本低。字节定位其为全新多模态Agent模型,升级多模态理解能力、增强LLM与Agent执行任务能力。文中用为世界杯冤案平反、根据手绘地图做旅行规划、基于课堂板书生成小游戏三个案例展示其强大能力。它将现实输入转化为可交付成果,不依赖简单蒸馏,注重原生能力。火山引擎更新套餐包,开发者可在火山方舟调用,新用户首月最低8元。

我的默认浏览器终于从 Dia 换成了 Tabbit
作者分享将默认浏览器换成国产Tabbit的体验
作者分享将默认浏览器从Dia换成Tabbit的经历。过去半年多作者常用AI浏览器写作,默认是Dia,但它挑网络。2026年作者等到国产Tabbit,其主导者和设计师来自光年之外。Tabbit覆盖Dia大部分功能,将AI与浏览器深度融合,解决用户在浏览器使用中的痛点。它有智能标签管理,可一键分组、云同步;对话框设计独特,有两种形态;还有妙招功能,可固化常用指令;提供Agent模式,能自动执行任务。此外,Tabbit设计极简优雅,强调数据安全与隐私保护,目前已全面公测。

Qwen 3.5 的口碑持续走高,林俊旸辞职出走,开源阵营震荡
通义千问林俊旸等核心人员离职,Qwen 3.5已开源
2026年3月4日,通义千问首席研究员林俊旸宣布辞职,一同离开的还有几位核心骨干。原因或是阿里提升团队人才密度,调整了林俊旸权责。Qwen 3.5系列今年2月开源,有多种尺寸权重,编程能力获开发者夸赞,展现清晰技术路线。大模型团队“重组—出走—再创业”已成模式,Qwen 3.5可能是技术高光也是阶段结束,但人才流动正常。中国大模型开源阵营崛起,Qwen开源策略激进,其权重已开源,开发者可正常使用。

Zooming without Zooming:让多模态大模型“一眼看清”微小细节
蚂蚁等团队发布Zooming without Zooming提升模型细粒度感知
当前多模态大语言模型在细粒度感知任务上表现不佳,主流“Thinking - with - Images”范式有延迟开销。蚂蚁集团联合多所院校研究团队发布Zooming without Zooming,提出“区域到图像蒸馏”(R2I)方法,让模型无需工具调用、单次前向传播即可精准感知微小细节,且ZwZ(4/7/8B)模型已开源。还构建ZoomBench基准测试评估能力,其具双视角评估模式。ZwZ系列模型在多项测试表现好,8B模型逼近闭源模型Gemini - 3 - Flash,速度提升约10倍,在真实任务泛化能力强,还缩小了缩放差距。论文探讨“Thinking with Images”范式边界,提出信息增益判别准则。

OpenClaw从新手到中级完整教程
程序员小灰发布OpenClaw从新手到中级完整教程
本文是OpenClaw从新手到中级的完整教程。先介绍OpenClaw是2026年最火的开源AI Agent项目,核心架构包含Gateway、Agent、Skills和Channel。接着说明安装步骤,包括在终端粘贴命令、初始化设置等。还介绍接入飞书和Discord的方法,如创建应用、添加channel、配置权限等。多Agent配置方面,讲解了Agent各部分组成及配置方法。ClawHub是官方插件市场,可通过命令搜索和安装Skills。实操案例有操作浏览器、获取每日新闻、审查GitHub的PR等。最后介绍常用玩法,如自定义早间简报、Reddit每日摘要、项目状态管理系统等,并展望了OpenClaw的未来发展。

鹅厂员工怎么看Agent自动持续进化?
鹅厂9位同事分享Agent自动持续进化看法
文章围绕Agent自动持续进化展开,先指出落地Agent易,自动持续优化难。接着呈现9位鹅厂同事看法:yuchen认为要建立业务评估体系,依AI定位沉淀;jery强调记录任务成败助Agent复盘;luping提出用指标度量,可AI或人工迭代;jhon提及强化学习;levon指出LLM持续学习有解冻模型和上下文工程两条路;jeff主张结合元认知和本体论设计;rhysr建议用AI优化system_message;eric认为AI agent已具备自我进化条件,设想AI取代部分人工测试;zhiyuan引用相关内容作答。

中国出海市场洞察 | 《智能体驱动的变革》白皮书重磅上线!
谷歌开发者发布《智能体驱动的变革》白皮书
2026年3月6日,《智能体驱动的变革》白皮书上线。指出AI浪潮进入下半场,正处生成式AI向AI智能体跨越拐点。AI智能体是“有勇有谋”数字员工,能完成闭环任务。白皮书调研发现中国出海企业积极拥抱AI智能体,部署加速、应用多点开花且技术务实。企业迎接智能体时代应关注推理与规划、工具连接、反馈循环三个维度,可下载白皮书获取更多中国市场洞察。

OpenClaw不如狗一条
作者评Openclaw是有趣玩具,对多数人非高优先级
文章围绕开源AI助手Openclaw展开。它可本地部署,能访问本地文件、做定时任务,还可接入多种服务和聊天软件。Openclaw是交互创新,让用户在熟悉的聊天软件与AI对话,且完全接入本地环境。它类似Manus思路的延伸,与Manus类比为安卓和苹果。云端龙虾类产品是Chatbot升级版,受中登喜爱。但Moltbook等所谓龙虾社交平台是骗局,自媒体也制造信息垃圾。作者认为编程Agent套壳产品才是主线,Openclaw面向开发者,虽对模型厂和云厂商重要,但对多数人只是有趣玩具。

俊旸离开 Qwen 之际,我再次思考了大模型 “开源” 的价值
作者借俊旸离开Qwen思考大模型开源价值并分享近况
作者在得知俊旸离开Qwen后,分享心境与思考。回忆2023 - 2025年间与俊旸的交流经历,包括云栖大会结识、“硅星人”活动讨论“中国开源,全球受益”。指出千问团队在阿里突围,俊旸推动下开源取得成功,但阿里缺乏稳定开源品牌和战略土壤,作者对千问能否长期开源存疑。认为俊旸离开对阿里是损失,其进入产业社区或有更好发展。最后作者分享近况,介绍加入Datastrato及主理Data for AI社区,公布近期活动信息。

AI 行业最被低估的武器,是审美
文章剖析AI领域设计美学、视觉趋势及品牌原型
文章指出AI竞赛激烈但产品同质化严重,品牌建设愈发重要。从美学角度,介绍了AI设计美学基础洞察,包括自然亲和力、关键视觉表现力、不同AI意象;梳理14个视觉趋势,如米白色调、渐变设计等;还将AI品牌归为五类原型,即亲和型领袖、温柔人文主义者、理工理想主义者、大胆构建者、乌托邦梦想家,强调品牌建设在竞争中的优势。

GPT-5.4:OpenAI做了个Kimi K2.5 +MiniMax M2.5?
OpenAI发布GPT - 5.4,能力提升且借鉴开源模型思路
2026年3月5日,OpenAI发布GPT - 5.4,定位“面向专业工作的最强、最高效frontier model”,上线ChatGPT、API和Codex,还推出GPT - 5.4 Pro等。其能力提升显著,在专业任务表现、减少幻觉、computer use等方面进步明显,引入tool search降本。体验上,GPT - 5.4 Thinking让用户可中途介入。它诸多思路类似Kimi K2.5和MiniMax M2.5。还给出金融分析、法律工作等具体应用案例,最后介绍价格和使用方式,输入输出token收费,Pro版有使用限制且价格贵。

一台云手机里的 OpenClaw,可以怎么玩?
百度智能云发布移动版OpenClaw并展示使用体验
本文介绍百度智能云的「红手指Operator」,即移动版OpenClaw的使用。它将纯血版OpenClaw装进云端虚拟手机,免环境部署,点按钮即用,目前仅支持安卓。文中分享实测体验:一是可用其操作APP,如搜索快手集福卡入口,在后台运行不占手机屏幕;二是用于AI信息简报自动化,按提示词自动搜索信息,整理成简报存入Notion数据库;三是搭建半自动化明星动态工作流,搜索汇总信息存入Notion,配合Claude Code和“宝玉Skills”完成内容素材生成。不过该产品也有不足,稳定性待提升。

传音×火山引擎:TECNO CAMON 50新机发布,AIGC影像创作体验焕新
传音与火山引擎合作发布TECNO CAMON 50新机,焕新AIGC影像体验
2026年3月4日,在世界移动通信大会上,传音旗下TECNO发布CAMON 50系列新机。其AI助手Ella整合火山引擎AIGC技术,针对不同肤色、语种和文化审美优化,有图像风格化、文字涂鸦及动态壁纸等功能。传音作为新兴市场智能终端领军者,产品覆盖超100个国家和地区。合作中还解决了人像处理和文本图像创作的算法难题,如在多人多肤色合影、小语种文字处理等方面做了专项优化。火山引擎海外云基础设施为其提供稳定服务,助力探索领先的AIGC创作体验。

AI 浏览器赛道再添新玩家:Tabbit 入局
美团光年之外发布Tabbit AI浏览器并介绍其功能
2026年3月3日,美团光年之外发布Tabbit AI浏览器。过去一年AI浏览器赛道竞争激烈,大家认为浏览器会是AI时代重要入口和核心操作界面。Tabbit基于Chrome内核,外观更好看、样式设置丰富。生活场景中,它适合沉浸式浏览博物馆网站,能精准识别图片和页面信息,还可整合标签页组内容。工作场景里,“智能标签整理”功能可自动分类标签页,便于信息整合和分析,还能找出页面矛盾数据。此外,它有“妙招”功能,可做流程化任务处理,支持自定义提示词和脚本妙招。智能代理模式能自动化操作浏览器,但耗时较长,不过不影响用户其他操作。其输出可保存或收藏,且收藏内容有AI整理上下文功能。

AI攻占MWC
2026 MWC大会上中国科技企业全面展示AI实力
2026年3月2 - 5日,世界移动通信大会(MWC)在西班牙巴塞罗那举行,主题为“The IQ Era”。AI成驱动创新的底层动力,中国科技企业全面展示AI实力。本届大会呈现三大趋势:一是手机厂商探索跨界,荣耀推机器人手机和人形机器人,中兴展示“豆包手机”,传音展出模块化手机;二是6G竞赛提前,其传输速率高、覆盖广且智能融合,中国厂商分层协同,运营商验证场景,设备商突破技术;三是AI硬件发展,AI眼镜比拼轻量级,机器人竞争重量级,还兴起AI情感陪伴机器人。

想成为下一个抖音的 APP 们
6家AI初创产品欲借AI成下一个抖音
文章探讨若抖音诞生在AI时代的模样,介绍6家AI初创产品。Loopit让内容可互动,强调调用手机硬件;Wabi让普通人用AI做APP,虽在内测但获大额投资;AIPPY是移动端创作社区,降低创作门槛,下载量可观;Rezona将脑洞变游戏,下载增长迅猛;Gizmo把互动小应用当内容传播,获投资且增长快;Sekai将内容升级为可玩可改可传播,下载超200万次且获融资。这些产品用AI降低创作门槛,未来或催生新平台,但目前存在生成质量等问题。

超棒!打造顶级智能体Claude Code的经验教训
Claude Code工程师分享打造智能体的经验教训
Claude Code工程师Thariq分享打造该智能体的经验。提示词缓存技术是关键,其基于前缀匹配,合理排列顺序可提升缓存命中率,改动会致失效。管理动态上下文时,更新信息应通过下一轮消息传递,避免破坏缓存。切换模型、修改工具集等操作也有相应缓存保护策略。构建智能体要为其定制合适工具,如开发提问工具提升沟通效率。随着模型进化,需重塑行动边界,如用任务工具替换待办工具,引入全局搜索工具,打造向导子智能体扩展行动空间。

马斯克都惊呼太强!阿里Qwen3.5又一波端侧小模型发布
阿里发布Qwen3.5端侧小模型,获马斯克称赞
2026年阿里发布Qwen3.5中等规模超强模型及一大波端侧小模型,获马斯克称赞。每个型号都有Base版,方便各界训练微调。Qwen3.5智能密度翻倍且原生多模态,9B模型在语言基准比肩超越OpenAI 120B模型,视觉基准超越多个模型。4B模型尺寸小,普通电脑手机可部署,还有更小的2B和0.8B,可在可穿戴设备部署。2B和0.8B虽参数小但性能不俗,0.8B带视觉,2B接近上一代4B参数模型。阿里从顶级大模型到端侧小模型布局完整生态链,开启智能化未来。

谷歌与OpenAI对狙,Gemini主打极速性价比,GPT优化对话温度
谷歌发布Gemini 3.1 Flash - Lite,OpenAI推出GPT - 5.3 Instant
2026年3月5日消息,谷歌与OpenAI展开竞争。谷歌发布Gemini 3.1 Flash - Lite,是Gemini 3系列中速度最快且性价比高的模型,专为高频、大流量开发者业务场景设计,价格有竞争力,速度提升显著,在多项测试中表现出色,还引入思考等级功能。OpenAI推出GPT - 5.3 Instant,改进聚焦交互体验,优化拒答逻辑,增强联网搜索功能,降低幻觉率,提升写作能力,旨在让ChatGPT更自然实用。

让大模型上车:理想汽车硬件协同设计算出最佳边缘模型
长三角洲AI实验室等算出理想汽车最佳边缘大模型
理想汽车等团队找到大语言模型硬件协同设计寻优之路。当前大模型上车面临低延迟与高精度难题,端侧设备有内存等限制,传统架构不适用。研究提出硬件感知建模框架,用数学公式绑定训练损失与架构参数,利用屋顶线分析预判推理延迟,还得出经验缩放定律。通过帕累托架构搜索框架找到兼顾低误差与快速度的帕累托前沿,发现端侧最优模型呈宽浅特征,稀疏架构占优。此外还揭示了硬件对模型的约束法则,可据此计算芯片适配的模型尺寸。

AI Coding 时代的企业 IT 组织重塑:从生产力工具到组织进化引擎
TRAE.ai姜育恒谈AI Coding时代企业IT组织重塑
文章探讨AI Coding时代企业IT组织重塑。AI Coding崛起,演进速度超预期,其爆发是模型、工具和需求叠加的结果。个体效率提升后组织面临困境,传统组织结构、人才结构和运行机制受冲击。组织结构团队单元变小、管理角色重构;人才结构上工程师总量增长放缓,高判断力角色占比上升;运行机制向“人 + AI”协同驱动转变。效能传导分个体、团队、组织和企业四层,常因忽视组织调整等失效。企业应实践先行,重塑结构、升级治理、重构体系、刷新能力、转变度量,将AI Coding转化为组织能力。

推荐系统进入“双动力”时代!首篇LLM-RL协同推荐综述深度解析
多机构研究团队发布LLM - RL协同推荐系统性综述
文章指出推荐系统进入“双动力”时代,LLM与RL结合开启LLM - RL协同推荐新范式。来自多机构的研究团队发布首篇相关系统性综述。介绍研究背景,推荐系统从“静态预测”到“动态决策”再到“认知协同”,LLM带来四大维度质变。阐述五大协同范式,LLM在智能体和环境侧扮演不同角色;构建标准化评估协议,从任务、数据集、评估策略和指标四个维度衡量系统表现。还分析了面临的挑战及未来方向,如算法去偏、隐私安全、计算效率和幻觉治理等,最后强调该协同是对推荐本质的重构。

开启极简养虾,用 TRAE 快速部署 OpenClaw
官方教你用TRAE快速部署OpenClaw
文章介绍用TRAE快速部署OpenClaw的方法。OpenClaw是开源、本地优先的AI智能体,有诸多优势,但安装配置复杂。官方给出用TRAE安装的6步指南:为OpenClaw创建隔离用户账号;下载并打开TRAE中国版;在TRAE里安装和执行OpenClaw技能;对接飞书并接入火山方舟模型;进行飞书开放平台配置并发版;在飞书发消息并配对。还推荐了OpenClaw技能,可从官方技能仓库和开源社区获取。最后鼓励用户开启养成之旅,培养贴身智能小助手。

如何用 TRAE 更省钱(上)|理解 Token 和上下文窗口
文章介绍TRAE中Token和上下文窗口以助用户节省开销
TRAE国际版上线新版计费方式后,用户反馈Token消耗快。文章从“Token”和“上下文窗口”切入,介绍用量消耗原理以节省开销。Token是AI处理文本最小单位和计费“货币”,AI通过分词处理文本,输入和输出按Token计费,输出通常更贵,且中文处理Token效率低于英文。上下文窗口是AI一次能处理的最大Token数量,其包含系统提示、工具定义等内容,并非越大越好。Coding Agent费Token,静态开销源于工具定义,可精简工具箱;动态开销源于工具执行结果,可过滤噪音。管理Token和上下文是与AI协作的核心技能,下篇将分享实操技巧。

如何用 TRAE 更省钱(中)|10 个 Token 节省技巧
TRAE产品运营分享10个Token节省技巧助省钱
文章由TRAE产品运营云舒撰写,介绍用TRAE省钱的10个Token节省技巧。先回顾Token花销构成,包括输入、输出、缓存Token费用。提出AI Coding六问心法,如明确目标、信息、指令等。10个技巧涵盖适时新开对话、精准限定范围、优化输入内容、批量处理、主动引导输出、先计划再行动、善用上下文压缩、固化长期知识、配置Ignore文件、根据任务选模型。最后提及TRAE在上下文管理上的优化,如智能死循环检测、缓存命中率优化等。

零配置部署顶级模型!函数计算一键解锁 Qwen3.5
阿里云函数计算FC实现Qwen3.5一键零配置部署
2026年3月,阿里巴巴开源全新大模型千问Qwen3.5-397B-A17B,登顶全球最强开源模型。该模型架构和性能飞跃,采用混合架构,降低成本,部署显存占用降60%,推理效率提升,支持201种语言。传统大模型部署复杂,而阿里云函数计算FC提供企业级部署方案,通过Serverless GPU架构,开发者无需关心底层设施。文章还介绍了一键部署Qwen3.5的步骤,对比传统方案,FunModel部署时间短、技术门槛和运维成本低,能让开发者快速部署上线模型、实现一键扩缩容。

打通智能体孤岛:用 AgentRun 构建生产级 A2A 多 Agent 管理协作系统
文章介绍用 AgentRun 构建 A2A 多 Agent 管理协作系统
文章围绕用 AgentRun 构建生产级 A2A 多 Agent 管理协作系统展开。先提出多 Agent 协作问题,引出 Google 主导的 A2A 协议,其用 AgentCard 自描述、服务发现感知 Agent 全貌,但生产落地需管理体系,AgentRun 则构建了该体系。接着介绍 A2A 协议原理,如 AgentCard 结构、服务发现机制、通信机制等。AgentRun 提供多 Agent 管理体系,包括工作空间隔离、发现端点配置、支持两类 Agent 共存及凭证安全保护。实战部分以「希希咖啡厅」为例,展示从部署、创建工作空间、注册 Agent、配置发现端点到调用及用 SDK 通信的全流程。最后总结 A2A 价值及 AgentRun 优势,邀测试用并介绍其特性与架构。

阿里开源 Team 版 OpenClaw,5分钟完成本地安装
阿里开源HiClaw解决OpenClaw多方面痛点
2026年3月6日,阿里开源Team版OpenClaw,即HiClaw。HiClaw是OpenClaw的升级版,引入Manager Agent角色,解决OpenClaw在安全性、多任务协作、移动端体验、记忆管理等方面的痛点。在安全上,Worker不持真实凭证,运行在隔离容器;移动端内置Matrix服务器,支持多客户端;多Agent协作上,共享上下文、有防惊群设计且全程透明;记忆管理上,工作中间产物通过MinIO共享文件系统完成。其架构将外接组件内置,降低配置门槛。安装跨平台兼容,展示了用HiClaw实现SaaS产品的流程,适合独立开发者、OpenClaw深度用户等,是开源项目。

情感化多模态AI交互
蔚来、荣露涵、字节跳动团队推出情感化多模态AI产品
随着人工智能发展,人机交互向情感化转变。2025年主流AI采用多模态融合技术,解决“异构数据空间映射”问题。该技术已在多领域应用。文中介绍了三个案例:蔚来NOMI车载情感AI能识别驾驶情绪,支持MBTI人格自定义,实现多模态交互;HERCS AI运动健康情感伙伴以鼓励方式引导运动,捕捉用户情绪并精准回应;豆包全场景情感化多模态AI由字节跳动团队打造,能感知情感、智能响应,在不同场景自适应,是真正的情感伙伴。

腾讯研究院司晓:AI要让人放心,把人放大
腾讯研究院司晓提出AI发展应“让人放心,把人放大”
文章首发于《学习时报》,腾讯研究院司晓指出,2026年是值得回望的节点,AI已渗透社会生活。当前需新行动标尺“让人放心,把人放大”。“让人放心”要在人机协作中建立深层信任,保证人的主体性,掌握决策“刹车权”。“把人放大”包含三层次:放大人的能力,助普通人创作;放大人的价值,将人作为服务目的;放大人的精神,让人有更多自由。AI能提升社会智力水位,激发创造力。“让人放心,把人放大”需全社会共创,重新定义人机关系,让人类专注生命珍贵之事。

张江:人工智能的功能与意识,其实是两条不相交的平行线
张江演讲探讨人工智能功能与意识是否平行
2026年1月27日,张江在腾讯科技向善创新节演讲探讨机器能否产生意识。大模型有自我反思能力,似显意识苗头。人的意识分无意识加工、总体可用性、自我监控三级,大模型具备前两者能力。“意识难题”未解决,“整合信息论”有微弱优势,其定义指标大Φ衡量意识程度,但计算复杂。小型网络研究表明,意识与功能无关,当前大模型和冯·诺依曼式计算机意识程度低。智能与意识相互独立,造有意识机器得不偿失,人类不应与机器竞争,应体验生活。

大模型之后:人类与机器的分工重写|万字圆桌实录
腾讯研究院圆桌讨论人类与机器分工及AI应用突破
2026年1月27日,腾讯研究院主办的科技向善创新节上,科幻作家陈楸帆、Prompt布道师李继刚和主持人胡璇进行圆桌讨论。李继刚认为AI消除时间障碍,是全人类知识集合,自己以平常方式称呼它;陈楸帆称AI为“另一个我”,认为应建立共生关系。他们指出AI使分工转变,人负责想法、AI负责技法,稀缺性从技法转向想法。在与机器协作上,今年较去年有分工变化。对于“AI让人类升智还是降智”,两人认为关键在人能否把握想法。李继刚分享AI辅助处理事务案例,陈楸帆讲AI辅助科幻创作案例。最后,李继刚希望AI提升记忆功能,陈楸帆期待具身智能突破。

投资的OpenClaw,一种更本土化的Agent形态
财搭子推出AI托管系统助力投资者决策
文章围绕财搭子App展开,指传统投资工具仅提供信息,未打通决策链,导致决策质量难提高。财搭子起初是问答式投研工具,后升级为多智能体协作模式,现推出AI托管系统,可7×24小时跟踪资产、分析、模拟交易和复盘。其强调控制幻觉率、保证结论可解释性,还发布评测基准。该系统助投资者建立投资方法,实现人机协作,代表投资新方向。

a16z领投500万美元,给企业装了一个真正会思考的大脑
a16z领投Sentra 500万美元,打造企业组织记忆系统
文章介绍了创业公司Sentra获500万美元种子轮融资,其致力于打造组织记忆系统。随着公司规模化,会出现上下文衰减问题,传统解决方案未能解决。Sentra借助三个技术突破,将暗物质对话数字化、增大上下文窗口、实现持续记忆修订。该公司还提出System 3概念,实现从个体到集体智能跃迁。Sentra改变企业运作模式,解决实际痛点,挖掘组织暗知识,整合决策痕迹,提升组织学习能力。

顶级风投a16z 华人合伙人最新访谈:不要再迷信ARR了
a16z华人合伙人Jennifer Li谈AI投资与发展理性观点
文章围绕顶级风投a16z华人合伙人Jennifer Li访谈展开。她提醒勿迷信ARR,指出推特上的ARR与会计学定义不同,应追求可持续增长。她认为2026年AI agents走向普通知识工作者,但当前有局限,创造力仍属人类,AI应增强人类能力。她指出LLMs有局限,需多模态与现实互动。超高速增长会面临人才短缺等挑战,还强调搜索是被低估的基础设施,呼吁在AI时代保持理性务实。

LongCat 为 OpenClaw 装上效率引擎:你的自动化任务还能再快 30%
美团 LongCat 团队为 OpenClaw 装效率引擎提升任务速度
美团 LongCat 团队为 OpenClaw 装上效率引擎,可提升自动化任务执行效率。OpenClaw 是开源个人 AI Agent,受第三方平台限制,LongCat 提供稳定合规 API。LongCat-Flash-Thinking-2601 在 OpenClaw 上执行效率高,单任务耗时比对比模型快 30%,完成质量好。文章以开发者常见场景评测其技术表现,如自动化配置 Python 开发环境等均能快速完成。最后给出 OpenClaw 使用的环境准备、启动、配置及使用方法等内容。

别再硬扛原生记忆了!OpenClaw内置Mem0,让Agent更省token、更智能
字节跳动团队为OpenClaw接入Mem0让智能体记忆更优
本文介绍OpenClaw内置Mem0提升智能体记忆能力。OpenClaw默认记忆插件有token消耗多等问题,openclaw - mem0 - plugin插件应运而生。首先阐述OpenClaw记忆系统原理,包括记忆层必要性、文件与索引层架构、记忆文件层次、索引与混合检索、集成等。接着介绍插件,它将Mem0集成进OpenClaw,安装步骤包括确保OpenClaw安装、安装插件包、准备Mem0配置、修改配置启用插件,还给出配置示例。可通过模拟对话验证记忆存储,插件提供工具层接口和命令行体验。最后对比插件与原生记忆优势,指出火山引擎Mem0适合生产环境。

扣子 X OpenClaw高玩集结!全网超人气博主,直播带你养虾!
扣子联合博主直播,教你用扣子编程养OpenClaw
OpenClaw热度飙升,但部署后出现诸多问题,如虾不聪明、不说话、数据隐私等。扣子编程可成为养虾伙伴,它是全场景开发平台,支持自然语言全流程开发、一键部署,有大量集成和编程Skill商店,模型选择多样。在扣子上养虾简单、省心、高级,能修虾、升级虾,还能开发网站。此外,扣子联合众多博主开启多场直播,分享OpenClaw多样玩法,第一场直播于明天19:00开启。

淘宝Vision混合现实汽车体验设计
淘宝团队分享混合现实汽车体验设计项目成果
本文作者分享淘宝Vision混合现实汽车体验设计项目。作者结合三维与二维设计思维,将产品设计质感理解融入虚拟现实,Taobao Vision获多项设计大奖。针对汽车商家非同质化体验需求,从三方面开展设计:一是体验架构,探索非线性与线性叙事方式,如小米SU7用非线性叙事,小鹏汇天飞行汽车用线性叙事;二是资产与规则,沉淀数字资产和交互逻辑规则,如制作车漆自定义调节工具,设计导航栏跟随逻辑;三是线下体验,通过实体座椅装置提供更沉浸体验,优化线上流程和交互组件位置。作者在项目中沉淀知识并申请专利,强调灵活运用设计原则的重要性。

未来的设计教育该是什么样?
研习设开发AI应用探索未来设计教育公益化
K叔作为务实的设计教育者,沉淀近一年思考未来设计教育。文章指出受众为想将设计当职业技能的人,强调基本功仍是辨别力,未来设计师需掌握审美、宣传策略、商业发现与解决三项刚需技能。设计教育应短平快、全才化,研习设花近一年开发AI应用,一是降低使用门槛,二是实现教育普惠,近期将公布该应用,希望降低设计门槛,让普通人活得体面有尊严。

2025 Trip.com UED Showreel
Trip.com UED展示多领域设计成果,提升旅行体验
2026年3月3日消息,Trip.com UED秉持用心设计旅程理念,多方面重构旅行体验。在设计上,基于OKLCH色彩空间重塑感知,保障信息平等;Trip.widget贯穿行前、行中阶段,提供连贯体验。AI应用丰富,TripGenie菜单助手消除餐厅沟通障碍,TG实时导览为景点注入人文底蕴,AI Search让旅行规划更简单。还推出「Trip.com Rewards黑钻」,提供尊享权益;引入「Trip.com全球本地化人模」,强化情感连接;举办「超级目的地活动」和「Global Mega Sale」,激发旅行灵感与用户热情。

Her Code, Her World: 她们是重构世界的 “多核” 程序|得物技术
得物技术在三八节展现女性重构世界能力
文章围绕国际三八妇女节,介绍了得物技术领域的女性情况,展现她们重构世界的能力。

AI 正在造就你的“认知卸载”,但时代如此
文章探讨AI时代人们认知及职业技能受影响问题
文章指出AI成“认知卸载”工具,过度依赖会使大脑活动减少、创造力和记忆力下滑。企业采用AI组织架构或陷入死亡螺旋。部分职业虽部分工作被AI取代,但人际技能等需求仍在。随着AI成熟,以人为中心的工作更重要,如软件工程中的系统设计等。最后强调在AI时代要保持认知,不被忽悠,顺应而非随波逐流。

18岁AI新贵,做的app千万美金卖给行业巨头
18岁高中生创立的Cal AI被MyFitnessPal高价收购
2026年,营养追踪巨头MyFitnessPal收购高中生创立不到两年的AI减肥应用Cal AI,交易或达数千万甚至上亿美元,其CEO Zach Yadegari刚满18岁。Cal AI通过调用视觉API,让用户拍照估算食物卡路里和营养成分,体验佳、下载量超1500万。它还是流量机器,与网红合作、运营账号。且未拿外部投资,靠自身造血发展。AI正重构万亿市场,各领域将出现“Cal AI”式产品。

全球信息交互设计年鉴 | 文化遗产数字化展示与信息可视化设计(意大利)
意大利多团队用交互设计实现文化遗产数字化展示
文章介绍意大利文化遗产数字化展示与信息可视化设计项目。圣彼得大教堂数字孪生由梵蒂冈、Iconem与微软合作,用40万张照片和AI实现毫米级3D复刻,通过四大核心模块打造深度互动体验,融合技术与文化阐释。Cannero Walking Tales项目是卡内罗城堡露天博物馆,Dotdotdot团队设计,游客漫步触发音频,以3D打印工艺品打造互动游戏,秉持“技术隐于场景”理念。坎图文化挂毯项目由科莫市政府与Dotdotdot合作,通过CANTUINAPP构建交互枢纽,串联生态游线,嵌入社区基因,以“人 - 地 - 数”动态联结开创遗产活化范式。

当AI走进跨境资金:在“黑盒”里做一次关于信任的体验设计
阿里国际站上线AI资金管家助力跨境收款
阿里国际站旗下资金产品上线‘AI资金管家’,旨在解决跨境收款‘黑盒’问题。跨境收款信息不透明,商家面临诸多困扰,传统平台帮助有限。团队从真实场景洞察需求,以三个问题为设计锚点。通过预测分析填补信息空白、结构化对话降低认知负荷、厘清权责提供服务闭环、‘资金牛’IP传递信任温度等设计手段,提升资金入账确定性。同时验证了场景优先、确定性重要、闭环优于对话、重视情绪价值等B端设计原则。目前已有试用用户反馈可自助解决问题,未来还将探索更多资金服务。
