Signal #1:Agentic Engineering 正在走向端到端自动化
近期出现的一组迹象显示,AI 编程正在从“工具辅助”阶段,逐步走向由 Agent 主导的连续软件工程执行。
Anthropic《2026 Agentic Coding Trends Report》与 智谱《GLM-5: from Vibe Coding to Agentic Engineering》共同指出,AI 编程正在从辅助编码阶段,迈向由 Agent 主导的软件工程执行。
与此同时,Cloudflare 在博文《How we rebuilt Next.js with AI in one week》中介绍,一名工程师借助 AI 模型仅用一周时间,基于 Vite 重构 Next.js 并实现实验性框架 vinext。这一案例表明在完备的开发环境与工具链条件下,AI Agent 已能够直接参与大型代码重构,从框架级别到部署流程完成端到端执行。
**正在发生的变化是:**AI 不再只是提升单点效率,而是在逐步接管软件研发中的连续执行过程,推动研发从局部自动化走向端到端自动化。
我们可能一直误解了AI对软件研发的影响
探讨AI参与软件研发对控制权和责任分配的影响
过去一年,AI在软件研发中存在感上升,人们直觉认为研发会更高效,但实践中不同场景体验不一。个人使用较容易,企业内部依赖人工确认,理解成本高。其实问题在于我们对AI影响理解不准确。软件研发有人类主导的“决定链”,AI起初是效率工具,后开始参与决策,改变了“决定链”,带来新问题,如理解过程拉长、决策协作更谨慎。这或许是团队不适的原因,AI可能正重塑人与系统分工,值得关注控制权与责任分配。

如何从零开始实现一个 AI Agent 框架(理论+实践)
文章介绍从零实现AI Agent框架的理论与实践方法
文章围绕从零实现AI Agent框架展开,分理论和实践两部分。理论篇介绍AI Agent基础理论,如ReAct、Plan-and-Execute、Reflection模式,对比主流框架,指出Agent框架核心是上下文工程,其运行框架是Agent Loop。实践篇给出架构图,设计LLM Call、Tools Call和Context Engineering三大要素,实现极简Agent框架,包括Agent Loop、工具函数及注册、System Prompt。最后通过Python CLI REPL构建用户交互界面,以DeepSeek为模型展示应用体验,强调极简框架虽有不足,但能看清Agent本质,上下文工程是智能核心。

AI 工程化落地实践:推翻"完美架构",回归提示词本质
腾讯云团队探索AI工程化,推翻“完美架构”回归提示词
文章围绕AI工程化落地实践展开。团队起初设计“完美架构”,但发现其增加认知负担,效率不高。受Google的NotebookLM和Anthropic的Claude Code启发,认识到文本是通用接口,应回归提示词本质。提出认知转变,如用提示词让AI理解规范等。提炼出文档即记忆、先跑起来、自然演进三个落地原则。介绍最简起点是创建AGENTS.md文件,提示词自然演进。还阐述解决AI“失忆”问题的方法、单仓库模式、复合工程理念及团队推广策略等,最后回顾反思,强调AI工程化无银弹,要在实践中迭代。

问题也许不在 AI:软件研发开始适应新的执行者
软件研发适应AI新执行者,研发瓶颈发生迁移
文章指出,随着Coding Agent与AI IDE普及,AI参与代码编写成日常实践。但在真实项目中,AI生成代码易,融入项目难。虽补充上下文信息,人工介入未减,协作成本未降。研发瓶颈从‘如何实现’转向‘如何定义与组织执行’,软件研发正适应新执行方式,开发者角色也在转变。

OpenAI支持的公司将利用超声波读取心思,这其中具有科学依据么?
OpenAI投资Merge Labs,用超声波构建脑机接口
2026年消息,OpenAI投资2.52亿美元给刚成立的Merge Labs公司。该公司从Forest Neurotech分拆出来,开发超声技术读取心思、治疗精神疾病,相比Neuralink式设备侵入性小。超声波可监测大脑大区域、刺激多部位,能成像和调节大脑活动,还能刺激神经元。虽基于血流测量大脑活动有延迟,但该公司仍推进构建脑机接口,还开展相关研究。此外,超声波有望用于更多治疗形式。OpenAI称将与Merge合作构建科学基础模型解读大脑意图,但Merge的研究成果待同行评审数据证明。

从「好看」到「能用」:MIT用可微物理优化,让生成式3D设计真正可制造
MIT团队提出PhysiOpt框架让生成式3D设计可制造
当前3D生成模型视觉成熟但物理层面脆弱,MIT团队提出PhysiOpt框架,首次实现不破坏生成模型原生表示,在潜空间中进行可微分物理优化,让生成式3D设计进入“可制造”阶段。该框架将隐式场解释为连续材料密度分布,解决了生成表示与物理断层问题。相比传统方法,它具有语义保持、计算效率高、泛化性强等优势,能利用预训练模型生成多样作品,未来团队计划探索更多自动化替代方案。

近期,谷歌发表了2篇Multi-Agent协作学习新论文
谷歌发表2篇Multi - Agent协作学习新论文推动MARL发展
2026年2月,谷歌发表2篇Multi - Agent协作学习新论文。第一篇探讨多智能体强化学习中自利益智能体协作问题,传统方法有均衡选择和环境非平稳性难题。论文提出上下文共玩家推理,验证从多样性到协作的因果链,得出上下文学习、混合训练池和剥削脆弱性的结论,还提出PPI算法。第二篇提出用AlphaEvolve自动发现多智能体学习算法,结合LLM代码生成与进化算法。发现VAD - CFR和SHOR - PSRO,经测试在多个游戏中达或超SOTA。两篇论文分别解决协作涌现和算法自动发现问题,有不同关键洞察、方法范式及实践意义。

从 AutoDev 到 Routa:开放生态下的多 Agent 编排新一代实践
Phodal团队推出Routa实现开放生态下多Agent编排
文章介绍了从AutoDev到Routa的多Agent编排新一代实践。Routa是工程化多Agent协作框架,与AutoDev强调“自研一体化”不同,它构建开放编排系统,可接入不同Coding Agent。Routa有三个取舍:优先开放协作,可替换Agent;优先角色分工,明确各角色职责;优先可验证交付,结构化任务信息。其核心特性包括协议融合架构、结构化任务、事件驱动协作等。在工程实现上,通过RoutaSystem统一系统边界,将协作动作变成协议工具,把任务当作数据结构,委派生成可运行子执行单元,多后端语义对齐。Routa让多Agent协作可控、可追踪、可验证。

ICLR 2026 Oral|火山引擎多媒体实验室提出RALI,探索画质理解大模型泛化性,节约96%开销助力实时部署
字节跳动等团队提出RALI框架探索画质理解大模型泛化性
在多模态大模型发展背景下,基于强化学习的IQA模型落地成本高。字节跳动等团队研究揭示RL提升IQA泛化性的机制,提出RALI框架,将图像对齐到高泛化性文本空间,移除LLM和推理,用4%参数量实现与7B模型相当性能。还提出RACT跨域训练范式解决多数据集混合训练问题。实验显示,RALI资源消耗低、性能达SOTA级别,推理速度提升、显存占用降低,跨域泛化性能佳。该研究为端侧画质增强等开辟新道路。

AGENTS.md 真的对 AI Coding 有用吗?或许在此之前你没用对?
论文测试AGENTS.md对AI Coding作用,给出使用建议
文章围绕AGENTS.md对AI Coding是否有用展开探讨。2025年后OpenAI等合作制定该标准,2026年超60000个开源项目含此文件。论文通过SWE - Bench Lite和AGENTBENCH两个数据集及三种对照设置测试,用四套模型组合实验,发现LLM自动生成负收益,人写微弱正收益但不稳定且成本高。原因是context file让agent更折腾但不更聪明,增加探索、测试等却未提高命中率。不过仓库文档缺失时,LLM生成有用。对于论文结论有争议,最后建议把自动生成当草稿,人重新审阅修改,写不可从代码推断的内容,少目录导览多任务路由,按需加载避免污染,用正面引导。

AI 可以让 WIFI 实现监控室内人体位置和姿态,无需摄像头?
wifi - densepose项目用WiFi信号监控人体,核心功能未实现
2026年登上趋势榜的wifi - densepose项目,通过分析室内WiFi信号感知人体位置和姿态,无需摄像头。它用CSI数据替代RSSI,利用AI神经网络算法将无线信号“翻译”成视觉元素,实现模态转换、DensePose整合和实时处理,还可通过多路由器提高精度。但从代码看,核心功能未实现,有大量mock数据,无数据集,硬件接口和CSI解析器也无实际功能,该项目可能只是基于论文让AI复现的工程原型壳子。

如何用 AI 做业务级 Code Review
货拉拉大前端团队推出AI辅助业务级Code Review工具
文章由货拉拉大前端团队撰写,介绍用AI做业务级Code Review的方法。首先指出传统代码评审存在Diff多、新人缺经验、AI缺业务理解等问题,提出打造有记忆懂业务的AI助手。接着阐述核心流程,从git push开始,经触发机制、Diff预处理、语义重塑、基于RAG召回经验、深度Review和报告通知。实践中需解决模型选型、长Diff处理等问题。工具上线后反馈良好,降低老事故复发率。未来将解决RAG噪音、实现一键采纳建议、与Cursor和发布平台集成。

AI真人数字人语音对话性能优化实践总结
Meta技术团队优化AI数字人语音对话性能,降延迟提稳定
Meta技术团队为解决AI数字人导购对话延迟问题进行性能优化。初始对话链路因ASR、LLM和TTS串行叠加,平均端到端延迟达5.64秒。团队先搭建高精度性能监控体系,集成Qwen Omni一体化模型,设计音频窗口缓冲机制。最终平均端到端延迟降至1.323秒,提升76.6%,并改善稳定性。未来,团队设想在自动化测试、自部署链路、端上推理、双模型加速、预录制等方向进一步优化。同时提到Qwen Omni模型局限,后续可采用任意LLM模型加TTS - Realtime模式满足自定义音色需求。

Spec Coding 如何赋能现代 Android 开发:从理念到 Spec-Kit 实践
文章介绍Spec Coding赋能Android开发的理念与实践
文章围绕Spec Coding赋能现代Android开发展开。先回顾软件开发方法演进,引出“规格先行”理念,阐述其工作流。介绍Spec-Kit和Plan Mode工具,前者将规格转化为行动,后者确保规格准确执行,二者协作构成开发流水线。以开发“展示用户动态列表”功能为例,展示Spec-Kit在Android项目各阶段的实践。还指出适用场景及潜在陷阱和应对方法,强调Spec是新沟通界面,遵循“设计先行”可提升开发效率和质量。

测试质量进阶|前沿趋势融合(1)AI驱动测试:从用例生成到视觉自愈自动化落地
TesterHome社区介绍AI驱动测试落地与未来展望
TesterHome社区推出《测试质量进阶》系列文章,聚焦AI驱动测试。传统测试痛点多,AI驱动测试可实现用例自动生成、执行、异常识别和脚本修复。其核心定义是用AI实现测试全流程智能化,价值在于提效、降本、提升覆盖率和适配复杂场景,与传统自动化测试有本质区别。落地分三步:先AI自动生成用例,推荐TestGPT等工具;再推进AI视觉测试自动化,有Applitools Eyes等工具;最后高阶实现视觉自愈自动化,借助Applitools Visual AI等。文末总结落地要点,展望未来将实现全流程智能化。

在 BigQuery 中推出对话式分析智能体
谷歌云在 BigQuery 推出对话式分析智能体预览版
谷歌云在 BigQuery 中推出预览版对话式分析智能体。企业数据量大,知识团队和业务用户面临困境,AI 智能体可改变现状。该智能体运用 Gemini 模型,在 BigQuery 环境中根据业务背景生成、执行并呈现答案。它以多阶段工作流确保回答精确且与上下文相关,具有以上下文为依据、查询经验证、逻辑透明、安全治理等特点。此外,它能将分析从回顾性变为预测性,可对非结构化数据推理,构建简单,还可集成到企业应用和生态系统。用户可开始体验预览版功能并查看相关文档。

人形机器人“跑酷”新框架!北大校友主导开发
亚马逊FAR等团队提出仿人机器人跑酷新框架
今年春晚人形机器人技术有飞跃,但捕捉人类动作敏捷性与自适应性仍是难题。亚马逊FAR等团队联合提出感知驱动的仿人机器人跑酷框架(PHP),可让机器人基于视觉自主完成长时程跑酷任务。研究人员在宇树G1机器人上实验,验证框架有效性,机器人能完成高动态跑酷技能。框架创新点在于采用运动匹配策略、训练强化学习专家策略并蒸馏为学生策略,实现自主决策。该框架让机器人敏捷度提升,能组合技能穿越多障碍赛道,但目前缺乏语义化场景理解,受感知与硬件限制,未来需更优传感方案与语义场景理解。

一文快速理解 Spec 模式
TRAE作者介绍Spec模式驱动AI辅助开发优势
文章围绕Spec模式展开,先指出Vibe Coding存在缺乏全局视野、代码质量不稳定等问题,引出Spec Coding。它是一种以软件规范为核心的AI辅助开发方法论,能让人和AI在开发中始终对齐。接着介绍Plan和Spec模式的区别及适用场景,Plan适用于中小型功能开发,Spec面向复杂系统级任务。在TRAE中用Spec模式,会生成项目范围、任务拆解、验证清单三份文档。通过PWA项目实践展示其优势,还列举使用场景和解答常见问题。最后总结TRAE三种模式适用不同复杂度场景,用户可按需灵活选择。

AI Agent系列|什么是 ReAct Agent?
阿里云开发者解析ReAct Agent核心原理与价值
文章深入浅出解析ReAct Agent的核心原理与工程价值。首先介绍ReAct Agent系列计划,包括解析其与传统编程、工作流的本质区别等内容。接着阐述ReAct的核心思想是观察 - 思考 - 行动,类似人类解决问题的过程,以查询北京天气及穿衣建议为例说明。然后解释需要ReAct的原因,它能灵活应对复杂、不确定任务。最后说明ReAct的实现关键要素,如历史上下文、环境信息、语言模型等,并给出执行流程示例和伪代码。

AI Agent系列|深入了解智能体工作流核心:Agent vs 传统编程 vs Workflow 的本质区别
阿里云开发者解析Agent与传统编程、工作流的本质区别
文章基于作者实战经验,解析ReAct Agent核心原理与工程价值。对比了Agent、传统编程和Workflow工作流。传统编程需提前规划,依赖硬编码,修改成本高;Workflow工作流更灵活,但流程固定,复杂逻辑仍需代码;Agent能动态调整策略,由AI决策。作者认为Agent是面向未来的新范式,适合处理不确定性、快速迭代等场景,而传统编程和Workflow工作流本质上是程序控制的流程流转,可相互替代。开发者应根据实际场景选择合适方式。

AI Agent系列|深入解析Function Calling、MCP和Skills的本质差异与最佳实践
阿里云开发者解析Function Calling、MCP和Skills差异
文章基于作者实战经验,解析Function Calling、MCP和Skills的差异与实践。首先介绍AI Agent工具调用流程,指出Function Calling是基础,能将非结构化需求转为结构化调用。但它存在工具集成成本高的问题,MCP应运而生,提供标准化接口解决该问题。之后又出现任务流程定义困难的问题,Skills让用户用文字定义任务流程。MCP和Skills基于Function Calling,二者是竞争关系。最后指出Skills存在需求描述不结构化、无法与既有系统接驳的问题,Lynxe的Func - Agent以函数为核心解决这些问题。

ABACI内核缺陷智能体:让模糊测试真正“自动化”
阿里云ABACI内核缺陷智能体实现模糊测试自动化
文章介绍ABACI内核缺陷智能体,以解决Linux内核测试、分析和修复难题。传统测试手段对庞大内核代码库力不从心,模糊测试难以持续化。ABACI实现测试-分析-修复全链路自动化,包括用户意图理解、自动测试部署、缺陷定位分析和补丁生成。智能体还通过融合语义分析与确定性推理实现精准归因,借助钉钉机器人实现人机协作。其修复智能体构建高鲁棒性修复流水线,经多源数据融合和迭代式工作流生成补丁,并通过多阶段验证闭环保障补丁有效性。实际应用中,ABACI使人工投入减少超96%,缺陷修复周期大幅缩短,为底层基础设施智能维护提供范式。

AliSQL DuckDB:数据压缩与归档分析实践
AliSQL引入DuckDB,优化数据压缩与归档分析
本文为《DuckDB技术解读》系列第一篇,聚焦数据压缩与归档。业务增长使存储开销和历史数据可分析性成瓶颈,AliSQL引入DuckDB作存储引擎,提升压缩与扫描能力。介绍DuckDB压缩过程,以列数据为单位,先扫描分析选最佳算法,后按算法压缩写入。其压缩算法因数据类型而异,列式存储与自适应编码能显著降成本。对比InnoDB、HBase等系统,DuckDB落盘体积最小。AliSQL对DuckDB压缩链路优化,提升吞吐与并发效率,还支持存储层硬件压缩。DuckDB优势源于“列式组织 + 自适应算法选择”,AliSQL在此基础上进一步优化,为历史数据归档提供低存储占用和可控成本。

Agent Skills与MCP:一场被误解的“替代战争”
京东牛潇解析Agent Skills与MCP非替代而是协同关系
本文由京东牛潇撰写,探讨Agent Skills与MCP并非替代关系,而是搭档。先介绍二者概念,MCP是标准化通信协议,解决AI与外部系统连接问题;Agent Skills是模块化能力封装标准,定义AI行为规范。接着对比设计哲学,MCP重能力扩展,Agent Skills重业务价值。通过客户服务、金融风险评估、自动化部署等场景说明适用情况。还给出选择建议,如业务规则复杂选Agent Skills,需访问外部数据源选MCP。最后总结二者核心原则,指出应协同共生,未来将走向标准化融合、动态协同和开发者体验优化。

AI 这件事,思科总裁讲清了 4 个问题
思科总裁Jeetu Patel讲清企业AI应用四大问题
思科总裁Jeetu Patel在访谈中解答企业AI应用的四个问题。大公司做AI虽有优势却犹豫,源于怕改旧方式、怕削弱专业优势、怕AI不可控。而思科敢全力下注,因其方向统一、战略由CEO亲讲、能力整合。企业切入AI要问老本行与AI关联、产品交付能力、生态协作情况。Jeetu还给出行动建议:让AI参与业务、建立说真话文化、为半年后做准备。强调AI浪潮中,犹豫是最贵成本,企业应主动迈出第一步。

Modern.js 3.0 发布:聚焦 Web 框架,拥抱生态发展
Modern.js团队发布3.0版本,聚焦Web框架并带来多项新特性
2026年2月25日,Modern.js团队发布Modern.js 3.0。此版本有两大核心转变:聚焦Web框架,Module和Doc孵化为Rslib与Rspress;更开放,强化插件体系。新特性包括:集成React Server Component,支持CSR和SSR项目及渐进式迁移;移除webpack,全面拥抱Rspack,提升构建、安装速度,减小产物体积;开放完整插件体系,含运行时、服务端插件;内置React Router v7,提供配置式路由和AI友好调试;重做SSG能力,有缓存和降级策略;基于Hono重构Web Server,支持跨项目调用;与Module Federation 2.0深度集成;升级React 19,最低支持Node.js 20,用Biome作代码工具。

开启一码五端,NutUI 组件库助力黄流跨端实现
NutUI组件库助力黄流业务实现一码五端并邀开发者共建
在“京东订单鸿蒙 - 回跨iOS/安卓”项目中,NutUI组件库助力实现一码五端。2024 - 2025年,NutUI做了鸿蒙和iOS/安卓适配,推动了@hlfe/ui首个版本落地。hlfe/ui整合Taro基础组件库和NutUI,采用双层组件架构,通过构建脚本智能导出组件。使用时,用jd - init搭建项目,需确认包引入和配置项。核心能力优化方面,进行五端适配,扩充组件功能,完善无障碍支持,升级Icon库。目前@hlfe/ui已开放30 + 组件,未来将开放更多,还邀请开发者共建。

新东方用 MasterGo Agent 让业务「先跑为敬」
新东方信管团队用MasterGo Agent实现业务快速验证上线
2026年,新东方信管团队面临UI设计资源短缺、响应速度慢等问题,传统流程制约业务发展。其UXC设计负责人杨峰引入MasterGo Agent,让产品经理用其几分钟内生成B端页面,虽细节有差异但整体稳定。前端工程师通过“MasterGo Agent → MCP → Cursor”工作流,可自动生成可部署前端代码。该工作流使系统上线周期从按周缩短到按天,降低试错成本。MasterGo Agent能精准执行企业级设计规范,成为业务增长加速器,让团队更敏捷创新,将验证能力转化为业务增长动能。

Flutter 2026 Roadmap 发布,未来计划是什么?
Flutter发布2026 Roadmap,涵盖多方面未来计划
2026年2月25日,Flutter发布2026 Roadmap。2025年其基本完成Impeller移动端过渡,解决了复杂动画着色器编译卡顿问题,hotload支持到Web端,且在移动端和桌面端的使用率有所提升。2026年官方重点包括持续推进Impeller,完成Android平台迁移并移除旧版Skia后端,支持新系统版本,改进辅助功能;与社区框架合作,转正WebAssembly;在GenUI和AI方面,研究改进Dart语言以支持动态加载AI生成UI,与团队合作实现Dart支持,开发Dart Cloud Functions等;还计划改进Dart语法和编译性能,支持Git LFS。

Android 17 有什么需要适配的?2026 Android 禁止侧载又是什么?
谷歌发布Android 17适配内容并将实施开发者认证
文章围绕Android 17适配和2026年Android禁止侧载展开。Android 17适配方面,涉及usesCleartextTraffic弃用、‘隐式URI grant’限制、键盘显示状态变化、后台音频收紧等多项变更,还针对targetSdk=37有新措施,如引入DeliQueue架构、收紧BAL、新增权限等。禁止侧载方面,2026年3月开发者身份验证开放,9月部分地区需验证开发者才可安装应用,2027年全球普及。谷歌称此举为提升安全,还为部分开发者构建新控制台,但开发者认证需提供个人信息,引发不便之感。

Flutter 的真正价值是什么?深度解析再结合鸿蒙,告诉你 Flutter 的真正优势
文章解析 Flutter Embedder 价值及在鸿蒙平台适配优势
文章深度解析 Flutter 真正优势及在鸿蒙适配快的原因。指出 Flutter 最大价值是 Embedder,可让其在非官方平台运行,有企业价值。介绍 Embedder 嵌入内容、能力划分及使用时需做的工作,还提及在不同平台实现方式。以鸿蒙为例,详述 Flutter 嵌入层实现,包括层级关系、各部分职责。最后强调 Embedder 实现是 Flutter 最大价值,虽门槛高但便于跨平台,在 AI 时代易被小众平台接入。

你是不是觉得 R8 很讨厌,但 Android 为什么选择 R8 ?也许你对 R8 还不够了解
文章介绍Android R8编译器特点、问题及未来发展
文章围绕Android R8编译器展开。先对比D8与R8,指出D8用于调试,R8用于发布且功能更全。介绍R8核心优化机制,如Tree Shaking、方法内联等。但R8存在问题,反射和JNI会致其误删代码,需Keep Rules,部分规则宽泛影响性能。如今R8开发体验和资料改进,有反混淆和新文档。未来R8有新特性,如局部优化、新注解、资源缩减结合等。官方建议开发者开启R8,其能减小APK体积、提升性能。

拆解 Open WebUI:前端如何做一个生产级 AI 对话界面
搜狐技术拆解Open WebUI前端打造生产级AI对话界面
文章围绕Open WebUI展开,先介绍它是热门开源AI对话界面项目,功能丰富。接着分析其三层架构,前端用Svelte + SvelteKit,后端为Python + FastAPI,数据层含SQLite等。然后详细拆解核心组件,如Sidebar管理对话、ModelSelector选模型等。还指出流式渲染存在性能坑并给出优化思路,介绍状态管理、消息树结构、RAG接入和插件系统。最后建议学架构思路而非照搬细节,因做“好用”的AI对话界面需解决流式渲染、数据模型等难题,而Open WebUI已提供成熟方案。

Kotlin Analysis API
文章介绍Kotlin Analysis API的功能、组件及应用
文章介绍Kotlin Analysis API,它是用于理解和分析Kotlin代码语义的底层库,为IDE智能功能和代码分析工具提供支持。首先阐述IDE插件和注解技术能提升开发效率,Kotlin发展迅速且未来聚焦性能提升等。接着介绍API核心组件,包括会话管理、符号系统等。还讲解主要组成部分,如KaSession是交互入口,需在读操作内使用;Symbols表示声明;KaSymbolPointer用于跨会话引用符号;Scopes作为声明容器;KaTypes表示代码中类型。最后说明可通过API访问和分析注解,它能降低构建开发工具门槛,未来作用将更重要。

秒触达、零资损:亲宝宝基于 RocketMQ 支撑千万家庭实时互动与成长记录
亲宝宝采用阿里云RocketMQ 5.x支撑家庭互动与记录
亲宝宝是育儿领域移动互联网公司,旗下APP注册用户超亿、月活超千万,技术架构面临高并发、强一致性与实时触达压力。经评估,亲宝宝选择阿里云RocketMQ 5.x Serverless,因其有Serverless架构、秒级精准延迟消息、全链路可观测性和云原生弹性伸缩等优势。在成长相册、成长印迹定时解锁、积分权益等场景应用后,实现处理流水线低延迟、事务消息高成功率。未来,亲宝宝将与阿里云探索RocketMQ 5.x在AI场景的更多能力。

5 分钟零代码改造,让 Go 应用自动获得全链路可观测能力
阿里云开源Loongsuite Go Agent让Go应用零代码获可观测能力
文章介绍阿里云Loongsuite Go Agent,可让Go应用编译时获全链路可观测能力。它能解决传统可观测方案代码侵入强、改造工作量大、有性能开销的痛点。通过编译时插桩技术,实现零代码改造、自动化埋点且性能友好。以MCP 官方Go SDK为例,说明其自动插桩效果。还阐述了技术原理、工作流程及插桩方式。5分钟即可上手,可将结果导出到多种平台。它支持50+主流Go框架和库,性能表现优,有开源地址和社区支持。

数据金丝雀:Netflix如何验证目录元数据
Netflix构建数据金丝雀系统验证目录元数据
Netflix为保障流媒体可靠性,构建自动化数据金丝雀系统验证目录元数据。此前一次生产事故暴露数据验证缺口,传统金丝雀分析工具难以应对高速度数据管道验证挑战。Netflix开发了数据金丝雀协调器模式,包括专用协调器模式、利用并扩展混沌平台、生产级边缘情况处理。通过受控故障注入实验验证系统有效,能在2.5 - 4分钟内识别问题,自动阻止发布。该模式可广泛应用于高速度数据管道系统。

Sentinel Java客户端限流原理解析|得物技术
得物技术解析Sentinel Java客户端限流原理
文章围绕Sentinel Java客户端限流原理展开。首先从HTTP请求引入,说明为保证系统稳定需为核心接口配置限流规则。接着阐述限流规则加载,RuleLoader将多种规则加载到缓存,以流控规则为例介绍其加载详情。然后介绍SentinelServletFilter过滤器和SentinelResourceAspect切面的工作逻辑。流控处理核心逻辑方面,入口函数通过调用链创建限流入口,ProcessorSlotChain采用责任链模式组合功能插槽,包括NodeSelectorSlot、ClusterBuilderSlot、StatisticSlot等。FlowSlot根据预设规则进行流控检查,流控规则由阈值类型、调用关系策略和流控效果等要素构成。最后介绍滑动窗口算法,StatisticNode作为统计数据结构,ArrayMetric使用滑动窗口思想采集数据,OccupiableBucketLeapArray可解决秒级统计数据误差问题。

超简单!用云效 + AI 编程工具智能管理代码仓库
阿里云云效 MCP 用自然语言智能管理代码仓库
文章介绍通过阿里云云效 MCP 提升代码管理效率,以自然语言交互取代传统 Git 命令行操作。阐述云效 MCP 的核心能力,包括仓库与分支管理、自动化分支创建等,还介绍环境准备及验证方法。通过多个场景展示应用,如查分支、自动创建分支、代码浏览修改等,有合并请求、版本对比等操作。此外,提及进阶应用,像团队开发节奏分析等。最后指出能实现从工具操作到智能协作的转变,值得开发者尝试。

软件工程3.0宣言(2026年版)
朱少民发布软件工程3.0宣言(2026年版)
2026年2月26日发布“软件工程3.0宣言(2026年版)”。因AI发展快,距2023年版近3年,有必要更新,后续还将发布相关原则和实践内容。在大模型与智能体崛起背景下,人、软件、工程角色升级转变。该宣言认同并实践四大价值观:以业务意图为中心的人机协作、可进化的结构化知识与记忆、可执行的验收意图、异构智能体的对抗与协作机制。

告别死板流程:OpenSpec OPSX 如何重塑 SDD 开发工作流
OpenSpec OPSX重塑SDD开发工作流并带来新体验
文章介绍OpenSpec OPSX重塑SDD开发工作流。先阐述SDD将规范作为系统核心,OpenSpec是轻量SDD工作流框架,强调灵活迭代、低成本等特性。OPSX打破传统“阶段制”,转向“行动化”工作流,带来体验提升。其核心理念包括制品与依赖图、基于文件系统的状态机、可定制的Schema与模板和开放的迭代模型。与OpenAPI、BDD、传统RFC流程对比,各有优劣且可互补。架构从硬编码走向开放,提供丰富命令。适用场景包括从0到1开启变更、团队定制推广,但要警惕过度模板化等风险,它是思维方式转变,让思考回归开发核心。

翻车了,iOS26的这种菜单真不好用,手机端设计都别学了吧
作者体验后称iOS26跟随式弹窗不如居中弹窗好用
作者曾发文夸iOS26跟随式弹窗创新高效,2个月实际体验后发现并不好用。该弹窗从按钮上弹出,会被用户按按钮的手指遮挡,删短信时遮挡不严重所以长时间没发现问题。菜单入口大多在右侧时问题不大,但靠左仍可能有遮挡。PC端不存在文字被遮挡问题。作者认为设计不能轻易创新,多数企业和设计师用常规组件即可,苹果、谷歌这类企业才有资源试错,也可通过数据分析A/B测试验证创新方案。

那些被全网疯传的动物表情包,它们真的快乐吗?
文章探讨网络动物内容误判原因及应对态度
文章围绕网络动物内容展开,指出动物图片和视频因可爱易让人共情而走红,但常存在反转,如海龟“快乐”、熊与狗“友谊”、仓鼠“顽皮”背后可能是恐惧等。误判源于人类无意识用解读人类行为的方式理解动物,即拟人化。传统学术批判“拟人化原罪论”,近年被质疑。人类解读动物行为误判未必高估智力,也可能忽视其独特认知模式。拟人化之争本质是价值观与认知目标之争。面对动物视频,我们难以遏制拟人化倾向,专业人员可重塑直觉判断力,普通用户应保持谦逊、共情,秉持善意欣赏。

三星S26发布会丨这次,AI真的要接管你的手机了?
三星与谷歌在S26发布会推出Gemini智能体改造手机交互
2026年三星S26发布会,三星与谷歌推出全新Gemini智能体。它能模仿人类手指操作屏幕,如“Gemini自动任务”可读懂聊天记录订披萨,还能应变解决问题。谷歌为AI革命准备两套方案,AppFunctions需开发者配合,UI自动化框架可直接操作屏幕。但面临隐私安全、巨头抵制、利益链条洗牌三座大山。不过这只是开始,未来Gemini或驱动更多设备,手机交互方式变革充满机遇与挑战。

2028年全球智力危机:当人类智力不再稀缺,中产阶级的黄昏到来?
Citrini Research发布报告设想2028年AI引发全球经济危机
Citrini Research发布《2028全球智能危机》报告,设想2028年AI发展引发经济危机。AI发展使白领大规模失业,“智能溢价”消失,中产收入受损;企业利润增长但消费萎缩,形成“幽灵GDP”;AI代理消除交易摩擦,威胁多种商业模式。AI能力提升使企业减少劳动力需求,形成负反馈循环。软件行业首当其冲,随后中介领域受冲击,支付行业也面临风险。美国就业市场动荡,新岗位远不及旧岗位数量和薪酬。印度IT服务业受重创。经济衰退,私募信贷违约,保险监管收紧,抵押贷款市场也受威胁。政府应对政策不足,各方争论激烈,需建立新经济框架应对人类智能溢价消退问题。

建议走路去洗车的AI,不可能做好UX设计
UX设计师谈AI做UX设计局限及人类应对之法
文章从知乎上AI建议走路去50米外洗车的讨论展开,作者作为UX设计师结合自身经历指出,早期自己设计方案任务完成率低,是因对用户理解不足,信息需在现实观察用户获取。AI也有同样问题,它基于图文学习,没经历真实生活,无法理解用户做不出好的体验设计。此外,市场营销等领域也需对人的理解。目前AI学习像“读万卷书”,若想突破需从现实学习。在AI时代,人类脱离书本规范学习才能保持竞争力,设计中数据分析等能力对设计师有价值。

AI+软件工程的加速演进:2028年会呈现怎样的实景?
朱少民结合报告和案例展望2028年AI+软件工程图景
作者朱少民结合Citrini报告和FARS系统案例,重新审视“AI+软件工程”发展。过去一年,智能软件工程呈指数级跃升。Citrini报告推演2028年“全球智能危机”,FARS展示智力流水线生产。2028年,AI-IDD将普及,多智能体系统形成“内部社会”,AI测试能预防问题并反思。人类角色将转变,如成为“意图工程师”等。软件行业结构将重塑,面临法律伦理挑战。AI将超越LLM,“世界模型”崛起。这场变革是智力红利消解下的“灵魂再造”,需思考应对之策。

The Batch:912|GLM-5 实现规模升级
Z.ai发布GLM - 5,在开放权重模型中性能卓越
Z.ai将旗舰大语言模型GLM - 5规模提升两倍多。它专为长时智能体任务设计,支持长文本输入输出,采用专家混合型transformer架构,总参数量7440亿。具备函数调用等特性,在多基准测试中开放权重模型里表现佳,提供免费网页界面等。预训练用28.5万亿token,后训练用slime软件,采用DeepSeek稀疏注意力机制。它在部分任务超此前开放权重模型,但总体仍落后专有前沿模型。其缩小了开放与专有模型差距,且开放权重AI重心向东方转移。

The Batch:914|边缘设备上的更快推理
Liquid AI发布LFM2.5 - 1.2B - Thinking模型,性能优但有幻觉挑战
2026年2月26日消息,Liquid AI发布专为小型设备运行的模型LFM2.5 - 1.2B - Thinking,补充LFM2.5系列。它支持32768个token文本输入输出,采用混合架构,参数11.7亿。性能上多数基准超Qwen3 - 1.7B,运行快、内存需求低,但幻觉问题有挑战。其架构结合注意力与卷积层,分阶段训练。在多项测试中表现佳,推理速度领先,不过在MMLU - Pro等测试中较弱。适合驱动设备端智能体,在智能、速度和内存间实现平衡。

小红书发布 SWE-Bench Mobile:当 AI Agent 面对亿级用户 App 代码库,最高通过率仅12%?
小红书发布SWE - Bench Mobile,AI Agent代码库通过率低
2026年2月27日,小红书发布SWE - Bench Mobile。大型语言模型发展催生新一代自主编码智能体,像Cursor等AI编程工具在现有基准测试有表现,但当AI Agent面对亿级用户App代码库时,最高通过率仅12%。

用AI的这三年,想跟你分享这9条心得。
作者分享用AI三年的9条使用心得
作者分享用AI三年的9条心得。指出当前AI使用仍不广泛,仅小群体主流。建议花20美元用顶级模型,感受其强大能力;每周自动化一个重复任务,提升效率;抛弃搜索思维,以实习生思维用AI,清晰表达需求;做事前问自己AI能否帮忙;利用AI降低创造门槛,积极创造;警惕AI正反馈带来的幻觉,用真实世界检验成果;不要等准备好再开始,边用边学;培养品味与审美,这是AI无法替代的优势;把AI节省的时间还给现实中的人,感受真实幸福。

Anthropic一条推文,引发了全球AI圈同仇敌忾的群嘲。
Anthropic指控中国AI公司,推文引发全球AI圈群嘲
2026年2月24日,Anthropic在官网发博客称,DeepSeek、Moonshot和MiniMax三家中国AI公司对Claude进行“工业规模的蒸馏攻击”,还造成重大国家安全风险,此推文引发全球AI圈群嘲。“蒸馏”是AI常见训练技术,Anthropic自家也用此技术迭代模型。且它曾因用盗版网站书籍训练Claude,花15亿美元达成和解。2026年1月,它又被音乐出版商指控用盗版歌曲训练模型。文章还探讨了AI时代“偷”数据的定义,以及知识产权是否算真正财产等问题,指出AI版权争论复杂,不应二元对立。

Claude Code更新,你终于可以随时随地在手机上Vibe Coding了。
Anthropic公司Claude Code更新,新增远程控制功能
2026年2月26日,Anthropic公司的Claude Code更新,新增远程控制功能,用户在电脑运行/remote - control命令生成链接,在能登录Claude账号的设备浏览器打开该链接,就能远程Vibe Coding。该功能让手机直接操控电脑,文件系统等可同步使用,对话在多设备间同步。使用时开启自主模式可提升体验,还能多终端并行。Claude Code安全措施出色,采用只出不进和账号强绑定方式。不过目前仅Claude Max会员可用。此功能让用户能随时随地进行Vibe Coding,带来创作乐趣。

从小冰到元宝,10年过去了,为啥AI就是管不住嘴?
腾讯元宝等AI聊天机器人频“骂人”,业界探索解决办法
文章围绕AI聊天机器人“管不住嘴”问题展开。以腾讯元宝除夕夜生成辱骂图片、微软小冰曾满嘴脏话、ChatGPT等也有攻击性输出为例,指出AI骂人问题普遍。原因一是预训练数据含有害内容且难完全过滤,二是上下文窗口隐性污染,三是“生成后过滤”架构有漏洞。因基于人类反馈的强化学习无法杜绝风险,神经网络“黑箱”不可预测,问题无法根治。业界探索解决方案,如情感标注和场景分类、ReAct事前干预、CAI自主推理等。

谷歌开源PaperBanana:顶会级论文自动配图
谷歌开源PaperBanana实现顶会级论文自动配图
2026年2月24日谷歌开源PaperBanana用于顶会级论文自动配图。当前自动科研画流程图是瓶颈,现有代码派和生成派方案有问题。PaperBanana核心是参考驱动和多智能体协作,包含Retriever、Planner等五个智能体分工。作者构建PaperBananaBench基准评估,评估协议包括忠实度等。实验结果显示,PaperBanana全面碾压基线,Overall得分比Vanilla高17.0%,简洁性提升显著,人类盲测胜率72.7%。它代表学术插图自动化重要里程碑,实现接近人类水平的自动化方法论流程图生成。

从0到1拆解,什么才是真正的AI原生应用?
噜噜猫剖析AI原生应用本质并给出产品经理建议
文章指出很多AI项目停留在表面创新,深度剖析AI原生本质。先区分AI增强与AI原生,前者AI是点缀,后者AI是核心。以“灵感旅行家”为例,阐述产品经理工作流重构,需求分析从“功能清单”到“场景意图池”,交互定义从“点击路径”到“多模态感知”,架构设计从“瀑布流页面”到“Agent编排”,交付物定义从“静态展示”到“实时生成的逻辑流”。最后给产品经理做AI原生应用提三条建议,包括拒绝“对话框依赖症”、拥抱“灰度需求”、别追求100%确定性。

2026 AI趋势预测,全球科技巨头与顶尖机构研判
全球科技巨头与顶尖机构发布2026年AI趋势研判
2025年是AI迈向规模化落地关键年,如今已向“实体执行”演进。全球科技巨头与顶尖机构发布2026年AI趋势研判,从报告词汇热点看,基础设施、AI技术仍是热点,应用涉及Coding、健康等,安全规范关注监管、伦理等;量化指标分开发、部署、应用三阶段。各报告观点共识有:AI Agents是核心,安全、伦理与监管加强,AI在多行业落地等。各厂也有各自核心观点,如Anthropic提出软件开发生命周期剧变,Google推员工专属Agent等,并推荐了AI趋势跟踪平台。

Seedance 2.0 登上春晚大屏:8K/50FPS背后的最佳拍档
火山引擎团队助力Seedance 2.0视频登上春晚大屏
2026年总台马年春晚首次引入由Seedance 2.0生成的创意视频内容。目前全球主流视频生成模型输出规格与春晚要求差距大,火山引擎视频与边缘团队依托智能媒体处理平台对AIGC内容“智能精修”。采用“一镜一策”理念,重点突破超分辨率重建、智能帧率提升两大技术,构建三位一体画质增强体系。最终输出视频达播出标准,保留艺术风格。此次合作让AIGC内容迈入高规格视听领域。

一文读懂 Agent Tools,拒绝复杂化、碎片化、黑盒化
字节跳动技术团队介绍Agent Tools开发及AgentKit应用
本文由字节跳动技术团队撰写,介绍Agent Tools开发及火山引擎AgentKit应用。先讲开发要点,如利用Python和Pydantic保障类型安全,用自然语言设计接口,集成OpenAPI规范,构建自我修复能力,加入安全防护机制,优化性能与管理上下文。还提及解决碎片化、复杂化、黑盒化痛点的方法,如用AgentKit Gateway转换存量应用,治理MCP工具,开发MCP Server,管理Skills,做好工具鉴权与身份管理。最后给出零售、金融科技行业实战案例,展望了AgentKit助力企业业务能力AI化的前景。

用AI做字库 | 5款AI新字落地业务场景 ©中文智造计划
中文智造计划发布5款AI新字用于业务场景
文章是中文智造计划Vol.04分享,介绍用AI造5款新字落地业务场景。越过AI基础字形生成可行性验证阶段,此次注重风格化定向,平衡功能性与表现力,适配业务场景。5款字体涵盖不同风格,如新松体亲切、漫写体灵动等。借助“米芾造字大模型”,按集团业务场景定制字体,精准适配不同需求。AI造字项目第三期共12款字体介绍完毕,展现AI辅助设计下创意边界延展,为设计提供新思路,且已在业务中落地。

国产模型春节大考:来自 MiniMax、GLM、Seedance 开发者的一线复盘|Best Ideas
Best Ideas社群组织国产模型春节大考闭门讨论
文章是「国产模型春节大考」闭门讨论会实录。OpenRouter数据显示国产开源模型调用量占比高。讨论涉及重要技术问题,如模型能力从可验证向模糊任务迁移、持续学习是趋势、多模态感知等,还指出数据重要性提升、国内模型公司面临基础设施短板但架构创新积极性高。深度解析了几款国产模型,如Seedance 2.0在视频生成领先,MiniMax M2平衡性能、速度和成本,GLM - 5押注工程师路线。Token消耗场景变迁,2026年预计大幅增长,国产模型采用低价竞争策略,商业化转正关键是优化推理效率,还探讨了出海路径和不同市场情况,最后提到企业端对Agent付费可能提升,国内厂商有国民级产品落地优势,出海不必局限美国市场。

智谱新年的第一篇论文:GLM-5 技术报告解读来了!
智谱开源GLM-5技术报告,公布训练方案并开源
2026年2月22日,智谱开源40页GLM-5技术报告。数据显示,GLM-5在多评测表现出色,为Agent场景优化,原生适配七大国产芯片平台。训练方面,面临Agentic RL训练效率低和上下文长的问题。团队提出Slime框架,将生成和训练分离,解决训练效率问题;采用DSA降低长上下文计算成本,用确定性top-k保证训练稳定,并设计思考模式管理上下文。其完整训练体系包括分层训练不同能力、构建训练环境、优化基座模型。智谱方案开源,推动Agent训练成为可复制的工程实践。

OpenClaw + Claude Code 超强教程:一个人就能搭建完整的开发团队!
Datawhale分享OpenClaw+Claude Code搭建AI Agent系统教程
本文分享OpenClaw+Claude Code搭建AI Agent系统教程。该系统让开发者一人实现一天94次代码提交、30分钟完成7个PR。单独用Codex或Claude Code有局限,因上下文窗口固定难兼顾代码和业务。OpenClaw做编排层,持有业务上下文并精准调度执行层Agent写代码。介绍了系统架构、从需求到PR合并8步工作流,还有让系统更聪明的机制,如改进版Ralph Loop、Agent选择策略等,最后指出搭建简单,成本可控,未来或催生大量一人百万美元公司。

2028全球智能危机,谁来买单?
Citrini Research发布报告预警2028全球智能危机
Citrini Research的《2028全球智能危机》爆火,提出AI越成功经济越危险的观点。AI发展使白领工作被取代,消费力下降,出现“幽灵GDP”。2025年底agent编码工具能力跃升,企业支出决策改变,SaaS行业受冲击。2027年初大语言模型普及,agent消除消费交易摩擦,颠覆中介层。AI导致行业风险向系统性风险转变,白领失业增加,消费信贷经济受威胁。2027年宏观经济负面发展明显,失业白领降级,消费冲击滞后但大。私募信贷违约增加,保险监管收紧。抵押贷款市场也受威胁,收入假设受损。危机形成实体经济和金融的负反馈循环,政府反应不足,社会结构瓦解,需建立新经济框架。

万字深度解读 MCP Apps:重构 Web 应用,开启 AI 助手的“小程序”时代。
文章深度解读MCP Apps重构Web应用开启AI助手“小程序”时代
本文深度解读MCP Apps,它是由OpenAI与Anthropic等推动的开放标准,让传统对话式AI助手迈向“图形界面”时代。文章先介绍MCP Apps的价值、概念、场景及与Web Apps的区别,指出它能解决MCP协议呈现与交互方式不足的问题,适用于数据探索、配置向导等场景,是从“应用优先”到“任务优先”的模式变革。接着阐述其Server + Host + View的协同运作机制,包括发现、初始化、数据注入、互动和退出等阶段,核心通信机制为postMessage + JSON - RPC。然后介绍从零构建MCP App的步骤,可借助AI或手动开发。最后对比MCP Apps与谷歌的A2UI,分析两者在UI生成方式、组件灵活性等方面的差异,指出它们共同目标是让AI交互突破纯文本限制。

Android 官方正式官宣 AI 支持 AppFunctions ,Android 官方 MCP 和系统级 OpenClaw 雏形
Android官方官宣AI支持AppFunctions及相关特性
2026年2月28日,Android官方官宣AI支持AppFunctions,展示其在Galaxy S26系列与Gemini的三星图库集成功能。早期预览版将在Galaxy S26系列和部分Pixel 10设备推出,支持美韩部分场景。AppFunctions可让App被AI当工具调用,不打开目标App完成跨App任务。对未支持的应用,Google有降级操作。其原理是建立本地函数体系,开发者通过AndroidX AppFunctions库集成,Jetpack会自动处理支持验证,该方式更规范,符合手机Agent理想形态。

文本大模型评测实践
货拉拉技术AI应用组开展文本大模型评测实践
本文是货拉拉技术AI应用组的文本大模型评测实践。先介绍文本大模型评测的概念、重要性,调研近3年成果,围绕“评测什么”与“怎么评测”展开。“评测什么”分通用、领域、场景能力;“怎么评测”从评测维度与指标、评测数据、评测方式阐述。评测维度与指标更贴合场景、注重安全风控与综合评估;评测数据25年向学术引领等发展,构建有人工和机器方式;评测方式有人工、人机协同、机器。最后介绍货拉拉AI应用评测实践,沉淀半自动评测体系,以某场景为例说明评测方案、效果。

AI Agent 的危机:我要删你邮件你拦得住吗?
池建强提醒使用AI Agent要重视安全防护
文章指出大模型能力增强,更多能力用于构建AI Agent,未来个人和公司都会构建自己的Agent并竞争协作,如Minimal AI和EvoMap。但Meta安全研究员Summer Yue用OpenClaw整理邮箱时,因上下文压缩机制移除关键指令,致邮件被误删。后续讨论表明这是新手错误,提示词不能作硬防护,关键约束应写进系统架构。此外,ClawHub市场存在大量恶意Skill,可让攻击者获机器控制权。作者提醒大家使用Agent时重视安全防护,建立安全共识。

也许你需要一个管理 Agent Skills 的可视化 App
作者用Claude Code开发SkillDeck管理AI Agent Skills
作者在使用多个AI coding agent时,发现Skills管理麻烦,缺乏统一可视化管理,于是用Claude Code开发了macOS原生桌面应用SkillDeck。它有统一仪表盘、Skills市场浏览、安装与更新等核心功能,支持对多个Agent的Skills进行全生命周期管理。开发全程使用Claude Code,降低了跨语言开发门槛。作者还分享了AI Coding的实用tips,如每个功能新开context、保存大量token总结内容等。项目已开源,采用MIT协议。

Nano Banana 2发布,成本砍半了!要塞入Google的所有产品里
Google发布Nano Banana 2,将成全线产品默认图像模型
2月26日,Google发布图像生成模型Nano Banana 2。它是Nano Banana系列第三款,结合Pro级能力与Flash级速度。其具备联网搜索增强世界知识、文字渲染与图内翻译、主体一致性等优势,分辨率与格式覆盖范围广,还可配置思考深度。评测显示它性价比高。Google将其作为全线产品默认图像生成引擎,降低API成本。当前图像生成赛道竞品众多,Google以低成本提供“足够好”质量,靠分发网络取胜,目标是让十亿级用户不知不觉用AI图像生成。

千问开始做AI硬件,阿里的闭环活了
阿里宣布千问进军AI硬件,有望形成完整闭环
2026年2月27日,阿里宣布千问进军AI硬件,首款千问AI眼镜将在巴塞罗那MWC发布,年内还会推出AI指环、AI耳机。AI硬件是热门赛道,大家都在抢新用户入口。阿里有完整生活服务和交易体系,千问APP已跑通“一句话下单”。阿里业务在互联网流量分层中处底层,其做AI硬件是抢新流量入口。AI硬件可覆盖用户生活场景,无迁移成本,能提前捕捉需求。此外,硬件可打破千问“能办事”能力的天花板,形成感知、理解到行动的完整闭环,让阿里闭环“活”起来。

OpenClaw深度分析:为什么突然就火了,以及对我们意味着什么
作者分析OpenClaw爆火原因并给出改进使用建议
文章深度分析OpenClaw爆火原因、利弊及应对策略。它于2026年1月底爆火,像DeepSeek一样把小众能力推广给更大用户群。其选用聊天软件做交互入口,降低心智和学习成本,但存在线性、低信息密度等局限。它有统一入口和上下文、持久化记忆、丰富Skills等设计,相互促进形成飞轮。不过,它存在记忆难管理、信息干扰、Skills有安全隐患等问题。作者建议复用开源工具搭建更顺手的系统,如用OpenCode做基础,解决记忆和安全问题,还开发iOS App做入口。

证据驱动视觉感知,BiPS重塑VLM看图方式
微软亚洲研究院与清华提出BiPS重塑VLM看图方式
视觉 - 语言模型(VLM)推理能力增强,但存在“看错”问题。现有推理阶段提示方法有局限,微软亚洲研究院与清华提出BiPS解决该问题。它在训练阶段教会模型“带着问题去看图”,通过“一拉一推”机制,构建证据保留和证据消融视图,重塑模型看图方式。以图表为训练场景,用13K样本微调,在8个基准评测中显著提升性能,实现能力迁移,是迈向通用视觉智能关键一步。

Dify 官方上架 Higress 插件,轻松接入 AI 网关访问模型服务
Dify 官方上架 Higress 插件,助力接入 AI 网关
2026 年 2 月 26 日,Dify 官方上架 Higress 插件,以解决 Dify 应用构建中模型接入的问题。开发者用 Dify 构建 AI 应用时,面临多模型管理复杂、缺乏统一治理、细粒度鉴权需求等难题。此前方案存在局限,因此推出专用模型插件。该插件上架 Dify 插件市场,让二者简易联动,适用于开源自建与商业版。插件支持多种场景、协议及鉴权方式,有丰富配置和治理能力。文章还给出两个 Demo 场景实践指南,最后表示插件将在多方面持续迭代,代码已开源。

揭秘 Claude Code 前沿技巧与 Qoder CLI 日常开发实战
阿里云开发者揭秘Claude Code技巧与Qoder CLI开发实战
本文围绕Claude Code前沿技巧与Qoder CLI日常开发实战展开。首先剖析Claude Code核心能力,介绍Command、Subagent、Skills和Hooks等技术概念和使用方法,对比Cursor Rules体现Claude Code优势,其具备高度可扩展架构。接着介绍Anthropic发布的三个beta特性,优化工具调用逻辑。然后探讨Claude Code对“效率”提升的思考,回归Agent本质,加速迭代效率。最后介绍Qoder CLI的最佳实践,包括Vibe Coding、Quest Mode、Code Review等多种场景,还支持ACP协议,可用于环境部署和运维、日志分析等。

一件大事正在发生
AI创业者发文警示AI冲击,给出应对路线图
2026年2月10日,AI创业者马特·舒默在X平台发文,将AI冲击比作‘疫情级颠覆’,引发全球关注。近年来AI发展迅速,如2022 - 2026年能力显著提升。2月5日OpenAI和Anthropic发布新模型,AI在编程等工作中表现出色,甚至能做出明智决策。此外,AI开始参与自身构建,引发‘智能爆炸’。专家预测,1 - 5年内AI将使大量初级白领工作受冲击,多数知识型工作也受影响。作者建议人们抢先使用最佳模型、将其用于实际工作、理清财务、向难被取代领域倾斜等;同时指出AI虽带来威胁,但也降低了创作门槛,人们应养成适应变化的习惯。

具身智能年度回望:泡沫与现实的激烈碰撞
2025年具身智能发展回顾及2026年商业兑现展望
文章回顾2025年具身智能发展,虽从实验室向产业化迈进取得进展,但挑战仍严峻。资本上,一级市场资金集聚且结构分化,产业资本比重上升,资源分配不均,投资风控转向“看交付能力”。产业端供应链有爆发力,出货量增加,但供需错配,产品工程化可靠性不足。技术上,认知能力超前、执行能力滞后,VLA大模型有突破也有痛点,运控层有进展但物理执行仍面临挑战,行业从世界模型和标准化两方向发力解决问题。2026年行业进入商业兑现阶段,成本效益分析是关键,特定场景RaaS模式或爆发,区域格局资源向珠三角、长三角集中,资本投资将洗牌。

YC最新对谈:Agent economy真的要来了!
YC对谈探讨AI Agent经济到来及相关影响
文章基于YC最新对谈,探讨AI Agent经济到来的现状与影响。非技术背景者也使用AI agent工作,软件开发客户或不再是人类。AI agent从辅助工具变为自主决策者,带来全新经济体系。数据库因agent自主选择而爆炸式增长,凸显文档对agent选择产品的重要性。Resend等案例说明要构建agent友好型文档。还提到Agent Mail等基础设施兴起,探讨AI发展路径可能是群体智能。最后思考agent经济与人类经济并行的关系及规则设计,强调人类要成为agent引导者等。

胡延平:人的重建,从不仰望AI开始
胡延平在腾讯创新节演讲,强调AI发展应以人为本
2026年1月27日,腾讯科技向善创新节2026举办,胡延平围绕《真正的重建从不仰望AI开始》演讲。他回顾2024 - 2025年笔记,指出人工智能浪潮下,最大问题是人的安放、经济可持续及社会问题,原有研究范式难以解答。他分析人类“四个恍惚”成因,构建“科技思潮的社会光谱”,用Claude评价50多种思潮,认为激进思潮未必利于人类。还构建“人智关系DNA螺旋”图,指出进入“双智世界”,人工智能可使人和劳动“第五次解耦”。最后邀请大家参与四方面研究,强调人工智能发展应以人为本。

除了代码和客服,AI agent下一个爆发的场景会在哪?
深思圈探讨AI agent在销售、金融等领域的应用前景
文章围绕AI agent除代码和客服外的爆发场景展开。Anthropic报告显示软件工程AI agent部署占比高,销售、金融等领域低。原因在于编程和客服数据易获取、反馈机制成熟。销售和金融领域数据分散、集成难、反馈循环长。不过,当前CRM和ERP供应商正开放数据和构建框架,Gartner预测到2026年底企业应用集成AI agent比例大幅上升。SaaStr的AI agent已带来实际业务成果,如自主完成交易。作者认为应把握时机,不同规模公司各有优劣,还会催生新职业技能需求。

大模型会吃掉平台吗?一场关于marketplace生死存亡的深度思考
作者基于分析探讨LLM对marketplace的冲击与平台应对
文章围绕大语言模型(LLM)对市场平台(marketplace)的冲击展开探讨。先是介绍“DoorDash问题”,即LLM介入或使平台失去重复交易和变现机会。接着指出决定平台命运的三个因素,包括供应聚合难度、管理程度和客户参与性质。不同行业受影响程度不同,酒店、本地服务平台前景差,房屋租赁、电商有风险,食品配送和打车平台较安全。Dan提出四个应对策略,如做LLM不做的事、原生构建AI搜索等。作者认为这反映互联网商业模式从“平台为中心”转向“用户意图为中心”,并对未来3 - 5年市场平台行业变化做出预测。

在AI能回答一切的时代,人类核心的竞争力是什么?
李开复探讨AI时代人类核心竞争力及教育方向
文章以AI时代人类核心竞争力为主题。作者用AI画八骏图开启话题,借95后询问学AI是否太晚,指出AI 2.0时代顶尖能力是定义问题。接着提到告别“后视镜驱动”产品观,如今AI成自主智能体,不能用旧方式使用。还提出教育应推行Open Agent,让学生与AI协同,评分重路径。强调技术使答案易获取而贬值,人的价值在于提出AI想不到的问题,呼吁关注人的成长。

打破“人机次元壁”,CIO在变革中重塑组织团队
Gartner发布报告,分析师建议CIO借AI重塑组织团队
2026年是AI从‘值得关注’走向‘必须深耕’之年。Gartner发布报告,高级首席分析师雷丝解读称,人机协同进化成必然,提升员工AI素养很重要。打破‘人机次元壁’,CIO制定AI战略要贯穿‘人本价值’理念。超半数企业已在生产场景落地数字员工,改写职场规则。雷丝指出,CIO要从组织社会学角度设计人机情感与信任机制。Gartner强调‘融合团队’和微型团队,还给出‘AI组织架构图’。雷丝建议CIO快速转变角色,加快AI应用落地,提升软实力,驾驭AI协作的个人与企业将占得先机。

吴恩达来信:人工智能将如何创造就业机会
吴恩达探讨人工智能创造就业机会及美好前景
吴恩达在信中探讨人工智能创造就业机会问题。以给女儿设计蛋糕为例,说明人工智能能为烘焙师创造工作机会。虽有人担心其取代人类工作,但目前处于创造新就业的早期,历史上释放创造力的工具带来大量新工作。人工智能提升数字服务需求,增加相关工作机会,如“Agentic Reviewer”系统增加搜索量。其与软件演进加速,开发者生产力提升,但定制软件需求无上限,开发人员会大增,还出现“X 工程师”新职位。他坚信人工智能会让生活更美好。

AI 会造新财富,谁会更值钱?|卡耐基梅隆教授
卡耐基梅隆教授罗博深谈AI时代什么样的人更值钱
2026年2月22日,卡耐基梅隆大学教授罗博深接受采访,指出AI会创造新财富,值钱标准改变。AI打破地域限制,让过去被忽视的人有机会被看见,带来社会阶层流动新通道。他还提到,在自动化时代,人类价值标尺转向能否被信任,企业选人标准将改变,人类角色从‘执行者’变‘守护者’。此外,单纯可靠还不够,能独立思考、将复杂问题说清楚的人更值钱,AI负责执行,人类负责思考和判断。

硅谷亿万富翁投资人的30年商业经验复盘
投资人Chamath分享30年商业经验及职业建议
文章复盘了Facebook早期高管、投资人Chamath 30年商业经验。他指出目标可能阻碍成功,应注重过程,给出三个边界条件:无债务、用谦逊管理生活、与年轻人相处。他认为追求的晋升、头衔等目标很“愚蠢”,会让人失去自我。还强调保持选择性,在关系中要完全诚实。对年轻人建议去主舞台发展,不为薪酬优化。此外,通过老鼠实验说明希望能激发潜力,地位是陷阱,应摆脱其束缚。作者表示这些观点挑战了固有认知,让人重新思考成功定义。
