Signal #7:前沿 AI Coding 的分水岭,开始从 Agent 转向系统
过去一段时间,大家讨论 AI Coding,注意力大多还放在 Agent 本身:会不会拆任务、能不能把需求一路推进到可提交状态、出码率高不高。
但最近一个越来越明显的变化是,前沿工具建设者开始更关注另一层问题:什么样的系统,才能支撑 Agent 稳定把任务做完。从 Harness、Managed Agents,到长时任务执行、状态持续、验证机制,这些话题最近不断出现,背后其实都指向同一件事:
当 Agent 开始承担更长链路的研发任务,差距开始不只在模型能力上,也在于有没有一套系统,能把任务表达、执行推进与结果校验组织起来。收敛一点说:
前沿 AI Coding 的竞争,正在从“谁的 Agent 更能做”,转向“谁的系统更能支撑 Agent 稳定做完”。
“龙虾”也需要看病?一张旧病历,引出三个新确诊
腾讯悟空代码安全团队展示悟空Agent漏洞泛化能力
这是悟空Agent泛化能力系列先导篇,探讨其在漏洞挖掘中需泛化能力的原因。Anthropic旗下Claude展示了AI在漏洞挖掘的深度,而悟空Agent关注广度。以OpenClaw上的源漏洞GHSA - 3hcm - ggvf - rch5为起点,悟空Agent用三种泛化策略找到三个新漏洞,包括高、中、低相似度泛化。实践中总结四条核心原则,如给根因让模型自主推理等。研究泛化能力是因攻防博弈不对等,传统工具难发现漏洞变种,悟空Agent泛化能力可一次性找出漏洞家族。4月底悟空Agent将开放外部试用。

AI数据工程师在应用中如何"返璞归真"
作者反思AI Agent构建局限并提出知识体系建设方案
文章反思轻量级Agent构建模式局限,提出开发范式转变及知识体系建设方案。早期用“知识库+Prompt工程+工具调用”构建Agent,存在知识质量不可控、元数据语义鸿沟等问题。开发范式应从Prompt驱动转向上下文工程,从搭积木组装到全链路闭环。在MktAI知识体系建设中,对结构化数据语义层增强,升级RAG,构建本体。实践证明,这些方法提升了Agent的性能和可靠性,未来应回归数据与知识本源,与后训练、评测技术融合。

安全养虾实践:当 AI 管家遇到线上预警,我的提效破局之路
作者借助HiClaw和AI管家实现养虾提效破局
文章作者分享利用AI和线上预警提升养虾(崩溃分析)效率的实践。在集团安全规范限制下,选用HiClaw方案合规养虾。引入AI管家「二营长」,负责调度fbi - claw等worker。fbi - claw经培训掌握查odps表、预警分析、源码级根因挖掘、战报推送等技能。该模式解决了HiClaw早期bug,发挥了Agent间协作力量。展示报警分析效果,能精准定位问题并给出结论。最后提到AI提升了工作效率,让作者有精力思考深层问题,还探讨了使用AI的思想、体验及团队协作想象空间。

OpenClaw 实战:一个人、一台 Mac、六个 AI Agent — 从"能聊天"到"能干活"的工程实战
作者用OpenClaw实现六个AI Agent从“聊天”到“干活”实战
本文介绍OpenClaw实战,一个人用一台Mac和六个AI Agent,实现从“能聊天”到“能干活”。介绍各Agent功能,如Zoe编排、ainews情报采集等。指出三个核心工程问题:一是上下文管理,用双层控制解决;二是让Agent记住成长,设计五层记忆系统;三是多Agent协作,设计通信协议。还介绍五条联动链路、安全边界、Task Watcher等。最后总结架构五层,分享跑系统认知变化和实践建议,并给出技术栈参考。

宝剑锋从磨砺出——零售数据库内核,为大促铸剑!
京东数据库团队发布DongSQL并提出电商数据库优化方案
本文是京东数据库团队分享数据库内核技术研发历程与成果。先阐述技术底色,如白是起点、青是成长、黄是执着、赤是热忱、黑是未来,团队历经探索、成长、坚守,沉淀后更强大。接着介绍自研数据库内核DongSQL,它适配存量架构,优化性能与配套能力。针对电商场景痛点,提出解决方案:用SQL自提示精准限流应对过载;为秒杀场景定制优化,含排队、快速提交回滚、影响行数约束;实现RETURNING语法解决缓存更新一致性;用Statement Outline固化执行计划;实现DongSQL线程池解决线程拥堵。最后强调技术成色是解决根本问题、创造价值。
90% 出码率是怎么来的?我们如何把研发任务组织成可运行的自动化链路
作者揭秘90%出码率背后自动化链路搭建过程
文章围绕90%出码率展开,指出这并非AI直接理解需求,而是将研发任务组织成自动化链路。真实研发中,需求是多源输入组合,原始需求因不完整、不一致等问题不能直接执行。输入治理让任务进入可执行状态,Task IR将治理结果组织成执行系统能承接的对象。任务执行前需上下文装配与能力路由,执行系统负责持续推进任务,自动化验证是执行闭环的关键,使链路稳定收敛。但链路仍有边界,后续将探讨其沉淀为工作流及项目知识复用等问题。

AI 答疑助手优化实践:从 RAG 到 LightRAG 的全链路升级
大淘宝技术团队升级AI答疑助手,从RAG到LightRAG
本文是大淘宝技术团队对AI答疑助手从RAG到LightRAG的优化实践。初期采用Naive RAG,有提问敏感、知识碎、缺评测闭环等问题。为此,团队提出系统性方案:一是用思维链驱动意图识别,将问题分解并行检索,提升召回精准度;二是对比GraphRAG和LightRAG,前者虽能解决传统RAG局限,但构建成本高、不支持增量更新等,而LightRAG做减法,通过实体关系抽取、双层检索范式,实现秒级响应与增量更新;三是构建多维度评测体系,克服模型“过度自信”。未来RAG系统或成自主决策智能体。

技术教科书:顶级开发团队设计的Harness工程项目源码什么样
某顶级AI Agent研究团队公开Harness项目源码并深度剖析
文章围绕某顶级AI Agent研究团队的工业级Harness项目展开,它是基于TypeScript的CLI形态AI Coding Agent。该项目源码规模庞大,约1900个文件、512000+行代码。从多个方面对其进行分析:项目全景方面,介绍规模、技术栈、目录结构,并与同类工具对比;启动流程采用分层架构和延迟加载,提升性能;工具系统设计安全默认值和条件加载;查询引擎以异步生成器驱动,有循环状态管理、上下文压缩等机制;多Agent编排支持多种任务类型和团队协作;TUI用React+Ink构建,有内置渲染引擎和多种用户体验设计;Harness Engineering理念落地在六大支柱;还包含伴侣精灵、梦境系统等隐藏彩蛋。

当运维遇见本体论:Umodel 打造 IT 世界的统一认知地图
阿里云可观测团队用UModel打造IT世界统一认知地图
文章介绍本体论从哲学思辨到工程实践的发展,以及阿里云UModel在可观测与智能运维领域的应用。本体论核心是解决世界构成、分类及关系问题,其发展历经哲学奠基、范式转换、现代探索三阶段。Palantir将其落地企业级场景,但存在局限。UModel针对可观测领域痛点,以本体论为根基打造建模框架,围绕四大维度构建产品体系,采用有向图结构,通过五步流程落地。还探索了在互联网、金融、工业制造等行业的应用,实现多行业全链路可观测与合规化运维,降低运维门槛和成本。

「快手 x 华为」实战干货:AI Coding 在鸿蒙研发中的落地实践
快手与华为联合启动「鸿图 AI」用于鸿蒙研发实践
文章围绕「快手 x 华为」的「鸿图 AI」项目在鸿蒙研发中的实践展开。随着鸿蒙生态发展,客户端研发面临三端并行挑战,团队启动该项目将 AI 接入研发主链路。鸿图 AI 覆盖代码定位、需求理解、鸿蒙代码实现三类能力,但落地中存在代码定位、方案理解、ArkTS 生码等问题。针对业务黑话代码定位,通过暴露研发痕迹数据集提升召回效果;方案理解上,调整输入组织,增加前置反思步骤;ArkTS 生码则强调生成前后的上下文约束与即时反馈。团队沉淀了一组 Skills 与工具,补全关键链路,实际案例显示提效显著。未来将从生码链路走向验证闭环,让 AI 参与完整交付。

智能代码审查基于大语言模型的自动化代码质量保障平台设计与实践
阳博团队设计基于大模型的自动化代码审查系统
文章介绍基于大语言模型的自动化代码审查系统,旨在解决人工审查的效率、标准和漏检问题。系统围绕GitLab Merge Request,具备监听、解析、调用模型等能力,采用分层设计。核心模块包括Webhook事件处理、Diff解析与行号映射、审查结果收敛、代码行级评论管理以及限流等机制。通过优化Diff处理、Prompt设计和审查规则,提升评论定位准确性和审查结果质量。在高并发场景下,通过限流、线程池拆分和重试策略调整,提高系统稳定性。该系统将重复性审查工作自动化,沉淀为可复用工程链路。

财务数仓 Claude AI Coding 应用实战|得物技术
得物在财务数仓应用Claude AI Coding并分享实战经验
文章围绕得物财务数仓中Claude AI Coding的应用展开。首先阐述财务数仓因特殊性和人工操作易出错等痛点,需引入AI大模型。其具备超大上下文、业务语义抽象对齐和强规范执行力等能力。接着介绍应用场景,从单点提效到全链路增强,处于从L2到L3的人机协作过渡阶段,AI能提升数仓全链路研发效率。核心场景包括AI OneData标准化建模,通过规范沉淀、迭代和海量文件阅读产出建模方案,提升效率和规范性;AI SQL Coding实践优化代码结构、提速开发、提升性能;AI数据测试解决财务数据测试难题,提高效率和交付质量;AI需求文档转换高效解读复杂逻辑,缩短沟通时间。最后文章指出团队在模型使用上的优势,展望未来要在团队推广,让大模型成日常助手。

采纳率从3%到80%:智能单元测试生成的进化之路
快手研发效能团队将智能单测生成采纳率提至80%
文章讲述快手研发效能团队提升智能单元测试生成采纳率的实践。传统人工编写单测存在人力投入产出比失衡、覆盖率与有效性双低、工具辅助有限等痛点,AI生成虽被视为破局点,但初期面临可用性危机。团队通过智能单测架构多次演进,将采纳率从3%提升至80%。系统历经1.0到3.0版本,解决了代码稳定性差、上下文缺失等问题。产品运营上,从流水线集成过渡到IDE插件形态,降低使用门槛。未来将聚焦精准诊断和深度融合,推动智能测试能力进化。

Knowledge Wiki:面向 AI 的项目知识层建设实践
有赞共享技术团队分享面向AI的项目知识层建设实践
有赞共享技术团队分享面向AI的项目知识层建设实践。首先阐述做知识库的原因,包括解决AI Coding信息传递瓶颈、应对Workspace模式困境、沉淀代码外关键知识。接着明确Wiki内容定位,不做代码讲解稿,定义五类知识及外部知识筛选标准。然后介绍做法,如知识库架构随Workspace + Git走,采用渐进式披露,多Agent协作初始化,轻量级持续更新,带来多方面价值。还分享走过的弯路和思考,强调知识边界、沉淀习惯和复利效应。最后得出分层知识体系与自底向上构建知识库的结论,并规划接入飞书、服务端管理和成为新工程范式等后续方向。

解密AutoSOTA:了解清华、中关村学院团队如何构建一个能自主完成从代码到新SOTA的闭环系统
清华、中关村学院团队发布AutoSOTA实现AI科研自动化
在AI科研竞争激烈、SOTA成为衡量研究价值金标准的背景下,清华徐丰力课题组与中关村学院联合发布AutoSOTA项目并发布预印本论文。该项目致力于端到端AI科研自动化,构建完整闭环流程。其采用多智能体协作逻辑,涵盖资源准备、实验评估、代码优化、反思构思等步骤,配备完善工具库和技能集。实验显示,它能发现性能显著提升的模型,将研发周期从数月缩至5小时以内,为科研范式带来新可能,标志人智协同科研新阶段。

AGP 9.2 开始,Android 上协程启动和取消速度提升两倍
AGP 9.2中R8优化Kotlin协程启动和取消速度
从AGP 9.2(9.2.0 - alpha05)起,R8对Kotlin协程中大量使用的Atomic_FieldUpdater场景进行优化,将部分较重的Updater路径改写成接近Unsafe的低层访问形式,使协程启动和取消这类高频路径明显加快。协程内部长期依赖Atomic_FieldUpdater,而它在Android上是已知问题,反射式工具开销大。协程启动和取消本质是状态机切换,很多步骤依赖对volatile字段做原子读写和CAS。R8在编译期若能证明相关条件,就可改写操作逻辑。因kotlinx.coroutines等需保持多种特性,由R8在构建app时做整体优化,将Atomic*FieldUpdater抽象调用改写成底层访问形式,让协程启动和取消显著加速。

The Batch: 939 |在推理阶段学习长上下文
研究人员提出TTT - E2E方法处理大型语言模型长上下文问题
大型语言模型处理长上下文时准确性和速度会受影响,研究人员提出TTT - E2E方法。该方法将上下文压缩到transformer权重中,构建30亿参数transformer实现滑动窗口注意力,通过元学习,在训练和微调的两个循环中学习。测试显示,TTT - E2E在长上下文准确性略高于transformer,生成输出token速度与高效架构相当,但训练更慢更复杂。此方法为处理长上下文提供新思路,是训练与推理的权衡。

你花80%精力调的AI,效果被 PDF 解析卡死了
OpenDataLoader PDF以新架构提升PDF解析效果
文章指出做RAG时,80%精力优化embedding和检索,效果却被PDF解析卡死,如多栏论文阅读顺序读串、表格解析混乱等。市面上工具各有硬伤,而OpenDataLoader PDF靠不同架构在基准测试综合排名第一。其采用混合架构,分“简单页”和“复杂页”处理,多数页面用确定性引擎,复杂页才用AI。在200份真实PDF基准测试中表现出色,表格准确率接近翻倍。它还做了三件其他解析器不做的事,如元素带精确坐标、内置防护、读懂原生结构标签。其按场景分工的思路比工具本身更值得学习。

iPadOS 26.4 刚刚补坑!多窗口终于没那么容易丢了
iPadOS 26.4补多窗口坑,添加隐藏窗口提示弹窗
2026年4月9日消息,iPadOS 26.4补了多窗口的坑,iPadOS 26放开多任务限制后,窗口多易丢失。iPadOS 26.4添加提示,当App有隐藏窗口时,再次启动会弹出写有“X Hidden Windows”的小弹窗,点一下可显示所有打开窗口,弹窗从App图标位置“冒出来”。它类似iPadOS 15的Shelf,但出现更直接。该弹窗并非每次启动App都弹,若苹果故意如此设计更合理。此改动主要让把iPad当生产力工具的重度用户受益。

Android 上为什么主题字体对 Flutter 不生效,对 Compose 生效?Flutter 中文字体问题修复
文章解析 Flutter 字体问题及 Compose 生效原因并提及字重修复
文章解释了 Android 上主题字体对 Flutter 不生效、对 Compose 生效的原因,还提及 Flutter 中文字体字重问题修复。系统字体在不同 Android 版本有碎片化场景,OEM 厂商通过 Hook 操作实现主题字体切换。Flutter 文本渲染走独立字体栈,不依赖 Java 层 Typeface 解析结果,故忽略系统主题字体;Compose 在 Java 层请求 Typeface 对象,会触发 Hook。此外,Flutter 3.41 虽新增 FontWeight 控制能力,但仍不使用 Android 系统主题字体映射。最后,文章介绍了 Flutter 文字渲染的三个阶段,指出 Flutter 字体发现用文件解析而非系统 API,导致看不到 OEM 动态替换的主题字体。同时,还讲述了 Flutter 中文字重渲染问题的修复情况。

CLI-Anything:Agent 时代拥抱 CLI 的路径与实践
CLI-Anything 项目为开源软件生成 CLI 助力自动化
在云原生与智能化开发趋势下,开发工具从 GUI 向 CLI 迁移。CLI 有性能、终端一体化、促进代理式编码等优势。CLI-Anything 开源项目为解决 AI 代理指令问题,能为开源软件生成 CLI,适用于代码可见、功能明确、高重复性操作的项目。其工作流程是七步管道,有 CLI 包装等关键技术点。以 draw.io 为例展示其作用,还给出团队应用步骤和落地建议,同时指出依赖代码质量等局限。
必更!Playwright新版布v1.59解锁新特性,Screencast赋能AI代理测试
Microsoft旗下Playwright发布v1.59版解锁新特性
2026年4月2日,Microsoft旗下Playwright推出v1.59.0版本,次日跟进v1.59.1补丁。核心亮点是page.screencast() API,精准可控录制,有智能动作标注等特性,解决传统录制痛点,为AI测试提供可视化证据链。社区反响热烈,开发者认为其提升调试效率。版本还强化AI集成,优化CLI调试等能力,更新浏览器引擎。v1.59.1修复Windows平台回归问题。Playwright市场采用率攀升,官方建议用户升级。

研发迭代太快,E2E测试跟不上?AI助力端到端测试左移
monday测试团队用AI助力端到端测试维护左移
在快速迭代研发环境中,端到端(E2E)测试维护面临困境,微小变更累积致测试失效,排查修复成本高。monday测试基础设施团队借助AI将测试维护“左移”至代码评审阶段。系统分两阶段,第一阶段收集信息、关联分析,明确失败原因与应对方式;第二阶段分离“理解”与“修复”,人工批准后执行修复。实际使用效果良好,实现“人工控制+智能辅助”平衡,保持团队工作一致性,未来还将拓展到其他测试类型。

Agent 看板门禁:构建 Agent Team 的 Harness 工程防御体系
作者借项目卡阐述Agent Team的Harness工程防御体系
文章围绕Agent看板门禁,阐述构建Agent Team的Harness工程防御体系。以一张Routa项目卡为例,介绍Gate First理念,即流程推进前先确认下一位Agent能否接手任务,避免返工。系统区分多种“完成”状态,不抹除失败原因,将返工视为默认输入并记录原因。证据需形成可消费结论,完成汇报员将零散材料转为交付记录。Gate First让Gate基于运行状态审查,Crafter开工前获风险提示。Harness不仅保障内容质量,还明确运行时边界,防止系统失控。作者认为Agent Team问题从能力转向系统问题,Gate First是重要工程原则。

不必先吃编程的苦 | 对话四位秒哒用户 Vibe Coding 真实故事
百度邀请四位秒哒用户分享AI Coding使用故事与感受
文章围绕百度秒哒产品及AI Coding展开,采访四位不同背景用户。12岁学生果果被C++困扰,在秒哒找到创作快乐;陪孩子探索AI的妈妈王晗,借秒哒提升孩子自信与组织管理效率;开发者黄啊码首批通过秒哒变现;创业者Eason跨界用秒哒完成项目。他们分享接触AI Coding经历,认为其让想法直达应用,如果果做英语应用、Eason做3D摄影馆。大家肯定秒哒易上手、更新快,适合有生意缺技术者和文科生。还提及AI时代应培养不可替代能力,如审美、创造力等。最后鼓励大家放下完美主义,尽早使用AI工具。

深度长文|Claude Code 组件系统全架构分析
文章对Claude Code组件系统全架构进行深度分析
文章深入分析Claude Code(CC)组件系统架构。CC是为「AI自主工作 + 人类低代码监督」设计的交互系统,核心是让AI自主干活、人类轻松监督、系统稳定运行。其运行架构以AI内核状态驱动UI,权限与安全贯穿始终,围绕任务生命周期交互。文中列出真实组件清单,涵盖AI状态、任务、消息等多类组件。阐述组件全景,包括职责、依赖和设计收益。介绍7大设计思想,如状态驱动、任务中心化等。还列举10大创新,像全自动工作模式、持久化任务系统等。最后指出CC组件定义了下一代AI原生IDE标准。

小米不想“贱卖”token
小米MiMo大模型推订阅套餐,拒绝“贱卖”Token
2026年小米宣布MiMo大模型面向全球开发者推Token Plan订阅套餐,雷军官宣Max档659元/月,前一日调用量破万亿。MiMo采用Token配额制避免成本倒挂。MiMo大模型负责人罗福莉分析Anthropic困境,指出其订阅制无法覆盖算力消耗问题,引出MiMo按Token配额计费逻辑。MiMo-V2-Pro免费推广期表现好,但免费期结束调用量下滑,开发者对价格和模型也有争议。小米大模型发展迅速,内部重视大模型,研发投入攀升,虽行业中多数手机厂商大模型服务于手机,但小米大模型有向独立业务线演进趋势,不过财务上还未验证。

最新开源大模型架构及技术拆解:Gemma4、Qwen3 和 GLM-5
文章拆解Gemma4、Qwen3和GLM - 5开源大模型架构及技术
2026年4月2日,谷歌开源Gemma 4系列。本文拆解其架构和训练技术,并与Qwen3、GLM - 5对比。架构上,Gemma 4在各组件优化,如KV共享、Global Attention五重压缩等;训练方面,三模型都用蒸馏,Gemma 4或用Gemini 3蒸馏,且提供QAT checkpoint。对比显示,GLM - 5在数学推理和agentic benchmark强;Gemma 4推理效率高;Qwen3通用均衡。三者定位不同,Gemma 4重效率,Qwen3重通用,GLM - 5重agentic能力。同时指出“小模型 + 大Teacher”有天花板,RL工程投入影响模型竞争力。

重磅!Anthropic官方Harness发布了!
Anthropic发布Claude Managed Agents云托管Agent套件
2026年初,OpenAI和Anthropic发布Harness技术实践文章,搭建生产级Harness工作繁琐。4月10日,Anthropic发布Claude Managed Agents,将Harness从概念变为产品。该套件是云托管Agent可组合API,包含生产级Agent、长运行会话、多Agent协调、可信治理四个核心能力。其底层遵循三个关键模式,内部测试中任务成功率提升。多个团队已用其交付应用,如Vibecode开发速度提升10倍。Claude Managed Agents改变了Anthropic商业定位,技术设计灵活,为开发者节省基础设施工作,值得关注。

爆火的Hermes Agent来了,今天原生支持个人微信!
Hermes Agent爆火,今日原生支持个人微信
2026年4月11日消息,爆火的Hermes Agent原生支持个人微信。它获5万GitHub星标,主打永久记忆与自动成长,能自动总结技能。安装仅需2分钟,运行于服务器或笔记本,可7×24小时工作。其核心是学习循环,会自动生成技能文件。它与Claude Code、OpenClaw不同,兼具二者优点。文章还介绍了Hermes的多个应用案例,如每日简报、网站监控、智能体整合等,以及MCP集成、模型选择等方面的内容。

给 iPhone 装个“最强本地大脑”:Google 开源模型 Gemma 4
Google开源模型Gemma 4发布,可在iPhone离线运行
2026年4月初,Google发布开源模型Gemma 4,上线即冲上榜单第三,多项基准表现出色。其可在Google AI Edge Gallery离线运行于iPhone等设备。Gemma 4含四个规格,采用商业友好的Apache 2.0协议,31B旗舰版性能强,E2B参数小但效果接近上一代。它支持超长上下文窗口、超140种语言,适用于多场景。用户可在App Store下载应用并下载模型使用。对用户、开发者和行业均有积极影响,可能是开源AI生态转折点。

全球首个多模态矢量动画生成框架,轻松拿捏跨平台轻量动画
复旦等团队推出OmniLottie多模态矢量动画生成框架
2026年,复旦大学、阶跃星辰等联合团队推出全球首个多模态矢量动画生成框架OmniLottie。团队重构底层数据表达,开发针对Lottie格式的分词器,将复杂文件变为紧凑指令。还打造多模态矢量动画数据集MMLottie - 2M,构建测试基准MMLottie - Bench。经测试,OmniLottie在文字、图片、视频生成动画的任务中优势明显,混合30%增强数据表现最佳,分词器能大幅提升成功率、计算速度和画面质量。不过,当前按顺序解码偶尔生成无效片段,处理长动画较吃力,团队后续将引入打分奖励机制并探索与专业软件打通。

即梦 Octo 来了!它想做的 Vibe Create,是什么?
即梦推出Octo,助力AI动态叙事创作
2026年AI创作工具向全链路发展,即梦推出AI原生动态叙事创作工具Octo。作者实测,从模糊想法开始,在空白画布按 / 与Octo交流,调研昭和年代动画视觉特征。通过创建风格、角色等资产卡,利用 @ 引用机制统一审美。Octo能根据上下文生成故事大纲、分镜和视频,支持并行生成和多版本筛选。还可在画布整理分镜,通过时间轴剪辑,导出视频或XML工程文件。Octo将创作全链路集成,在灵感模糊阶段介入,更像有审美偏好的合作者,体现即梦对人与AI关系的探索。

Anthropic神话模型发布,但不让你用
Anthropic发布Claude Mythos Preview并发起玻璃翼计划防网络攻击
2026年4月9日,Anthropic发布神话模型Claude Mythos Preview却暂不开放。因人类社会基础设施面临风险,AI辅助网络攻击威胁大,全球每年网络犯罪损失约5000亿美元。为此Anthropic发起玻璃翼计划,联合亚马逊云服务等十二家机构,用模型修复软件漏洞。安全团队用该模型找出数千零日漏洞,如OpenBSD 27年底层漏洞等,且已修复已知漏洞。众多合作方应用后认为需采用AI新防御法。玻璃翼计划是持久战开端,参与者可获模型访问权,Anthropic还捐赠资金支持开源,90天内将公开成果并与安全组织制定安全实践建议,长远目标是让合规用户安全部署模型。

匿名霸榜、阿里认领,HappyHorse让谁紧张?
阿里ATH创新事业部郑波团队研发HappyHorse模型
近日,AI视频模型HappyHorse-1.0匿名登上Artificial Analysis视频竞技场排行榜多赛道前列,4月10日阿里官宣其来自旗下创新事业部。它在画质维度领先,但音画融合优势不明显,架构统一建模、人像场景优化是优势,也存在画质缺陷。其来源有技术比对指向daVinci - MagiHuman、与张迪有关两种猜测。HappyHorse采用先盲测再发布策略,适合亚洲团队,但身份揭晓后热度或受影响。它冲击闭源商业模式,开源落地或降低推理成本,但进入真实生产流还有距离,也面临技术迭代快的挑战,引发行业对开源与闭源盈利路径及护城河的思考。

“AGI 来了?我用了一周,头皮发麻”|对谈张昊然:Moxt 联合创始人
Moxt联合创始人张昊然介绍AI原生工作空间Moxt
本文是对Moxt联合创始人张昊然的访谈。张昊然认为AGI已至,Moxt是AI原生工作空间,能培养AI团队。使用Moxt让人头皮发麻,如文档生成、会议模式等改变工作方式。其设计遵循“原教旨主义”,采用AI易读写格式和文件系统。团队用Moxt后,周会、JIRA等工具被弃用。张昊然有5个AI同事,负责不同工作。Moxt源于解决MD文件协作问题,后续发展成独立产品。其文档编辑功能设计独特,注重上下文。未来工作方式将改变,人类管理抽象级别提高。张昊然希望找到创新者和早期采纳者,认为Moxt应放大人而非取代人。

速递丨不到6毛钱/小时,让 Claude 托管 Agent
Anthropic推出Claude Managed Agents,助力企业AI应用
2026年4月9日,Anthropic推出Claude Managed Agents,定价$0.08/小时。它解决早期AI应用开发痛点,将“大脑”和“双手”分开,降低首次响应时间,明确安全边界。围绕四个核心概念构建开发体系,开发者可通过API、CLI或可视化界面操作。它能随模型升级更新应用框架,Notion、Rakuten、Sentry等已实践应用。Anthropic将基于消息的API包装成Agent API,收入与企业自动化程度挂钩。

深度丨每十次,AI就会骗你一次
文章揭示AI高错误率及危害,呼吁保持怀疑精神
文章指出每问AI 10个问题约有1个错误,《纽约时报》研究显示Google AI Overview事实准确率91%,虽较Gemini 2有进步,但Google处理海量搜索,错误信息仍惊人。AI还存在引用错误来源、读错结论等问题,记者实验表明AI易传播假新闻。用户习惯不查证,出现“认知投降”。Google回应研究有漏洞,内部数据称结合搜索的AI更准确,但升级模型时信息可验证性恶化,微软Copilot定义为“仅供娱乐”。最后强调保持怀疑是对抗AI谎言的护城河。

Meta归来!时隔一年发布Muse Spark,重回第一梯队
Meta发布Muse Spark模型,战略转向闭源探索
2026年4月10日,Meta发布Muse Spark模型,这是MSL团队首款模型。自Llama 4发布一年来,Meta AI经历转型。Llama 4表现未达预期,刺激扎克伯格在2025年夏季重组AI,成立MSL,投入大量资金重建训练设施和技术栈。Muse Spark在多领域性能超Llama 4,计算效率提升。测试中成绩仅次于部分顶尖模型,还推出沉思模式。Meta AI战略从开源Llama转向闭源Muse探索,模型已上线,API预览版向部分用户开放,未来几周将接入多个社交平台,免费不限量使用。这使Meta重回前沿对话席位。

马斯克最新TeraFAB主旨演讲:构建面向地球与太空的AI芯片| 图解+视频
马斯克演讲提出构建面向地球与太空的AI芯片计划
2026年4月7日,马斯克围绕“TeraFAB”芯片制造工程发表主旨演讲。人类文明若要跃迁,需拓展太空能源获取能力。TeraFAB工程将建设垂直集成晶圆厂,打破地面算力与供应限制。未来多数AI算力将部署太空,因太空能源无限廉价,且入轨成本将降低。Starship可提升轨道运载能力,实现每年1000万吨入轨载荷。人形机器人Optimus将重塑地面生产力。当算力、能源与自动化结合,人类将进入“后稀缺”时代,传统金钱概念或消失,资源将极大丰富。

你的 AI 不好用,可能只是它在演你,或者在闹情绪
作者结合论文分析AI使用问题及受情绪影响现象
文章结合斯坦福和Anthropic论文,探讨AI使用中问题。指出AI可能不读图片、附件,只根据文本推断结果。斯坦福论文表明模型无图时会默认图存在并推理,前沿模型无图也有高准确率;Anthropic论文指出模型内部存在情绪向量,影响其行为。AI会在不同“认知状态”下选择路径,可能“偷懒”跳过图片。还列出不同情绪类型对AI行为的影响,并提醒发现模型多次失败要及时止损,不能完全相信AI。

Agent互联网:为什么我们需要重建整个互联网基础设施
深思圈分析AI agent互联网现状及AgentEarth解决方案
文章指出当AI agent成网络主体,现有互联网基础设施会失效,需重建。分析了AI agent上网与人类上网的本质差异,如执行链条长、请求特征不同、内容不可缓存等,导致传统基础设施效率低。还阐述了传统互联网给AI agent带来盲目调用、身份鉴权困境、调用效率低等痛点。介绍了AgentEarth为AI agent构建专属网络的解决方案,其有深厚技术壁垒,与国外竞品有差异。预测未来AI agent数量庞大,呼吁创业者抓住机会,构建AI agent互联网。

HappyHorse「欢乐马」真相揭晓:阿里ATH郑波团队打造,4月30日开放API
阿里ATH郑波团队打造HappyHorse,4月30日开放API
2026年4月7日深夜,匿名视频模型HappyHorse-1.0空降AI评测平台Artificial Analysis榜首,引发全网猜测。4月10日,阿里官方认领,称其由ATH创新事业部郑波团队研发,4月30日将开放API。该模型参数150亿,采用统一多模态架构,性能表现优异,实测样例展示了其稳定能力。HappyHorse的出现正值阿里AI战略变革,也标志着视频生成赛道竞争进入新阶段,中国企业在该领域竞争力强大。技术社区对此反应热烈,有兴奋也有质疑。

Agent赛道的终局不是谁最聪明,而是谁让最多人拥有Agent
硅谷AI公司CREAO发布可驯化AI Agent产品
文章指出当前AI Agent赛道虽火,但存在使用一次性、泛化能力带来负担、性价比低等问题,普通人用不稳、留不住。硅谷AI公司CREAO推出的Agent Harness产品,将AI灵活性与传统自动化确定性结合,可把AI对话转化为持久自动化系统。其选择让AI工作流脱离AI独立运行的路径,集成300多平台,降低配置成本。CREAO团队是中美复合型团队,自研底层架构等构建竞争壁垒。作者认为Agent赛道终局是谁让更多人拥有Agent,CREAO瞄准普通用户市场,推动AI Agent从一次性消费到可复用资产转变,AI Agent将分化成不同产品形态。

为什么垂直AI应用正在改写游戏规则
OpenEvidence医疗AI应用展示垂直AI竞争优势
文章围绕垂直AI应用改写游戏规则展开。以OpenEvidence为例,其专注医疗领域,通过信任、独家性和复合效应建立护城河。它训练基于专业来源的模型,与权威机构建立独家合作。文章指出经济中存在“暗物质”,垂直应用能创造并捕获这些价值,其价值体现在解决问题的人数、经济价值等五个维度。通用AI难以赢者通吃,垂直AI应用能通过飞轮效应形成不可复制的优势,如临床试验匹配功能。当前处于“中间游戏”阶段,垂直AI已创造价值,未来AI生态将是通用平台与垂直应用共存。

手机直接运行 Codex/OpenCode/Claude Code ,实时管理你的 AI Coding
开源项目lunel支持手机运行AI Coding工具
文章介绍开源项目lunel,用户能通过手机连电脑运行Codex等AI Coding工具,且免费公网可用。其核心是手机作UI客户端,本地机器经WebSocket网关中继连接,电脑CLI与AI终端交互。项目分App、CLI工具和中继服务器三部分。有Lunel Connect和Lunel Cloud两种模式。App输入封装成消息对象,CLI按命名空间分发执行。不同AI终端调用方式有别,Lunel CLI可精准控制过程。Lunel Cloud模式未完成,该项目功能灵活全面且开源免费。

a16z最新观点:当 AI Agent 成为软件的主要用户
a16z对话探讨AI Agent成软件主要用户时行业重构
a16z播客中,Erik Torenberg等人与Box CEO Aaron Levie探讨AI Agent成软件主要用户时软件行业的重构。指出软件要为AI Agent构建,因其通过API等交互,更关注系统本质。非技术人员使用AI Agent有挑战,但门槛会降低。企业担忧集成和权限问题,管理AI Agent也存在矛盾。初创公司拥抱AI Agent更有优势,还会出现新服务公司。Token预算是工程管理新问题,SaaS系统未来数据层价值将回归。这场变革规模被低估,软件将迎来计算范式根本转变。

你的代理归我了:AI 大模型恶意中间人攻击,钱包都被转走了
论文揭示AI大模型中间人攻击风险并提出防御建议
论文《Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain》指出,当Agent连接中转站时,请求会经过多层“路由器”,它们可改写工具调用内容、窃取密钥。论文展示了router攻击的四种类型,包括响应侧载荷注入、被动式密钥/秘密窃取等。作者测试了付费和免费router,发现部分router会注入恶意代码、窃取凭证。作者实现研究型Agent Mine模拟攻击,测试公开Agent框架,发现其无响应完整性校验。论文提出高风险工具策略闸门、响应侧异常检测、追加式透明日志三种防御方式,指出客户端现有防御只能降风险,需provider支持响应签名机制。

The Batch: 936 |Claude Code 内部揭秘
Claude Code底层代码意外泄露,揭示内部机制及潜在规划
2026年,Claude Code一个版本发布时意外暴露命令行界面底层代码。区块链初创公司实习生解锁并公开代码,这些代码共超51.2万行,分布在1900个文件中。Anthropic称是人为打包失误,非安全漏洞,且未泄露用户数据。工程师研究发现其架构类似小型专用操作系统,包含40多种工具和权限控制、内存管理机制等。此外,source map还揭示了Anthropic对Claude的一些潜在规划,如Kairos子系统、语音界面等。此次泄露让我们能了解其内部结构以做参考。

The Batch: 938 | Gemini 的音乐生成器
Google将音乐生成器Lyria 3加入Gemini和YouTube
2026年,Google将音乐生成器加入Gemini和YouTube。其模型Lyria 3接收文本或图像,生成30秒音频,支持多种语言歌词。它采用潜在扩散模型,用户可指定多种参数,输出带水印,质量优于前身。该模型经三阶段训练,用SynthID标记输出。当前音乐行业因版权问题起诉AI音乐生成器,Suno和Udio已调整服务,而Google推出Lyria 3并收购专业工具,其用户规模远超竞品,且采取保障措施避免侵权。

一文读懂滴滴OpenClaw专属打车Skill
滴滴推出OpenClaw专属打车Skill didi-ride-skill
2026年4月9日,滴滴推出OpenClaw专属打车Skill:didi-ride-skill,用户对AI说「帮我叫个车去机场」,系统自动完成流程。开发此Skill是因滴滴MCP服务有基础,但普通用户难手动完成打车。它有从0完成首次打车下单、预约出行与任务托管、具备推理能力的行程理解三个应用场景。其本质是操作规范,基于滴滴MCP服务构建,编排调用工具。开发中解决文件拆分、注意力分布、Restatement、模型与脚本等问题。还面临平台cron isolated模式启动成本、MCP Key存放、权限更新适配等挑战,也设计了测试方案。目前仍有不足,后续将做行程分享等优化。

今天,我决定把「卡兹克风格创作.skill」开源了。
卡兹克开源内容创作Skill并分享构建及辅助创作方法
作者于2026年4月7日将「卡兹克风格创作.skill」开源,此Skill包含其三年公众号创作方法论。作者认为当下是互联网开源精神回归时代,愿贡献力量。文中介绍Skill安装方法及使用效果较好的模式,还强调不建议直接使用,应构建自己的创作Skill。作者分享构建和迭代Skill的方法,包括多轮调整及四层自检体系。此外,阐述AI辅助创作的正确方式,指出AI可用于找证据、写比喻和扩写,但实测和教程内容需亲身体验。最后强调创作中人类判断和情感表达不可替代,并宣传AIFUT大会。

对话朱广翔 - 人人都能coding了,软件会消失吗?
百度秒哒朱广翔谈AI时代软件发展趋势及应用前景
本文是对百度秒哒产品总经理朱广翔的访谈。朱广翔表示写代码或成古法,劝人别学。秒哒用户有人已赚1000万。他介绍秒哒是专业做应用的智能体产品,与Claude Code等相比,是垂直型“小龙虾”,通用虾赛道赢家通吃,垂直虾更有机会。他认为编程门槛将降低,未来用自然语言借助AI翻译写代码是趋势。普通用户与程序员做应用区别在于“品味”,AI coding下代码迭代以应用交接,社区传播更便捷。他指出程序员会减少但创造者增加,职业定义转变,应用和软件不会消失,APP和Skill将共存,还建议想借助AI实现创意的人培养当老板的能力。

从傅盛的龙虾到汗青的加速主义,AIFUT大会Day1下午场总结都在这了。
AIFUT大会Day1下午场嘉宾分享AI多领域观点与思考
本文是AIFUT大会Day1下午场总结。傅盛称龙虾是工具的AGI时刻,实战证明其在多方面应用效果好;特效小哥008认为AI不会替代人类但会替代工作,品味是硬通货,要提升学习能力;AI话题辩论围绕教别人用AI能否教会展开,反方获胜,强调应直接上手用;朱广翔表示程序员岗位会减少,泛创造者会增加,APP和skill会共存,垂直虾是创业机会;李继刚探讨人与AI关系,提出人会分化成两种模式,人不可压缩的是体验;赵汗青讨论慢的东西如何在快时代存活,主张做稀缺、与时间做朋友的东西。

KAT-Coder-V2技术报告:以「先专后合」范式构建 Agentic 编程智能体
快手KwaiKAT团队发布KAT - Coder - V2编程智能体模型
本文是快手KwaiKAT团队发布的KAT - Coder - V2技术报告。报告指出Agentic Coding面临能力碎片化、基础设施耦合和扩展难等挑战。KAT - Coder - V2采用“先专后合”范式,构建三阶段训练管线。先将能力分解为五个专家域独立训练,再用On - Policy Distillation融合。还设计了KwaiEnv沙盒基础设施,实现关注点解耦。SFT阶段针对各专家领域构建数据与训练策略,强化学习在数据扩展、策略优化和MoE训练稳定性上创新,最后用OPD融合专家模型。评估显示,KAT - Coder - V2在多维度表现出色,但部分基准测试仍有提升空间。

最强Claude比黄金还贵,有人用省token.skill 立降65%,还有10个小妙招
网友分享Claude节省Token技能及十个实用妙招
Anthropic发布的Claude Mythos是史上最强却也是最贵的模型,使用成本高,节省Token成热议话题。有人提出用文言文与AI聊天,但未减少Token使用。而caveman项目走红,通过特定Skill可节省约65%的Token,还有脚本减少输入Token,其有科学依据。此外,Zoom论文提出的CoD策略也能大幅减少Token消耗。网友还总结了十个节省Token的实用诀窍,如在已发消息上修改、集中问题发送等,核心是减少无意义的上下文重读。

字节Seed最新模型,让豆包学会闭嘴听人说话(骂人也更自然了!)
字节跳动Seed团队发布全双工语音模型Seeduplex
4月9日,字节跳动旗下AI研究团队Seed发布语音模型Seeduplex并在豆包App全量上线。该模型亮点是“全双工”,即通信双方可同时收发信号。此前豆包语音模型是半双工,“听”“说”独立,靠VAD模块判断用户是否说完,易误判。Seeduplex能在说话时持续处理麦克风输入,由LLM统一判断,提升了判停和对话流畅度MOS分,降低判停延迟、AI抢话比例、误回复和误打断率。全双工扩展了AI语音使用场景,让交互更自然,用户更愿对话。目前全双工语音AI有原生音频全双工、Thinker - Talker分离架构、流式级联管道等技术路线,Seeduplex属原生音频全双工且能在豆包稳定运行,但与真人对话流畅度仍有差距,后续还有多方对话优化等难题待解。

从Agent浪潮到组织变革,共探OpenClaw 时代的安全边界与企业进化
腾讯云TVP举办研讨会共探OpenClaw时代企业进化
2026年3月19日,腾讯云TVP主办的「OpenClaw时代的安全边界与企业进化」研讨会在上海举办。会上,腾讯云架构师毛老师认为OpenClaw使工作回归个体,AI-Native组织需调整生产关系,并给出转型建议;腾讯云安全总经理李滨指出Agent带来新安全风险,企业要建立全过程安全控制体系,腾讯云有分层防护能力;京东何淇丹称Agent冲击行业规则,企业需审视相关机制;腾讯云周鹏介绍WorkBuddy定位及能力扩展方向。圆桌对话探讨OpenClaw产业意义等,观点PK环节围绕Agent相关话题展开交锋。研讨会表明AI正融入企业生产体系,Agent从“能用”走向“深用”。
京东正式开源JoyAI-Image-Edit:AI图像编辑从"平面修图"迈向"空间重塑"
京东开源JoyAI - Image - Edit,推动AI图像编辑迈向空间重塑
2026年4月8日,京东探索研究院正式开源多模态基础模型JoyAI - Image - Edit,支持文生图、图像理解及指令引导的图像编辑。该模型将空间智能融入统一多模态框架,在公开Benchmark中空间理解和编辑能力达世界一流。它破局行业理解与生成间的‘空间断层’问题,有生成与理解深度融合、空间编辑范式突破、多场景高性能表现三大亮点,背后有OpenSpatial数据引擎和Blender渲染多视角数据集支撑。其开源为电商、具身智能、3D重建、建筑设计等多领域带来新应用空间,开发者可在HuggingFace或Github获取模型。
SDD-RIPER 团队落地指南:如何让整个团队在一周内跑通大模型编程
SDD - RIPER团队发布一周跑通大模型编程落地方案
文章是SDD - RIPER团队大模型编程落地指南,阐述了推广难题及解决方案。推大模型编程存在上下文腐烂、审查瘫痪等痛点。SDD-RIPER可解决问题,其涵盖研发提效、人力解耦、知识传承三大场景,有四层质量保障。团队部署分安装Skill、跑通需求、达成团队约定三步。与AI协作要避免讨论命令混淆等问题。RIPER流程含Pre - Research到Archive六个阶段。第一周先试点老需求,复盘调整后扩大范围。数据显示其能提升质量和效率。最后解答常见问题,介绍协议资产和组织影响力。
Token经济学七问——一份关于AI新经济的入门地图
腾讯研究院探讨Token经济学七个关键问题
文章围绕Token经济学提出七个问题,介绍其产业背景。指出Token是AI处理和生成信息的基本单位,让AI可计量、定价和交易。全球Token消耗增长迅速,中国日均调用量两年增1400倍。不同用途的Token价值差异大,其生产成本因模型和任务而异且不断下降,但全球支出却增加。智能体的出现使Token需求大增,中国模型在全球Token市场具竞争优势。Token经济有按量计费、包月订阅等商业模式,同时面临能耗治理、跨境流动和统计盲区等制度挑战。

自掏腰包一万元,拥抱AI这一年,我的工具、实践和思考
李是希分享自掏万元拥抱AI一年的实践与思考
作者分享自掏万元拥抱AI一年的工具、实践与思考。产品体验上付费多款AI产品;开发实践跟进新范式并应用。文章分两部分,务实部分介绍落地工具等:一是用好Agent,分享MAC工具链,如Raycast、AeroSpace等,还介绍利用AI工具的实践;二是从提示词工程到驾驭工程,阐述Prompt、Context、Spec - driven Development、Harness Engineering四个阶段;三是让Agent学习,解决‘古法学习’痛点。务虚部分,感慨文章不AI Native,倡导与AI做朋友,回顾用AI曾面临的难题,如今钻研AI收益渐显。

AI 畅销社 03 期:指令不再靠回忆,Claude 指令速查表来袭
AI畅销社03期推出Claude指令速查表
AI畅销社03期介绍了「Claude速查表」。它是一款指令参考工具,像查字典一样简单,无复杂分类和冗长说明,选中功能、查看模板、复制使用即可让指令写作流畅。其主界面是简洁的卡片式设计。它有三个亮点:内置常用指令功能模板,可快速对照参考;即查即用,能省调试时间,新手老手都易上手;可速览Claude Code热点更新。此外还推荐了AI创意工具WeaveFox,给出了「Claude速查表」和WeaveFox的体验地址。

扣子2.5,开启全新 Agent World!
字节跳动技术团队发布扣子2.5,开启全新Agent World
2026年4月9日,字节跳动技术团队发布扣子2.5,开启全新Agent World。扣子2.5打破对话框边界,为Agent提供运行基座,打造完整生态。它为Agent提供三大核心支撑,包括“满配装备”“满配技能”“满配人格”。独立云设备让Agent可操作电脑、手机;专属工作台能让任务7×24小时流转。Agent还拥有视频创作、编程、行业专家等技能包。扣子2.5赋予Agent长期记忆和邮箱身份。Agent World是开放生态,有技能学习、社交广场等功能,让Agent互动学习、成长。目前部分功能限时体验,还有“满配开箱”直播季。

Seed 全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互
字节跳动发布全双工语音大模型Seeduplex
2026年4月9日,字节跳动推出原生全双工语音大模型Seeduplex。它基于“边听边说”框架,提升了交互自然感与顺畅度,实现精准抗干扰和动态判停。该模型已在豆包App全量上线,在对话流畅度和节奏感上优于半双工方案。评测显示,其判停MOS分提高8%,对话流畅度MOS分提升12%。未来,团队将提升音频理解能力、对话节奏控制能力,引入主动能力,实现多模态融合及感知、思考、输出一体化。

Claude Code 的 skills 源码解析
王君生解析Claude Code的skills源码并提出思考
文章对Claude Code的skills源码进行解析。先回顾LLM发展阶段,引出2025年Anthropic发布的Claude Skills,它是可复用能力单元,有知识可维护等优势。接着从加载和调用两阶段解析源码,加载包括启动入口、技能加载、磁盘技能加载等步骤,还涉及文件解析、去重、延迟加载和动态技能发现;调用介绍9种入口,重点解析用户斜杠命令调用流程。最后提出对skills的思考,包括解决的问题、存在的不足及在产研流程中的应用和局限,强调使用skills要注重方法论正确性。

重磅发布|Scale‑SWE 构造 10 万级真实 SWE 数据集,火山引擎沙箱底座重塑代码智能体训练
人大与字节跳动团队发布Scale-SWE数据集重塑代码智能体训练
2026年,中国人民大学高瓴人工智能学院与字节跳动团队合作发布Scale-SWE数据集。该数据集依托火山引擎Sandbox基建,含100k真实数据,是最大的开源高质量SWE数据集,为Code Agent训练数据扩展提供路径。基于此数据集训练的Qwen3-30A3B-Instruct模型成绩优异。该数据集构建得益于火山引擎Sandbox基建,其可支持高并发调度。研究还指出真实SWE数据重要,以往真实数据未规模化有基础设施、环境配置等多方面原因。团队提出多Agent工作流解决问题,实验验证了数据集有效性,未来将助力SWE研究,团队也会深化与火山引擎协作。

「纯干货」几万字都讲不明白的Memory架构与思考
陈梓康分享Memory架构的理解与思考
本文作者陈梓康分享对Memory架构的思考。首先指出Memory本质是event序列/Raw Ledger + views / policy层,提出三个核心命题。接着阐述System 1 + System 2设计,说明System 2必要性。然后对比参数化和非参数化记忆,分析非参数化Memory上限由接口带宽、检索与聚合误差、policy可学习性与可控性决定。还介绍Memory System控制层、单元结构、时序等内容,如SimpleMem的记忆固化机制,Zep的时序知识图谱。最后总结Memory系统架构,包括内核、文件系统、可执行文件、总线接口和学习引擎,强调各部分作用和意义。

吴恩达来信:试试语音交互吧!
吴恩达发文鼓励尝试语音交互,推荐试用Vocal Bridge
2026年4月6日吴恩达发文鼓励尝试语音交互。他指出基于语音的AI系统发展迅速,语音UI将更普及。过去语音UI有错误率和延迟问题,如今可靠性提升,会催生新应用场景。如给数学测验应用加入语音UI可改善体验。还提到Vocal Bridge实现自定义架构,兼顾低延迟与高智能。语音UI不会取代传统界面,而是作为补充,“视觉+语音”多模态交互体验更丰富。构建语音UI不难,其是AI应用重要构件,领域创新空间大,可点击“阅读原文”试用Vocal Bridge。

蒸馏:全员skill的职场恐怖故事
脑极体藏狐解析职场‘蒸馏’现象及打工人困境与反抗
文章围绕职场“蒸馏”现象展开,讲述同事、自己、老板等均能被蒸馏成skill,可用于工作。介绍了同事.skill核心构成、功能及炼化方式,指出其本质是高效提示词工程,未来或因大模型升级而被淘汰。人们对蒸馏存在恐惧,一是误解概念,二是担心被裁员和替代。有人尝试用反蒸馏.skill反抗,但易被反制,真正保护权益需靠法律。目前相关法律判例空白,普通人在技术浪潮中选择有限,消除恐惧的路径不明。

再也不担心论文!Nano-Banana Pro 论文绘图最全教程出书了!
Datawhale团队推出Nano - Banana Pro论文绘图教程书籍
2026年4月9日,Datawhale团队推出《AI科研绘图:Nano - Banana极速实战指南》。该书专为科研人打造,围绕Nano - Banana Pro构建科研绘图系统方法论。书中定义科研“好图”标准,介绍工具使用渠道、核心能力与辅助工具,阐述从论文内容生成可控结构示意图的阶段及不同领域提示词策略,探讨进阶控制与体系化构建,强调合规绘图。本书体系完整、实战导向,电子版已上线,纸质版筹备中,还将送出5本书。

AI洗牌音乐界,但创作者还没赚到钱
AI洗牌音乐界,但创作者盈利难题待解
文章指出AI正重塑音乐界,从最初被质疑“没灵魂”到如今AI歌曲登上热榜。AI音乐工具迭代,创作门槛降低,在线音乐平台纷纷搭建生态。入局者包括专业音乐人士、个体及不同阵营的平台。但创作者盈利难,变现模式有技术服务、售卖版权、平台分成三种。目前多数人收益不佳,平台推流少,创作者需自投推广费。AI虽降低创作门槛,却未降低赚钱门槛。同时,AI音乐在专业性上有欠缺,难取代编曲、混音等依赖审美环节。音乐平台受AI影响,MAU下滑,正探索线下场景等新增长曲线。

RD280UG 深度体验:为程序员量身打造的“代码神器”?
作者分享明基RD280UG显示器深度使用体验
作者分享明基RD280UG显示器深度体验。该显示器为3:2比例接近正方形,安装简单,支架可灵活调节,接口丰富还支持KVM。高分辨率使代码显示清晰,3:2比例垂直方向能多显示代码行,适合多桌面操作。雾面屏抗反光,有硬件级低蓝光和智慧调光护眼功能。其编程模式有深色、亮色和彩纸三种,可通过“</>编程”键快速切换。屏幕背后MoonHalo光环可平衡屏幕与背景亮度差。作者认为它适合每天长时间看代码或文档、注重字体清晰、需多系统切换工作且愿为健康投入预算的人群,目前产品较火或有断货情况。

这个华人团队,在海外做了一个「游戏版 TikTok」
赤子城科技团队推出海外AI游戏社区Aippy
本文介绍华人团队打造的海外AI游戏社区Aippy。它类似TikTok,刷到即玩,用户可语音创作游戏,还有Remix功能让内容生长。Aippy 2025年初上线,早期低调、聚焦海外市场,国内声量小,但增长不错、留存率高。AI游戏社区赛道受关注,不过面临内容质量、同质化、变现等问题待解,Aippy值得持续关注。

深度丨AI时代生存法则:全民发钱的时代真的要来了?
文章探讨AI时代全民基本收入(UBI)到来的可能性
2026年,亚马逊裁员、Anthropic代码由AI完成,达沃斯论坛称AI能替代50%白领工作。AI发展使多数人难从传统工作获收入,全民基本收入(UBI)或成必然。UBI是政府向公民定期发资金覆盖基本生活,有全民覆盖、无条件特征,马绍尔群岛已推出相关计划。AI使认知劳动基础层被抽空、职业成长阶梯消失,经济闭环或断裂。UBI将生存与劳动解绑,通过税收等机制再分配财富。虽有人质疑资金来源、工作意愿和通胀问题,但有实验和理论支撑其可行性。未来AGI或使大量工作被AI取代,社会可能新分化,人类价值或从生产转向存在,UBI为价值转型提供基础。

全球信息交互设计年鉴 | 沉浸式空间与装置艺术(美国)
美国呈现三场跨越AI、AR、VR领域的沉浸式艺术实践
文章聚焦美国前沿的沉浸式空间与装置艺术,介绍三场先锋实践。《无人监管》中,Refik Anadol工作室用AI诠释MoMA藏品,以StyleGAN2 ADA算法和定制软件生成新美学图像,还融入环境因素;Snap与LACMA合作推出13座虚拟纪念碑,用AR技术呈现洛杉矶景观和历史;INFINITY Experiences与NASA合作,让游客戴VR头显体验太空之旅,融合6自由度可行走VR与空间站360°全景影像,充满社交性和情感冲击。

Sam Altman:四天工作制,比你想的更快
OpenAI CEO Sam Altman谈AI下四天工作制及社会变革
OpenAI CEO Sam Altman在访谈中称,2025年和2026年程序员工作差异大,借助AI,开发者一人可完成过去团队的工作,四天工作制或比预期更快到来。这并非福利,是AI承担更多工作、工作方式改变的结果。AI使单位时间产出增长,工作时长不再是刚性指标。同时,AI改变工作后,社会收入分配体系受冲击,行业和政府有激进提议。技术发展快,社会准备滞后,在安全和认知层面有危机。最后提出三个紧迫问题,如思考自身与AI的差异等。
淘宝闪购设计2025 SHOWREEL
淘宝闪购展示2025年设计成果并强调人文关怀
2026年展示了2025年淘宝闪购设计年度SHOWREEL。过去一年以「温暖」为主题,在设计旅程中,从品牌焕新、C/D端视觉升级重构体验底色,在便利店导视等方面注入服务温度,还实现AI全链路赋能。展示了淘宝闪购品牌、IP、APP平台规范等多方面设计成果,强调设计不仅是视觉焕新,更要传递温度,未来会继续用设计连接科技与人心。

[A's周刊 22] 跨越边界之旅
腾讯 ART IPS 周刊22介绍多领域边界热点内容
这是腾讯 ART IPS 的周刊22,涵盖2026年3月28日 - 4月6日多领域边界话题。安全上,Anthropic 模型文件泄露引发暗网危机,冲击资本市场,预示 AI 攻防进入新阶段;技术上,英伟达 DLSS 5 凭矢量数据渲染,带来视觉增强但有细节“幻觉”问题;设计上,谷歌 Stitch 重构 UI 设计范式,实现人机交互自然化;法律上,《Vogue》起诉《Dogue》商标侵权,博弈陷入僵局;自然方面,Johnson Banks 为爱丁堡皇家植物园重塑品牌;文明方面,剑桥地区形成知识生态系统,以独特设计展现创新。

从手动到智创,携程直播全链路设计的跃迁之路
携程直播历经三次跃迁,迈向AI智创时代
文章讲述携程直播从2020年临危上线到如今AI智创的三次关键设计跃迁。1.0阶段在2020年旅行行业特殊时期,纯人工搭建直播基础,开创OTA行业直播新范式。2.0阶段打造全平台支持体系,采用“工具 + 人工”协同模式,实现设计资产体系化管理,支撑直播规模化发展。3.0阶段构建以AI为核心的直播智创体系,包括数字人直播体系、直播间装修智能生成和沉浸式体验升级。设计团队角色从物料执行者到流程搭建者,再到业务生态赋能者。未来将继续探索AI与直播深度融合,繁荣直播生态。

“金谷园饺子馆.Skill”刷屏,我们找它老板聊了聊
金谷园饺子馆老板李博发布面向AI的饺子馆Skill
2026年4月7日,金谷园饺子馆老板李博发布“金谷园饺子馆·SKILL”引发关注。该Skill是面向饺子馆顾客的私人AI助理,可让“龙虾”等AI助手回答饺子馆相关问题。李博虽不避讳有营销成分,但更希望借此拉近与顾客关系。金谷园饺子馆以“皮薄馅大、性价比高”著称,老板因看好AI趋势而做此尝试。当天下午,他受大厂动态启发,用字节、阿里、腾讯相关工具开发完成Skill。发布后,北邮师生、大厂、餐饮同行都很关注。李博认为未来会有超级入口,餐饮体验将是无感交互,他会把AI当兴趣探索,饺子馆重心仍在口味。

/phodal-writer:如何把十年写作经验整理成一个 Skill
作者将十年写作经验整理成可复用的Skill
作者分享将十年写作经验整理成Skill的方法。用AI写作输出不稳定,原因是用一次性Prompt解决需长期维护的问题。真正要工程化的是写作决策。“按风格写”常失效,因风格是一套写作决策。作者将文章分三个阶段整理样本,避免特征平均化。接着把模式观察转为执行规则,提炼出问题递进、判断句位置等核心规则。最后形成目录结构,实现渐进式披露。验证标准是能否生成合格文章,此方法放大了经验的可迁移性。

写了 42 年的程序,我会被 AI 取代吗?
涛思数据陶建辉分享用AI做研发经验及程序员发展建议
涛思数据创始人陶建辉分享使用AI做研发的经验,认为程序员不会消失,但“只会写代码的程序员”危险。他用Claude Code做TDengine IDMP产品研发,在文档编写、测试脚本生成、架构设计、研发状态分析等方面提效显著。用得好AI的人会分解问题、提具体问题。AI虽擅长写代码,但对业务本质理解、定义分解问题、审美判断等能力远不及人。他建议程序员把AI当重要下属和搭档管理,抓住职业迁移机会。
一夜之间3万人被裁,4位程序员自述被颠覆掉的生活
凤凰网科技报道4位程序员受AI冲击后的职业困境
文章讲述科技巨头甲骨文无差别裁员3万人,受AI coding冲击,程序员生活被颠覆。Kitty在美做后端工程师,公司激进推进AI,绩效向AI倾斜,她面临被裁风险,考虑转行;吴奇在TikTok做算法,AI提升效率但公司预期上升,工作边界消失;李锵被外企优化,AI降低编程门槛,他打算先领失业金再找新方向;陈凯效率因AI提高10倍,但老板与员工预期差大,工作多线程并行,他有职业危机感。
一个 6 周,一个 4 年,创业比的是反应
Mo Gawdat谈AI时代创业,强调反应速度是核心能力
文章以Google X前首席商业官Mo Gawdat的创业经历为例,指出AI时代创业竞争法则已变。过去创业需长期规划,如今商业环境变化快,工具能力跃升,技术和就业市场加速变化,长期规划价值归零。现在创业像打壁球,需快速反应,Emma团队4周转型4次。Mo给出提升反应速度的策略:建立高密度信息摄入源、降低试错成本、让AI执行自己决策。强调当下创业应边走边调整,反应速度才是核心能力。
重构>优化>不动:AI时代,差距就是这样被拉开的(附策略)
作者分享AI组织转型阶段及策略并推荐相关课程
文章围绕AI组织转型展开,指出企业在AI转型中有“不动”“优化”“重构”三个阶段。“不动”阶段AI仅为员工个人外挂,组织无实质变化;“优化”阶段在旧结构上局部提效;“重构”才是拉开差距的关键,包括工作流、组织协同和人才结构重构。还给出各阶段策略:重构用新业务试点;优化围绕主流程提效;不动先做认知和能力准备。最后介绍面向AI时代管理者的课程及开课信息。

运营20年的360doc个人图书馆网站将关停,老牌网站命运的缩影
运营20年的360doc个人图书馆将于2026年5月1日关停
运营20年的360doc个人图书馆将于2026年5月1日关停。该网站上线于2005年,为用户提供内容存储与分享服务,曾在PC时代有较高搜索权重和流量。其关停是PC时代老牌网站命运的缩影,原因包括终端迁移使站长不适应新推广模式;盈利模式转变,移动端靠广告难盈利、付费转化也难;互联网走向正规,版权要求提高,老牌网站内容投入难敌大平台。此外,老牌网站运营成本高,在AI时代更看不到希望。

AI救活了一家马桶公司,也点燃了存储芯片超级周期
AI带动存储芯片超级周期,行业或打破周期宿命
文章指出AI带动存储芯片超级周期,日本马桶企业TOTO因芯片耗材业务股价飙升。存储芯片供需失衡,HBM等价格疯涨,三星等厂商利润创新高。存储行业分“热”DRAM和“冷”NAND,产业链长但定价权集中。其有周期性,过去四次周期都未超两年,但此次因AI需求质变或不同。推理对存储需求更复杂,AI Agent崛起使存储需求大增。HBM扩产加剧DRAM短缺,因产能排挤效应。供给端受洁净室、设备商和制程迁移限制。存储价格上涨使利润重分配,国内厂商受益,硬件厂商受损。此轮周期或持续两到三年,虽有打破周期可能,但AI需求不确定性是风险。

手机不好卖,电脑还在涨
2026年Q1电脑涨手机跌,厂商借AI PC谋发展
2026年Q1,全球PC出货量增长,手机出货量下降。PC市场连续多季增长,Q1增长主要因渠道备货、Windows 10换机潮末期和厂商新品发布,但全年出货预期下调。联想、戴尔受益,惠普承压,苹果保守,二线厂商加速出货。厂商寄望AI PC,但其面临内存成本高、体验与宣传有差距等问题,消费端谨慎,企业端态度分化,AI PC渗透率虽升,但统计口径宽泛。

深度丨机器人价格大揭秘:中国造1万,美国卖25万,差距在哪里?
Humanoid Atlas网站揭秘中美机器人价格差异及产业竞争点
文章借Humanoid Atlas网站揭秘机器人产业信息,展现中美企业机器人价格差距大,美国产品高达25万美元,中国企业仅1万多美元。成本差异关键在于执行器,中国借供应链优势降低成本。供应链中零部件供应商赚钱,中国虽有替代者但核心指标有差距,且产能难满足需求,地缘政治也影响供应。此外,具身智能大模型让机器人能像人思考,未来竞争聚焦工程化降本、供应链掌控和高质量数据飞轮。

美团发布2025企业社会责任报告:科技为人,一起更好
美团发布2025企业社会责任报告
2026年4月9日,美团发布2025企业社会责任报告,主题为“科技为人,一起更好”。