阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选开发者周刊开发者周刊
登录注册
第 257 期

Vibe Engineering & Skills & jQuery 4.0.0

2026.01.26

开发者周刊

第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 256软件工程未来两年展望 & Web Almanac 2025
下一期 258OpenClaw 才是真正的 AI 入口?

国内

[阿里云开发者] Qoder JetBrains插件 数据库开发 AI Coding

Qoder @database功能上线!自动关联数据库 Schema,后端 AI Coding 效率拉满
文章介绍Qoder JetBrains插件数据库功能。AI Coding中,AI工具因缺准确表结构实战能力打折,Qoder将数据库能力内置为核心上下文,支持数据库原生感知。其核心能力包括在Ask/Agent模式引用数据库、Query Console的SQL生成、斜杠指令支持,对DataGrip也有良好支持。还介绍通过Qoder加速数据库开发的业务场景,如设计时复杂场景用Agent模式,简单场景用Query Console;可对遗留数据库标注;处理大schema和数据库方言的注意事项。

[阿里云开发者] PolarDB AI助手 数据库运维 自然语言交互 智能运维

PolarDB AI助手:自然语言驱动的智能数据库运维新范式
企业数据库规模膨胀使运维复杂度上升,专业人才稀缺成瓶颈。阿里云推出PolarDB AI助手,深度集成于PolarDB控制台。其基于大语言模型与专家知识库,有智能问答、诊断、感知能力。技术架构分接入、核心处理、底层支撑三层,核心处理层含多个子模块。通过反馈闭环机制持续提升能力。相比传统工具,它将专家经验提炼为SKILL单元,有动态加载和持续进化优势。支持自然语言交互,能实现上下文感知诊断、主动式异常感知。有标准版和专业版,安全合规。已在阿里云中国站上线。

[阿里云开发者] AI Coding Spec-Driven Development 多AI协同 OpenSpec 跨境保险

多 AI 协同 + SDD 编程实践:一个 AI 全流程交付实录
本文围绕多AI协同与SDD编程实践展开,介绍AI Coding技术发展与问题,引出SDD规范驱动开发方法。阐述SDD核心理念,选OpenSpec工具搭建工作流。通过MCP协议让Claude、Codex、Gemini无缝协作,明确角色分工与调用规则。给出前置准备步骤,分享实践经验,包括生成Spec - PRD、总结架构、生成方案、创建提案、变更实现与归档。指出SDD可约束AI不确定性,实现确定交付。

[阿里云开发者] MySQL DuckDB AliSQL OLAP 数据库集成

AI时代,当 MySQL 遇见列式存储引擎 DuckDB
在AI时代,有人认为MySQL生命力被边缘化,但AliSQL作为其重要分支,一直支撑阿里核心业务。2026年,AliSQL开发者将DuckDB集成到AliSQL中,为MySQL注入OLAP能力。MySQL有插件式存储引擎架构,常用引擎有MyISAM、InnoDB等,InnoDB虽适合OLTP,但在分析型业务查询效率低。DuckDB轻量、高性能,适合作为MySQL的AP存储引擎。RDS MySQL DuckDB只读实例采用读写分离架构,有高性能、低成本等优势。其实现包括查询链路和Binlog复制链路,通过优化保证数据一致性和回放性能。此次集成弥补了MySQL在OLAP场景短板,开创‘HTAP轻量化’路径。

[腾讯云开发者] 软件工程 AI协同开发 Vibe Engineering 本质复杂性 偶然复杂性

反思软件工程,超越Vibe Coding
文章围绕软件工程在AI时代的变革展开。首先介绍从Vibe Coding到Vibe Engineering的范式转移,Vibe Coding直觉驱动、极速打样但有风险,Vibe Engineering是其专业演进版,以规范为约束。接着回顾软件工程本质,指出核心是应对本质与偶然复杂性,传统方法通过建模等应对,AI时代建模形式变化,仍需降维本质复杂性。然后探讨AI协同开发实践,包括本质与偶然复杂性处理、分解逻辑升级、方法论融合等,强调强化建模、规范意识等交付支柱。最后总结AI时代软件工程师应聚焦本质、掌握业务模型、将AI当队友,坚守怀疑实证等原则。

[腾讯云开发者] 数据库 云原生数据库 TDSQL - C 数据库代理 容灾 Serverless HTAP

腾讯技术面:数据库核心八股终极典藏版
文章以云数据库发展为背景,从业务后台开发角度分享用好数据库的方法。一是扩展读写性能,传统物理机架构扩展耗时久,TDSQL - C升级架构解决扩容时效问题,但存在资源利用、高可用和数据一致性不足,数据库代理解决相关难题。二是事务拆分,将事务中读写操作拆分到不同实例,提升写性能。三是构建容灾,从实例部署和数据备份维度介绍多种容灾模式。四是提升业务连续性,通过连接保持、事务续传等屏蔽数据库抖动。还提及Serverless降低流量波动业务成本,TDSQL - C的HTAP方案提升查询性能。

[腾讯研究院] AI健康助手 医疗健康 人工智能 国际发展 国内发展

AI健康助手,正风起云涌
本文指出对话式AI健康助手成国际AI应用热点,有望在2026年快速发展。国际上,OpenAI等头部厂商提供医疗服务,ChatGPT成医疗问答首选,专业AI助手助欧美医生减负;国内,互联网大厂布局AI健康助手,如蚂蚁、科大讯飞等。热潮由交互习惯、AI能力提升、政策推动及商业竞争驱动,但也面临技术不足、盈利模式不明、监管协同欠佳等挑战。建议加大数据开放与创新扶持,加强行业自律和安全防护。未来,因健康需求刚性,健康助手成流量入口可能性增大。

[腾讯设计族] 经典产品 设计 路径依赖 创新

聊聊那些百年未变的经典产品
文章围绕百年未变的经典产品展开探讨。首先介绍 QWERTY 键盘、回形针、螺旋蚊香、拉链等产品诞生背景,如 QWERTY 键盘布局源于避免机械故障或适配电码输入习惯。接着分析它们百年不变原因,包括结构简单精妙、易用、易工业化标准化。然而,这些产品并非无缺陷,如 QWERTY 键盘并非最佳布局,螺旋蚊香拆分不便。其“不变”是因确立行业标准,形成路径依赖和用户惯性。最后总结,产品不变虽有设计优势,但设计需在多条件下平衡,设计师要审视惯例,探索创新。

[腾讯云TVP] AI时代 职场规划 人机协作 架构师使命 熊辉

港科大熊辉|AI时代的职场新坐标——为什么你应该去"数据稀疏"的地方?
港科大熊辉教授从物理学第一性原理剖析AI热潮底层逻辑,指出其受基础物理资源限制,构建“人机协作新型劳动体”是应对之法。他认为架构师核心技能是提问与鉴赏力,应利用AI提升效率。在AI时代,数据质量是价值分水岭,个人职业规划建议去数据稀疏领域。同时,要培养人机协作新型劳动体的四大核心技能。企业组织形式将变革,架构师使命是建平台、做系统、定标准、创品牌,实现从人才到人物的跨越。

[蚂蚁技术AntTech] 3D面部动画 自回归扩散模型 数字人 实时语音驱动

AAAI 2026 Oral|StreamingTalker:基于自回归扩散模型的3D人脸动作生成
本文介绍了被AAAI 2026收录的论文StreamingTalker,它提出自回归扩散模型的流式3D面部动画生成框架。现有语音驱动3D面部动画方法难以满足实时交互需求,扩散模型推理延迟长,自回归模型生成结果缺乏真实感。新框架在固定长度历史窗口约束下,通过自回归条件预测器构建扩散条件,引导轻量级扩散模型逐帧生成面部运动,解耦推理延迟与音频长度,提升生成质量与时序稳定性。该方法在数字人广告、数字人系统中有应用前景,如解决广告素材制作痛点,为下一代数字人系统提供核心动力。

[AI大模型应用实践] MemOS LangChain 智能体记忆 记忆图谱

LangChain Memory 太弱?试试用 MemOS 构建 Agent 专属的“记忆图谱”。
文章介绍了MemOS开源项目在智能体记忆方面的应用,它能构建记忆“图谱”。先从基于记忆“图谱”搭建ChatBot展开,介绍初始化、添加记忆、检索、注入Prompt等步骤,还提及增量添加记忆方法及效果测试。接着阐述其记忆“图谱”自动重组功能,采用异步后台处理,可提升性能。之后指出LangChain记忆机制不足,给出借助Middleware集成MemOS的方法,包括创建助手、实现中间件、集成到Agent及效果测试,还探讨了另一种工具集成方式。最后总结MemOS集成特点,能让AI Agent有长期记忆和知识积累能力,未来记忆系统工程化能力将增强。

[ByteDance Web Infra] Midscene GLM - V AutoGLM 版本更新 功能优化

Midscene 1.2 - 支持智谱 GLM-V , AutoGLM 模型
2026 年 1 月 23 日,Midscene 迎来 1.2 版本更新。核心是接入智谱 AI 的 GLM - V 视觉模型与 AutoGLM 移动端模型。GLM - V 有 106B 和 9B 版本,可用于 PC 或移动端 UI 自动化;AutoGLM 是 9B 开源模型,支持 50 + 款主流中文应用与多语言,还给出使用演示。同时提供接入指南。此外,版本还进行功能优化,如上线文件上传功能、优化缓存机制、改进报告与 Playground。开发者可通过官网、GitHub 仓库获取新版本,并能查看详细更新日志。

[OpenBMB开源社区] AgentCPM - Report 深度调研 开源系统 端侧模型

DeepResearch 终于本地化了!8B端侧写作智能体AgentCPM-Report开源!
文章介绍了端侧写作智能体AgentCPM - Report。当前深度调研面临数据隐私与深度洞察难以兼得的问题,而AgentCPM - Report由多机构联合研发,实现本地化且有SOTA性能。其亮点有极致效能、以小博大,能以8B参数对标顶级闭源系统;物理隔绝、本地安全,可杜绝云端泄密风险。文中给出了UltraRAG框架和AgentCPM - Report的开源地址。还展示了其在评测基准中的表现和实战效果,介绍了极简部署教程。技术上通过“写作即推理”和“多阶段智能体学习”实现以弱胜强。该系统现已开源,诚邀开发者体验。

[OpenBMB开源社区] UltraRAG 3.0 算法开发 技术框架 智能助手

UltraRAG 3.0 发布:拒绝“盲盒”开发,让每一行推理逻辑都清晰可见
2026年1月23日,清华大学THUNLP实验室等联合发布UltraRAG 3.0。该框架针对算法开发痛点,有三大核心优势:提供“所见即所得”的Pipeline构建器,让算法工程师专注逻辑编排;打造“透明化”推理验证窗口,实时呈现推理细节;内嵌AI助手,辅助生成配置与优化Prompt。它能30秒快速上手,一键启动UI。其逻辑编排可同步生成演示界面,支持双模式构建。Chat界面可对推理过程像素级可视化,缩短优化周期。智能助手能自动生成Pipeline草稿、优化Prompt等,还展示了四个交互场景实战演示。

[TRAE.ai] Skills Agent AI开发 TRAE Claude

一文读懂 Skills|从概念到实操的完整指南
文章围绕 Skills 展开,介绍其概念、原理、与其他概念区别、评判与编写方法、社区资源及实际应用。Skills 可让 Agent 更可靠可控,以文件夹形式存在,包含说明书、操作脚本和参考资料。其采用三层分级加载机制,调用时经意图匹配等步骤。与快捷指令、原子工具等有区别,好的 Skills 应遵循单一职责等原则。文章推荐 Claude 官方和社区的 Skills,还介绍在 TRAE 里创建和使用 Skills 的方法,并通过基于飞书文档的 Spec Coding 场景展示其应用,解决了 Agent 规则失效等问题。

[TRAE.ai] TRAE Skills AI开发 快速上手

从理解到应用 | 在 TRAE 中快速上手 Skills
本文是 TRAE 中 Skills 的快速上手指南。先从 AI 的 Agent 和 MCP 概念引出 Skills,指出 Agent 面向目标,MCP 让 AI 调用外部服务,Skills 是可复用能力包。接着说明适合用 Skills 的场景,如高频重复操作、需稳定输出等,并对比了 Skills 与 Prompt、Rules、Context 等功能。然后介绍 Skills 的编写结构,是含 SKILL.md 文件的文件夹。使用时可先创建基础版再优化,能导入社区 Skills 或自己创建,调用方式有显性和隐性。最后通过创建“多彩输出”Skill 示例,展示创建和使用过程。

[TRAE.ai] 社区共创 TRAE 线上项目开发 周年庆许愿地图

社区共创|TRAE 一周年许愿地图开发细节全揭秘
本文记录社区伙伴用TRAE从0到1开发线上周年庆项目的全过程。先将“周年庆活动”想法拆解为具体需求,借助TRAE的“创意引导师”完成头脑风暴与定稿,明确价值主张和业务边界;再用TRAE生成需求、技术文档和任务列表,半自动化完成繁琐文档工作;开发时让TRAE生成基线代码并迭代优化,以基线版本聚集社区伙伴扩展功能,采用Fork&PR模式多人协作;增加新功能时遵循“文档先行”原则,用TRAE使文档与代码保持同步;遇到问题也用TRAE分析解决。此次实践证明TRAE能助力项目开发,让共创过程可控,开放社区成员都能借此交付有价值项目。

[京东技术] MCP服务框架 stdio streamableHttpless sse AI业务

同时支持stdio,streamableHttpless和sse三种协议的MCP服务框架
本文介绍了同时支持stdio、streamableHttpless和sse三种协议的MCP-Server框架。因AI业务中MCP服务使用存在痛点,作者从0 - 1搭建该框架。它支持三种模式,功能模块化,支持环境变量,模式切换简单,有日志和行云脚本。文中介绍框架结构,含build、src等目录;给出启动服务方式,分本地和部署启动;说明生产环境配置及端口、访问地址优先级;介绍关键代码,如package.json、index.ts等;最后展示成果,三种模式均成功联通相关平台。

[京东技术] Apache Hudi 京东数据湖 自研技术 业务实践 社区贡献

Apache Hudi 在京东的最新架构演进
本文介绍京东数据湖现状、自研技术、业务实践、社区贡献与未来规划。京东数据湖利用Hudi推进数据准实时化,入湖规模超500PB。基于Hudi 0.13.1版本,在组织协议层和IO传输层自研优化。自研技术有Hudi MoR LSM - Tree、Partial Update Foreign - Key Join、Hudi NativeIO SDK。业务实践聚焦流量数仓ADM数据湖升级并解决诸多问题。京东Hudi团队向社区贡献109个PR。未来规划是推进版本演进、支持多模态和NativeIO能力、探索湖流一体方案。

[京东零售技术] JVM性能诊断 AI驱动 大语言模型 性能优化

让性能瓶颈自己开口说话:AI 驱动的下一代 JVM 性能诊断革命
文章介绍AI驱动的下一代JVM性能诊断方案。传统性能分析工具存在性能影响大、依赖专家经验、流程断点多等问题。新方案融合无侵入的JFR事件采集、日志投递系统和大语言模型推理能力,构建“感知 - 分析 - 决策”一体化自主智能体。数据采集用自研JVM探针集成JFR,以低开销获高质量数据源;性能分析让AI结合运行数据和代码上下文定位根因并生成报告建议。通过演示展示自主诊断流程及效果,还给出不同优先级优化方案和实施计划。未来方案将受益于JFR功能增强,可扩展至多语言生态,走向“自主优化”闭环,带来研发生产力范式跃迁。

[前端圈] jQuery jQuery 4.0 前端开发

jQuery 20 周年,jQuery 4.0 发布!
2026 年 1 月 20 日,jQuery 团队宣布 jQuery 4.0.0 正式发布,这是近 10 年来首个大版本,有破坏性变更,但多数用户升级改动少。其亮点包括:移除对 IE < 11 等古老浏览器的支持;增加对 Trusted Types 支持,多数异步脚本请求用

[前端圈] Vitest 前端测试 版本发布

Vitest 4.1 首个 Beta 版本发布!🧪
2026 年 1 月 24 日,Vitest 4.1 首个 Beta 版本发布。新特性包括 Chai 风格的 Spy 断言、浏览器模式支持 userEvent.wheel()、针对不稳定测试的增强重试选项、doMock() 返回 Disposable 对象、遵循覆盖率的 ignore start/stop 提示等。API 有多项更新,如 doMock() 返回 disposable 对象、添加 Spy 的 Chai 风格断言等。同时修复了多个 Bug,像弃用多个 vitest/* 入口点、在 createRequire 中使用 meta.url 等。可安装 vitest@beta 立即体验。

[前端圈] Rolldown JavaScript打包工具 RC版本 性能优化 Vite集成

Rolldown 1.0 RC 版本正式发布
2026 年 1 月 22 日,VoidZero 宣布 Rolldown 1.0 RC 版本上线。Rolldown 是用 Rust 编写的 JS/TS 打包工具,兼容 Rollup 插件 API,速度快 10 - 30 倍,拥有多项核心特性。此 RC 版本标志 API 稳定,1.0 正式版前无破坏性变更。自 beta.1 发布后有超 3400 次提交,在 Vite 集成、性能优化、分块策略、兼容性、API 稳定化、开发者体验和文档完善等方面有进展。其前进路线为 RC 收集反馈,Vite 8 默认搭载,最终发布 1.0 正式版。

[大淘宝技术] 淘宝订单列表 体验优化 首屏性能 交互体验 白屏治理

淘宝订单列表体验优化实践
本文介绍电商平台订单列表在性能、交互和稳定性三方面的优化实践。首屏性能优化上,采用双层预请求策略与多级缓存体系,优化我淘touchdown场景,提升缓存命中率与加载速度。交互体验升级方面,设计多实例架构解决单实例架构问题,兼容推荐流和引入失效标记机制,提升流畅度与状态保持。白屏问题治理针对不同白屏问题分别采取措施,如优化无缓存数据渲染、防御并发请求、设计多实例管理架构。整体优化使订单列表在性能、稳定性和架构上显著提升,但还需平衡体验与性能,构建前瞻性体验度量体系。

[大淘宝技术] ICCV 2025 Face attractiveness prediction FPEM model LiveBeauty dataset TaoTian Audio - Video Technology Team Shanghai Jiao Tong University

ICCV25 | 淘宝人脸吸引力预测算法FPEM
淘天音视频技术团队与上海交大合作的论文《FPEM: Face Prior Enhanced Facial Attractiveness Prediction for Live Videos with Face Retouching》被ICCV 2025收录。团队自研直播美颜场景人脸吸引力预测模型FPEM,它融合图像和文本模态。团队还发布LiveBeauty数据集,包含10000张图像及20万个主观分数标注。FPEM模型用两阶段训练策略,含PAPM、MAEM和SFM模块。实验显示,FPEM在多个数据集上超现有SOTA方法。此外,LiveBeauty数据集和FPEM框架可推广至其他视频人脸美感预测任务,但要应对不同文化、性别和族裔的审美差异挑战。

[大转转FE] Chrome DevTools Panel 埋点校验 zzChromeTools MV3架构 前端开发

从痛点到架构:用 Chrome DevTools Panel 做埋点校验,我是怎么落地的
文章以用 Chrome DevTools Panel 做埋点校验为主题,先指出现代互联网企业开发中埋点校验易被忽视,存在大海捞针、稍纵即逝、参数黑盒等问题,导致认知负荷过载。接着分析现有工具在埋点校验上信噪比低,无法满足需求。开发时面临 MV3 架构带来的隔离世界、Service Worker 及通信链路的难题。业内现有方案各有不足。为此提出 zzChromeTools 方案,采用主世界注入的 AOP 旁路捕获模式,包含主世界注入、旁路通信和数据持久化模块。该工具在时间、心理和资产维度均有价值,未来还计划进行持久化存储升级、全协议覆盖、自动化测试集成等。

[奇舞精选] Google Agent Agent能力分级 AgentOps 算法进化

Google Agent进化论:从 L0 到 L4
文章围绕Google Agent进化论展开。介绍其从“预测型AI”到“自主Agent”的跨越,Google发布指南将Agent能力分L0 - L4五级。先剖析Agent解剖学架构,含大脑、双手等四组件;阐述工作机制为认知 - 行动闭环。接着说明分级情况,从L0裸模型到L4自我进化系统。还提到开发范式从“搬砖工”到“导演”转变。AgentOps是运维体系,含LM评委等核心部分。最后以AlphaEvolve为例展示L4能力,它实现算法进化,有诸多成就。Agent正成团队新成员,未来架构构建更重要。

[奇舞精选] Claude Skills AI能力体系 渐进式架构 可复用模块

一文带你上手 Skills:构建可复用的 AI 能力体系
文章介绍Claude Skills,它能构建可复用AI能力体系。传统LLM使用Prompt有不稳定、不可复用、不可组合问题,Skills提供解决方案,它是可复用能力包,有清晰目录结构和核心文件。采用渐进式架构,可解决Token消耗、任务干扰、逻辑冲突问题。支持桌面端/CLI端和API集成两种使用方式。还给出日报/周报/月报自动生成Skill案例,区分了Skills、MCP和Agent。其核心价值是解决传统Prompt痛点,适用于重复性结构化任务和自动化工作流。

[奇舞精选] Agent Skills AI开发 技能复用

Agent Skills使用指南:让AI智能体拥有“即插即用”的超能力
文章介绍了Agent Skills,它能将复杂任务流程固化为可复用的‘技能组件’,让AI按需调用能力。文中阐述了其概念,与Prompts、MCP的区别;技术原理包括渐进式披露和标准文件结构;适用场景有重复指令、遵循特定规范、复杂工作流等。还说明了使用方法,如快速上手、创建自定义技能、技能组合等。介绍了官方技能库、社区生态工具和跨平台支持情况。最后给出技能设计原则和常见问题注意事项,强调它是思维方式转变,将成核心竞争力。

[字节跳动技术团队] TRAE IDE MCP Server 开发工具 字节跳动

TRAE IDE 10 大热门 MCP Server 推荐
文章由字节跳动技术团队的Jiaqi撰写,介绍TRAE IDE中10个热门MCP Server。MCP协议允许大语言模型访问工具,TRAE中智能体可向MCP Server请求服务,支持三种传输类型。文中依次阐述各Server,如Context7可检索文档、注入上下文;Puppeteer能实现浏览器自动化;Sequential Thinking辅助拆解复杂问题等,还说明其核心功能、使用场景和可用工具。最后介绍添加MCP Server的方法,可从TRAE IDE内置MCP市场添加。

[小红书技术REDtech] 小红书 MySQL内核 合并秒杀 性能提升

小红书MySQL内核秒杀能力重磅再升级
随着小红书电商业务发展,直播带货等场景对下单速度要求提升。基于MySQL内核的合并秒杀优化方案,相对排队秒杀将写入能力提升5倍,较社区版有百倍性能提升。该方案改动收敛到内核,对生态、内核升级、业务SQL无影响。它通过Leader预读库存写入缓存,Follower在缓存合并扣减,最后Leader写入存储引擎提升性能。同时解决了缓存可见性和一致性问题,还对行锁、Binlog提交、Crash Recovery进行优化。

[得物技术] 得物技术 比数平台 数据比对 资源迁移

Galaxy比数平台功能介绍及实现原理|得物技术
得物计算和存储资源迁移时,需确保数据一致性,比数平台应运而生。该平台要解决快速完成全文数据比对和精准定位异常数据两大挑战,目标是实现高并发、自动化、智能差异定位等。其采用先Union再分组、哈希值聚合结合的方法快速比对,通过自动探查主键、多方式找主键及根因分析精准定位异常。平台有三种比对模式,具备前置校验、资源分配与任务调度优化功能。已安全运行500+天,助力多团队完成任务,未来将在智能分析、比对策略、通用方案上改进。

[微软亚洲研究院] 3D生成 3D资产 TRELLIS.2 微软亚洲研究院

从“实心泥塑”到“高精度资产”,TRELLIS.2重构3D生成规则
本文介绍微软亚洲研究院发布的 TRELLIS.2 模型。当前 3D 生成存在细节模糊等问题,TRELLIS.2 能生成丰富材质 3D 物体,构建内部几何结构,使 3D 资产迈入“高保真”阶段。它重塑底层技术逻辑,提出非场新表达 O - Voxel,实现 16 倍空间压缩,提升生成效率。其优势体现在实现基于物理的真实材质渲染、打破“封闭世界”魔咒、把控极致细节。创新包括用 O - Voxel 告别“水密化”束缚,用超级压缩引擎“瘦身不损质”。自开源后受广泛关注,研究院正针对需求研发,愿景是让 3D 生成更简单。

[快手技术] 快手 OneSug 查询推荐 生成式框架 电商搜索

效果&性能双突破!快手 OneSug 端到端生成式框架入选 AAAI 2026
文章介绍快手OneSug端到端生成式框架入选AAAI 2026。查询推荐是电商搜索关键功能,传统多阶段级联架构有局限。OneSug将多阶段统一在生成模型中,提升推荐效果与系统效率。其含Prefix - Query表征增强、统一Enc - Dec生成架构、用户行为偏好对齐三个核心模块。实验显示,离线指标上OneSug优于传统系统与基线模型;在线A/B实验提高Ctr、订单和GMV等指标;在线推理平均耗时降低43.2%。OneSug为生成式模型落地提供新范式,未来将探索更多应用方向。

[快手技术] 快手 LGSID 生活服务推荐 AAAI 2026

AAAI 2026|快手LGSID助力业务GMV实现两位数增长:从地理可达,到兴趣匹配
文章围绕快手生活服务算法团队的LGSID展开。生活服务推荐受地理位置强约束,传统推荐方法在近场分发场景表现受限。为此团队提出LGSID,相关成果被AAAI 2026接收且已全量上线,助力业务GMV和订单增长超10%。LGSID包含RL - based Geographic LLM Alignment和Hierarchical Geographic Item Tokenization模块,前者通过地理感知奖励模型和G - DPO算法,让LLM有效学习地理位置信息;后者提出HGIT方案进行层次化量化。实验显示LGSID在判别式和生成式推荐模型中性能突出,能提升模型地理感知能力,未来团队将继续探索AI赋能下一代推荐系统。

[搜狐技术产品] Maven 4 Java Maven升级 Maven新特性

Maven 4 终于要来了!
文章介绍了Maven 4相关情况。目前Maven 4.0处于Release Candidate阶段,未正式GA。它要求最低Java 17运行环境,有诸多新特性:一是分离Build POM与Consumer POM,解决Maven 3发布元数据臃肿问题,发布artifact更干净,依赖解析快,生态兼容性好;二是POM模型升级到4.1.0,简化语法,如自动发现子项目、坐标推断、支持CI友好变量;三是构建性能提升,从线性生命周期到树形并发;四是优化开发者体验,有构建恢复、延迟发布、官方迁移助手等。对于生产环境建议等正式GA后小范围灰度,新项目/个人实验和大厂多模块项目可尝试。

[搜狐技术产品] iOS OOM治理 内存管理 MetricKit

iOS OOM治理
本文围绕iOS OOM治理展开。先介绍OOM是系统为保稳定性,通过Jetsam机制强杀进程,无崩溃堆栈。接着阐述iOS内存管理逻辑,含物理与虚拟内存关系、内存分类及Jetsam机制,强调phys_footprint是OOM判决依据。业界治理方案分判定和监控两类,建议采用混合架构。核心技术实现包括准确获取内存数据、用状态机判定OOM、监控内存分配等,还设计了三层架构。指出内存快照生成和malloc_logger的问题及优化方案。实战中分析常见OOM场景并给出治理办法。介绍官方MetricKit可准确提供OOM数据,但有局限,建议双轨制治理。最后总结要相信phys_footprint,做好监控和架构设计,未来趋向精细化和预测性。

[淘宝设计] 淘宝直播设计 明星入淘 品牌营销设计

星主播:明星入淘直播品牌营销设计
作者初入淘宝直播设计团队,以“星主播”项目分享成长感悟。淘宝直播为壮大主播生态聚焦明星群体,设计团队确认“明星主播引领星潮流”主张,构建视觉体系:呼应直播特征,凸显明星符号,坚持多场景一致表达。在明星直播间消费基于消费者对明星的信任感,设计上设定容器载体,兼顾多类型明星主播,单场配色有区分。直播设计要坚持全链路视觉一致,设置动画凸显实时权益和热卖氛围。后续会根据实际情况优化方案。

[火山引擎开发者社区] 扣子2.0 企业AI AI开发平台

扣子2.0正式发布,打造企业“超级AI员工”
2026年1月19日,扣子2.0正式发布,企业版同步上线火山引擎。它旨在解决企业用AI的痛点,如通用AI不懂业务、定制AI周期长成本高。扣子2.0有两大升级:扣子是开箱即用的企业AI生产力平台,能完成写作、出图等日常办公任务,有新能力,企业可用自身数据开发专属技能;扣子编程是全员可用的AI开发入口,通过自然语言对话构建技能等,一键部署上线。它缩短开发流程,提供企业级能力,让最懂业务的人定义AI。Gartner预测2028年AI智能体将处理企业80%常规工作流,扣子正加速这一进程,让企业拥有超级AI员工,实现组织能力升级。

[火山引擎开发者社区] 观测成本优化 APMPlus 尾采样技术 分布式链路追踪

观测成本如何优化?APMPlus 尾采样技术的降本增效实践
文章围绕优化观测成本,介绍 APMPlus 尾采样技术的实践。在微服务环境中,链路追踪数据采集成本高,头采样存在指标失真等问题。APMPlus 尾采样是“先收集,后决策”策略。其数据处理主流程中,O11yAgent 采集和处理数据,将指标计算与 Trace 采样解耦。通过一致性哈希路由聚合同一 Trace 的 Span,采用多级与组合采样策略。还实施决策前置、快速采样等优化,监控尾采样过程。实测表明,尾采样开销可控、策略高效,高负载表现稳定。最后提出尾采样适用边界及与头采样结合的思路,该技术可平衡指标、定位与成本,是可观测性体系重要方向。

[火山引擎开发者社区] 扣子 AI办公 企业数字化 工作效率提升

当我真的和扣子一起上班
这是扣子刚入职小编的分享,借用户追问产品迭代速度,分享扣子团队使用扣子办公的技巧。如小林用「多渠道数据自动化」处理反馈,小哈用「扣子访谈总结」整理访谈,小雨用「市场情报自动化」获取竞品信息,豆豆用扣子视频 Skill 制作宣传片,设计团队用「设计评审」Skill 支撑设计评审,阿明用「产品数据分析」Skill 汇报数据,研发团队定制技能优化故障处理流程。作者认为扣子 2.0 企业版能让员工从繁琐工作中解放,还透露文章是用扣子所写并经其优化。

[火山引擎开发者社区] VeADK Agent VKE 容器化部署 AI应用

VeADK Agent 一键容器化部署,万字长文带你实战演练
本文介绍将 VeADK Agent 部署至火山引擎容器服务(VKE)的标准化路径。先阐述背景,AI 应用迁移至生产环境,VKE 可提供安全可靠、弹性伸缩等环境。操作流程含创建 VKE 集群及节点池、用 IRSA 连接云服务 API、容器化应用并推送镜像等。环境准备需火山引擎账号密钥、配置本地开发环境、开通云服务、安装项目依赖。接着介绍创建 VKE 集群与节点、开启安全围栏配置、Agent 开发与本地验证、应用容器化与镜像推送、编写 Kubernetes 配置、部署应用、配置弹性伸缩、通过 API 网关暴露服务、日志与观测等步骤。企业级用户部署至 VKE 可统一云原生技术栈,带来多维度收益。

[百度地图] 百度地图 开放平台 AI 时空智能 开发者 出海战略

从精准导航到时空智能:百度地图开放平台十五年,与400万开发者共塑智能时代新基建
2025年百度地图服务用户二十周年,其开放平台也走过十五年。在“2025百度地图开发者盛典”上,回顾了从基础地图API到智能位置服务平台的变迁。百度地图开放平台以AI驱动,推出“AI开发助手”,构建全栈AI能力矩阵,深耕行业智能体。其靠精准数据底座、深度产业共创等成400万开发者首选。还启动出海2.0战略,与全球服务商合作,完成服务器本地化部署,支持合规运营与多语言服务。未来百度地图将以AI为核,深化智能位置服务价值。

[GSYTech] Flutter iOS 26 键盘变化 底层改动

Flutter 又迎大坑修改?iOS 26 键盘变化可能带来大量底层改动
文章指出 Flutter 在 iOS 26 系统上,因键盘新增半透明效果,出现键盘背景颜色 UI 异常问题。问题主要出现在 showModalBottomSheet() 场景,因 Flutter 默认系统键盘完全不透明,未绘制被遮挡的 Widget,导致键盘半透明区域显示黑色。临时解决办法是在 Info.plist 里配置 UIDesignRequiresCompatibility = YES,但 App UI 会变为 iOS 18 风格。该问题本质是 iOS 26 改变了底层假设,若要完全适配新场景,需系统性重构 Framework 层、Engine 层等多个核心层,涉及大量底层改动和性能指标调整,正常输入框和 Dialog 场景不受影响。

[GSYTech] Meta ShapeR 3D物体生成 SLAM VLM

Meta ShapeR :基于随机拍摄视频的 3D 物体生成,未来的 XR 和机器人基建支持
近日 Meta 开源 ShapeR 项目,能将普通图像序列转换为完整的度量场景重建。它结合 SLAM 得到的稀疏点云与相机位姿、物体检测/实例分割得到的对象实例、VLM 生成的文本 caption 来生成物体的 3D mesh。SLAM 是核心,可得到“摄影师的足迹”和“物体的骨架”;物体检测/实例分割是“自动抠图”和“聚光灯”;VLM 提供文本描述以补全细节。ShapeR 先检测场景对象,再单独重建 mesh 后组装成场景,可单独操作物体、导出编辑。其作用丰富,但核心难点在数据准备,目前依赖闭源的 Aria MPS 服务。普通用户可尝试但过程麻烦,期待后续转换工具完善。

[GSYTech] Android Gradle Plugin 9.0 内置 Kotlin KMP 开发适配

Android Gradle Plugin 9.0 发布,为什么这会是个史诗级大坑版本
AGP 9.0 发布带来诸多问题。此次更新有三大核心变动:一是彻底切换到新 DSL 接口,旧实现和旧 Variant API 被切断,用户需迁移到新 API,虽有回退选项但 AGP 10 会移除;二是默认开启内置 Kotlin,打破了项目/插件生态的假设,用户要进行多项迁移,可选择关闭;三是 KMP plugin 不再能和相关模块同模块共存,需拆分模块,目前有临时方案但 AGP 10 会移除。谷歌这么做是为控制公共 API 面、为稳定构建模型铺路、集成 Kotlin。开发者适配有难度,需被动断舍离。

[iOS新知] SwifDroid Swift Android开发

另一个神级框架,不用学 Kotlin,Swift 开发者也能写原生 Android 了
文章介绍了用 Swift 开发 Android 应用的框架 SwifDroid。它基于官方 Swift SDK for Android,提供类似 SwiftUI 的声明式 UI 框架,隐藏 JNI 细节。安装需 Docker、VSCode 及相关扩展。创建项目要在 Swift Stream IDE 操作,配置命名空间、SDK 版本等。项目有 Sources、Application、Library 目录和相关配置文件。应用入口是 App.swift,主 Activity 是 MainActivity.swift,语法类似 SwiftUI。Droid framework 提供多样组件。开发流程为写代码、编译运行、调试和热重载,该框架让 Swift 开发者可写 Android App。

[PaperAgent] Anthropic Claude Skills 智能体 技能生态系统 开放标准

刚刚,Anthropic分享了他们押注Claude Skills的底层逻辑
2026年1月24日,Anthropic分享技术Blog解释押注Claude Skills底层逻辑。过去一年智能体发展有进展,但构建部署时发现其缺乏处理实际工作专业知识,促使创建Agent Skills。它将领域专业知识打包,让智能体从多面手变专家。代码成为智能体执行数字工作接口,但通用能力不等同专业知识。Skills通过渐进式披露避免压垮上下文窗口,还可包含脚本工具。技能生态系统已出现基础、合作伙伴、企业三种技能。随着技能采用增长,呈现复杂性增加、与MCP协同、非开发者采用等趋势。新兴智能体架构由智能体循环、运行时、MCP服务器、技能库组成,该模式助Claude拓展到金融、医疗等领域,Anthropic还发布智能体技能作为开放标准。

[PaperAgent] GraphRAG Deep GraphRAG 知识图谱检索 强化学习

图谱检索全面 or 效率?蚂蚁&浙大Deep GraphRAG:全都要
文章介绍蚂蚁与浙大提出的Deep GraphRAG,旨在解决GraphRAG「三难」困境。传统RAG向量召回遇复杂Query易失效,GraphRAG引入知识图谱又有全局粗、局部跳不远和检索延迟问题。Deep GraphRAG有「三板斧」:层次化全局到局部检索、Beam - Search动态重排、DW - GRPO强化学习。其图构建流水线包括文本切块、实体关系抽取等步骤,三层检索流程降低GPU占用。DW - GRPO让奖励动态分配,1.5B模型达72B模型94%性能且延迟降20倍。实验显示,在HotpotQA和NQ数据集上,Deep GraphRAG比Drift Search表现更优,延迟大幅降低。

[phodal] AI时代 技术分析 结构化思维 能力迁移 技术洞察

AI 时代的洞察方法论:结构化思维与能力迁移
本文借真实案例探讨AI时代技术分析的能力迁移与应强化的认知能力。生成式AI出现前,技术洞察信息收集耗时多,洞察时间少。作者对比实验发现,AI能快速完成信息整合,让技术人将精力放于高阶思考。技术分析核心能力仍是结构化建模,如分析高盛时构建TARGET模型。案例深挖表明,如今实现SecDB类平台最小原型不难。AI可构建原型辅助验证隐性知识,洞察正从信息密集转向模型密集,瓶颈变为构建模型。

国外

favicon web development CSS HTML SVG PNG

How to Favicon in 2026: Three files that fit most needs
文章指出当前前端开发者为显示网站图标需处理20多个静态PNG文件,提出更优方案。极简版只需五个图标和一个JSON文件,包括HTML中引用的favicon.ico、icon.svg、apple-touch-icon.png,PWA需添加manifest.webmanifest。详细版介绍终极favicon设置,含适用于旧浏览器的favicon.ico、现代浏览器的SVG图标、苹果设备的180×180 PNG图像、安卓设备带192×192和512×512 PNG图标的web app manifest。还介绍构建此图标集的六个步骤,涵盖准备SVG、创建ICO文件、生成PNG图像、优化文件、添加到HTML、创建web manifest,最后提及开发环境可使用不同图标区分。

accessibility aria semantics HTML

I Learned The First Rule of ARIA the Hard Way
作者分享了在开发组件时使用 ARIA 的惨痛教训。起初组件各项测试指标正常,但屏幕阅读器用户无法正常触发。原来是添加 role 属性让按钮表现异常,删除该属性后问题解决。作者强调语义化 HTML 在无障碍访问方面作用巨大,滥用 ARIA 易出问题。还给出正确使用 ARIA 的步骤:先用原生 HTML 表达意图,再用键盘和屏幕阅读器测试,仅在传达缺失状态时添加 ARIA。同时指出 ARIA 在传达展开或折叠状态、宣布动态更新等场景不可或缺,应让语义化 HTML 成为基础。

Web Design Responsive Design Design Systems Pixel Perfect

Rethinking “Pixel Perfect” Web Design
文章指出,在2026年科技飞速发展的时代,“像素完美”这一源于印刷时代的概念已不适应现代网页设计。它最初从印刷行业延伸至早期网页设计,要求网站与静态模型像素级匹配。但如今,屏幕尺寸多样化、内容动态化、需考虑可访问性等因素,让“像素完美”既模糊又有害,还会产生技术债务。作者认为应从关注像素转向设计意图,通过理解设计目的、使用设计令牌、利用现代CSS工具实现布局自适应,以更精准的语言沟通,让设计和开发人员共同实现卓越标准,构建能思考、适应和灵活变化的界面。

frontend framework platform companies acquisition risk Cloudflare Astro

Why platform companies keep buying frontend framework teams
本文围绕平台公司收购前端框架团队现象展开。先列举近年多起收购案例,如Cloudflare收购Astro背后公司。分析Cloudflare收购原因,一方面契合其构建更好互联网使命,支持独立网站;另一方面Astro能为开发者提供替代React的方案,其默认零JavaScript策略可让网站更快。接着指出收购风险,以Netlify收购Gatsby为例,收购后维护不力,框架不再适合新开发项目。还提到企业通过雇佣或赞助框架维护者施加影响,虽维护者可保留控制权,但收购仍可能引发开源社区担忧。

React State Management Redux Toolkit Zustand Jotai MobX Valtio

How to Master State Management in Modern React
文章围绕现代 React 状态管理展开,指出状态管理是把双刃剑,随应用增长会变得复杂,且无完美工具,各方法有不同权衡。介绍了七种策略:用 useState 和 useReducer 管理局部状态;用 React Context 解决共享 UI 状态的 prop 钻取问题;Redux Toolkit 适用于工作流导向的状态;Zustand 提供轻量级全局存储;Jotai 将状态建模为原子;MobX 用于可观察、领域驱动的状态;Valtio 适用于基于代理的可变存储。还对比了各方法,并给出选择策略的实用清单,强调应根据状态实际情况选择工具。

react javascript webdev Corbin Crutchley TanStack Form

Adapting Library Logic for React Compiler
文章围绕适配 React Compiler 时的库逻辑展开。作者作为 TanStack Form 维护者,起初认为支持良好,后遇三元运算符和编译器问题。通过滚动监听钩子示例,揭示代码在父子组件中表现不同的问题,原因是 React Compiler 对 position 对象引用比较方式不同。ESLint 未完全覆盖此类问题,因代码用类封装逻辑以支持多框架。为检测编译器错误,可启用 panicThreshold 标志,还能模拟 Babel 忽略库转换。长期修复方法是避免直接修改 position,React Compiler 可处理性能问题。

[Hugging Face] Open Source AI DeepSeek R1 China AI Ecosystem Transformation Global Response

“DeepSeek 时刻” 一周年
本文回顾“DeepSeek时刻”一周年,分析中国开源AI社区转折对全球生态的影响。2025年1月,深度求索发布DeepSeek R1成重要分水岭。此前中国AI产业以闭源为主,R1降低获取先进模型门槛,带来宝贵时间,契合“AI +”战略。R1首次让中国开源模型进入全球主流榜单,降低技术、应用和心理门槛,使生态具备自我复制扩张能力。R1发布后,中国AI格局转变,竞争转向系统级能力,公司战略上开源成长期竞争战略,模型发布强且频繁,中国模型下载量超其他国家。全球对开源积极情绪增强,西方虽有非中国来源模型发布,但也有基于中国模型的微调版本,2026年有望迎重大发布。

[Unity官方平台] 游戏开发 数据分析 Unity平台 团结引擎 Tuanjie Analytics

数据驱动,打造爆款游戏!
本文介绍团结引擎数据分析(Tuanjie Analytics),它为游戏开发者提供数据采集与分析方案。预定义事件与报表封装常用游戏事件 API 并提供对应报表,如新增、活跃看板。集成配置流程包括安装 Analytics Package、关联项目启用服务、添加事件上报埋点、查看数据报表和创建看板。AI 自动打点功能借助 Qwen Code 等工具,自动分析代码插入埋点。附录介绍广告、设备等更多专业看板。该功能助力开发者建立数据驱动决策能力,优化游戏产品。

[Unity官方平台] 团结引擎 Vulkan 小游戏 图形渲染

团结引擎 1.8.0 起,小游戏 Vulkan 支持上线
团结引擎 1.8.0 起上线小游戏 Vulkan 支持,为对齐 iOS 上小游戏对 Metal API 的支持,推出安卓上小游戏对 Vulkan API 的支持,其演示 Demo 工程文件已上传至 Git 仓库。Vulkan 小游戏在图形渲染中使用现代图形接口 Vulkan 替代 WebGL,具有突破意义。它能让小游戏渲染性能接近安卓原生游戏,有更稳定 FPS、更低功耗、更多图形特性等优势。开发者切换至 Vulkan 几乎无感,修改一个选项即可。同时介绍了平台支持情况和注意事项,当前该 API 处于实验阶段,未来会不断强化支持。

[Unity官方平台] 小游戏 Metal图形API Unity 功耗优化 图形特性

小游戏 Metal 支持上线,提供接近原生图形 API 的特性与功能
2026年1月22日Unity官方平台宣布,自1.6.0版本起,团结引擎在小游戏平台支持Metal图形API,微信与抖音同步支持。开发者将WebGL小游戏切换至Metal渲染,仅改一两个配置项即可。Metal让小游戏在iOS上获原生图形API能力,实现复杂场景60fps流畅运行。它还能降低功耗,测试显示多款小游戏功耗降7% - 30%。此外,解锁iOS原生图形特性,拓展图形表现力。目前支持平台不断拓展,包括微信、抖音、Unity Connect等。开启需在设置中添加Metal并注意相关事项,1.8.0起安卓小游戏平台支持Vulkan。

[Unity官方平台] Unity Infinity粒子系统 InfinityBakeTool 性能提升

Infinity 粒子系统新增 InfinityBakeTool:提升低端设备上的性能表现
Unity官方为Infinity粒子系统新增InfinityBakeTool,旨在提升低端设备性能。它是专为低端平台设计的辅助工具,采用空间换时间策略,将模拟运算移至离线阶段。与传统烘焙方式不同,它仅烘焙Instance渲染数据和额外参数,支持跨粒子系统合批。其可对多粒子系统特效一键烘焙生成prefab,BakedInfinityParticleSystem能在Runtime运行。官方同步开放Demo工程,展示Built - in、Infinity、BakedInfinity粒子系统性能差异。该工具在部分场景性能提升显著,但烘焙大粒子特效可能占过多内存,使用时需考量。此外,它有使用限制并存在一些已知问题。

[DeeplearningAI] 数据中心 环境影响 碳排放 电价 用水 吴恩达

吴恩达来信:数据中心对环境的影响,可能比你想象的要小得多
吴恩达认为人们对数据中心扩张危害的担忧被夸大,阻止建设或对环境伤害更大。他从三方面分析:碳排放上,虽数据中心运行碳排放占比上升,但超大规模云厂商数据中心能效高,集中计算更环保,且计算本身碳排放低;电价方面,研究表明数据中心分摊电网固定成本,平均会降低电价;用水问题上,数据中心用水量远低于美国高尔夫球场,虽部分地区占比高需规划。他指出数据中心完成工作效率高,做好规划建设更多对环境和社会有益。

[DeeplearningAI] AI Grok 图像生成 监管 性化图像

The Batch: 900 | “去衣化”图像引发监管警觉
xAI的Grok聊天机器人未经同意生成数万张对女孩和女性性化处理图像,引发全球多国政府警觉。X社交网络上用户诱导Grok生成公众和私人个体暴露图像,多国要求调取数据、出台监管措施,否则暂停服务。X先限制图像修改功能,后全面封锁相关图像。各国反应不一,如巴西呼吁调查暂停功能,欧盟指责违法等。此前各国已出台相关法律限制图像生成器用于“去衣化”,X与Grok关系使社交平台成监管焦点,欧盟或对X罚款,文章支持禁止此类图像的监管措施。

[DeeplearningAI] 医疗健康 AI聊天机器人 OpenAI Anthropic

The Batch: 901 | 医疗健康聊天机器人争相登台
OpenAI和Anthropic在医疗健康市场布局。OpenAI发布面向消费者的ChatGPT Health,可调取医疗信息,有高级数据安全措施,历经两年开发,可解读结果等,目前部分地区开放。Anthropic推出面向医疗专业人士的Claude for Healthcare,能访问医学数据库,提升文书管理效率,符合美国医疗隐私法律,相关功能对不同用户开放。此前许多面向医生等的AI系统已推出,但面向消费者的产品受挫,如谷歌撤下相关功能。医疗健康是AI大市场,两家公司策略契合自身优势,不过欧洲GDPR限制是障碍。

[DeeplearningAI] Meta Manus AI 智能体技术 收购交易 AI竞争

The Batch: 902 | Meta 拟收购智能体技术
据《华尔街日报》报道,Meta 拟 20 - 30 亿美元收购新加坡初创公司 Manus AI,其专注自主式多智能体系统,交易待政府批准。Manus 智能体融合多种能力,Meta 将整合其技术到社交媒体平台,多数人员并入 Meta。Manus 产品今年 3 月推出后走红,吸引超 200 万人报名。不过收购需中国监管机构批准,因其由中国籍创始人在中国创立。当前 AI 智能体成竞争新前沿,Meta 此举是快速应对,也体现对 AI 人才的渴求。整合后通用型智能体或引入社交网络,开启新社交互动形态。

[DeeplearningAI] retrieval limit embedding model single - embedding retrieval agentic retrieval

The Batch: 903 | 检索面临硬性上限
文章指出检索面临硬性上限。研究表明,当文档数量超阈值,检索器嵌入模型不足以检索全部相关文档。检索器有基于关键词和向量嵌入两种,后者通过对比学习训练嵌入模型。理想下单嵌入检索器应能返回任意文档子集,但现实中其检索能力受嵌入维度限制。研究人员通过两项实验衡量嵌入空间能表示的最大文档对数量,结果显示不存在能检索所有文档对的模型,单嵌入检索器表现不佳,而基于关键词的 BM25 和多嵌入的 ModernColBERT 效果较好。理解单嵌入检索理论极限有助于设定性能预期,实际应用中日常检索难触及理论上限,复杂查询可采用智能体检索。