阅鹿 Logo阅鹿
公众号聚合公众号聚合多主题导航多主题导航arXiv 精选arXiv 精选开发者周刊开发者周刊
登录注册
第 259 期

Anthropic和OpenAI同日发布,大模型还在狂奔吗?

2026.02.07

开发者周刊

第 260 期
2026.02.16
新年快乐&国产大模型崛起&企业研发AI自动化能力框架
第 259 期
2026.02.07
Anthropic和OpenAI同日发布,大模型还在狂奔吗?
第 258 期
2026.02.02
OpenClaw 才是真正的 AI 入口?
第 257 期
2026.01.26
Vibe Engineering & Skills & jQuery 4.0.0
第 256 期
2026.01.19
软件工程未来两年展望 & Web Almanac 2025
第 255 期
2026.01.12
CES 2026 & Agentic Coding 拆解
第 254 期
2026.01.05
FEDAY 2025 & Meta 收购 Manus
第 253 期
2025.12.29
The End of 2025 & A2UI
第 252 期
2025.12.22
又年底了,AI 啥样了 & State of AI
第 251 期
2025.12.15
React 再爆漏洞 & SPEC 会失败吗 & AutoGLM开源
第 250 期
2025.12.08
RSC 漏洞 & AI Code综述 & SEE Conf PPT
第 249 期
2025.12.01
Snapchat Valdi & AI时代的架构师 & Opus 4.5
第 248 期
2025.11.24
SEE Conf 2025&Gemini3时代
第 247 期
2025.11.17
GPT-5.1与文心5.0&国产编程模型
第 246 期
2025.11.10
2025乌镇峰会
第 245 期
2025.11.03
LongCat-Video发布&如何提升AI出码率
第 244 期
2025.10.27
活动多多的 1024&Vitest 4.0 is out!
第 243 期
2025.10.20
Announcing Vite+ & React Conf 2025
第 242 期
2025.10.13
React Foundation
第 241 期
2025.10.13
你追我赶的时代,太好了!
第 240 期
2025.09.29
Lynx HarmonyOS & 蚂蚁开源Neovate Code
第 239 期
2025.09.22
公众号 AI Feed
第 238 期
2025.09.15
Seedream4.0&小美&Apple发布
第 237 期
2025.09.08
当 Anthropic 禁止服务
第 236 期
2025.09.01
AI 下一站:新消费硬件
第 235 期
2025.08.25
AI 编程的失控风险 & DeepSeek V3.1
第 234 期
2025.08.18
开发者的十字路口
第 233 期
2025.08.11
世界机器人大会 & OpenAI 开源 & GPT5
第 232 期
2025.08.04
AI 时代重生系列
第 231 期
2025.07.28
WAIC 2025 & 扣子开源 & CodeBuddy
第 230 期
2025.07.21
当 Agent 满天飞,我们应该做些什么?
第 229 期
2025.07.14
Vercel+NuxtLabs & MCP安全问题
第 228 期
2025.07.07
Agent 百花齐放 & 上下文工程 & 成熟度模型
第 227 期
2025.06.30
预见 2049 & 目前AI最重要的影响
第 226 期
2025.06.23
prompt2code & Computer Use Agent
第 225 期
2025.06.16
人工智能 × 交互设计 & iOS 26 体验报告
第 224 期
2025.06.09
Cursor 1.0 & Windsurf Statement & php-node
第 223 期
2025.06.02
Prompt=代码 & MCP 蛮荒时代
第 222 期
2025.05.26
JS turns 30 & Google I_O & MS Build 2025
第 221 期
2025.05.19
浏览器里的 AI 革命
第 220 期
2025.05.12
前端开发AI实践 & Figma Config 2025
第 219 期
2025.04.28
Paper2Code & DeepWiki & 独立开发者项目鉴赏
第 218 期
2025.04.21
AI 在中后台实践 & 下半场
第 217 期
2025.04.14
AIBook、ADK、A2A and AI 50 2025
第 216 期
2025.04.07
Agents Are Quietly Transforming FE Development
第 215 期
2025.03.31
State of Vue.js Report 2025
第 214 期
2025.03.24
模型即产品 & 产品范式动摇
第 213 期
2025.03.17
TS重写选择Go & 第19届D2终端技术大会
第 212 期
2025.03.09
前端范式转移 & AGI 还很远
第 211 期
2025.03.03
AI & 低代码
第 210 期
2025.02.24
AI 引领变革 & 前端领域大模型
第 209 期
2025.02.17
Sunsetting CRA & 热文之解读DS
第 208 期
2025.02.10
应用提示词化&AI加速落地&原理学习
第 207 期
2025.01.20
年终总结和最新发布
第 206 期
2025.01.13
2024 JS Rising Stars & GUI Agents
第 205 期
2025.01.06
AI 24回顾&25展望
第 204 期
2024.12.30
2025年技术发展趋势&最后一期
第 203 期
2024.12.23
NPM 投毒 & 智能研发 2024
第 202 期
2024.12.16
Web Almanac 2024 & VSCode M11
第 201 期
2024.12.09
React v19 & Astro 5.0 & 蚂蚁体验技术日
第 200 期
2024.12.02
《生成式人工智能应用发展报告(2024)》
第 199 期
2024.11.25
2025年或将成为 AI Agent 爆发年
第 198 期
2024.11.18
百度世界大会 2024
第 197 期
2024.11.11
AI 普通人的机会
第 195 期
2024.10.28
State of Frontend 2024 & 1024 技术书单

相邻期数

上一期 258OpenClaw 才是真正的 AI 入口?
下一期 260新年快乐&国产大模型崛起&企业研发AI自动化能力框架

前端开发与工程化

[前端圈] Vite Vitest Rolldown Oxc 软件开发

Vite 生态系统 2026 年 1 月简报来啦!
VoidZero 2026年1月发布Vite生态简报,含品牌统一及项目进展。
这是 Vite 生态系统 2026 年 1 月简报。VoidZero 官方定期回顾 Vite+ 等进展,本月 VoidZero、Vite 等实现视觉品牌统一,包括官网、Logo 重塑和更新 Vite 启动模板。项目进展方面,Vite 总下载量破 30 亿,其 RSC 插件优化;Vitest 4.1 beta 版有新功能;Rolldown 进入 RC 阶段,有功能优化;Oxc 支持动态配置等。社区中,Vite 等在榜单排名不错,还有新工具发布,部分项目迁移代码格式化工具。

[W3C资讯] Web AI 前端开发 端侧推理 智能体 Web标准

[视频] 从端侧推理到智能体:Web AI的今天和明天
钱俊颖解读Web AI,分析趋势、优势、挑战及演进方向。
2026年2月3日消息,前端架构师钱俊颖在Web进化论2025年度大会解读Web AI。他梳理AI能力,分析运行在浏览器和本地设备的Web AI趋势,指出端侧Web AI在隐私保护等方面优势明显,浏览器集成AI能力可提升体验、降成本。不过端侧AI面临算力等挑战,需云端与本地协同。还讨论智能体在Web生态潜力,展望浏览器内建AI与API成标准演进方向,推动Web向智能应用平台发展。

[大淘宝技术] AI coding 全栈交付 Cursor 前端开发

【AI Coding】借助cursor实现业务需求全栈交付实践
大淘宝技术用户互动团队用Cursor完成红包签到页前端功能全栈交付。
文章记录了大淘宝技术用户互动团队借助Cursor完成红包签到页“单品返子玩法”前端功能全栈交付实践。先介绍AI coding背景和需求,核心是强化首页玩法引导。实践分五步:确定需求点、编写描述;用AI写方案并审核;AI生码搭建框架;自测完善样式、动画等功能,处理弹窗动画、Feeds插卡去重等问题;视觉验收和埋点。总结指出AI coding虽拓展技术边界,但需结合基础知识,还分享问题排查心得。

[搜狐技术产品] Flutter Android 字体裁剪 Skia FreeType

Flutter 在 Android 出现随机字体裁剪?其实是图层合并时的边界计算问题
文章聚焦Flutter在Android出现随机字体裁剪问题及规避建议。
文章聚焦 Flutter 在 Android 出现的随机字体裁剪问题。此问题在 issue #161721 中体现为 Text 被 Opacity 或 ShaderMask 包裹后字形上下被裁,主要在 Android 出现,与系统和字号相关。问题根源是 Layer 在 clip,SkTextBlob::bounds() 计算的 bounds 偏小。这与 saveLayer 有关,且 hinting 会使实际像素超出轮廓边界。虽 Flutter 有 Impeller,但文本渲染仍依赖 Skia,导致问题难修复。最后给出避开问题字号、减少 saveLayer 触发等规避建议。

[京东零售技术] Taro 5.0 跨端开发 前端开发 React

Taro 5.0:跨端架构演进与业务规模化落地实践
2026年Taro推出5.0实现“一码五端”统一开发并落地核心业务。
2026年Taro 5.0正式推出,实现“一码五端”统一开发,已在多个核心业务落地。其采用“WebOnNative”架构,三层架构体系各有职责,解决跨端开发难题。业务赋能方面,提供接近Web的开发体验,有丰富能力,性能媲美原生。配套工程含AI辅助初始化代码生成和工程发布平台。在全球售、订单等场景规模化落地,提升研发效能和性能。未来将在性能、开发、生态维度深化创新。

[前端充电宝] ESLint oxlint Biome 前端开发 代码检查工具

刚刚,ESLint 10 发布!但,尚能饭否?
ESLint 10.0发布但获得感不强,oxlint和Biome成替代选择。
2026年2月7日,ESLint 10.0发布。此次更新主要是‘清账’,如eslintrc退出、移除老API等,但使用者获得感不强。当前前端工具链发展快,大家开始探讨ESLint是否必要。尤雨溪团队的oxlint用Rust编写,速度比ESLint快50 - 100倍,内置规则多、迁移成本低,下载量持续上升;Biome想做统一前端工具链,耗时比传统ESLint + Prettier快20倍左右,规则和兼容性好。多数项目中oxlint和Biome可替代ESLint,ESLint不再是默认选择。

[iOS新知] Swift开发 iOS开发 编程坑点

这 7 个 Swift 坑,我全踩过一遍...
作者分享Swift开发中踩的7个坑及解决建议。
作者分享了自己在Swift开发中踩过的7个坑。一是if let套娃使代码难看,建议用可选链、三元运算符或guard let简化;二是闭包引用self易造成循环引用,要加[weak self];三是struct和class易混淆,struct是值类型,class是引用类型;四是@StateObject和@ObservedObject易用反,前者用于视图创建和拥有的对象,后者用于外部传入对象;五是不能在后台线程刷UI,要切回主线程;六是Model没实现Equatable会使视图疯狂重绘;七是List里的Model没加Identifiable,SwiftUI分不清对象,建议让Model遵循该协议。

[iOS新知] Swift 并发 Combine AsyncStream iOS开发

Swift 并发 vs Combine,到底该用哪个?看完不纠结
作者探讨Combine和Swift并发的AsyncStream适用场景并给出选择建议。
作者因项目重构纠结是否将 Combine 代码换成 Swift 并发,遂探讨 Combine 的 PassthroughSubject/CurrentValueSubject 和 Swift 并发的 AsyncStream 该何时使用。介绍 Combine 时,指出它是简单发布者,有线程自动处理、取消订阅管理、操作符多等优点。AsyncStream 需自己处理细节,文中给出其使用示例,还封装通用代码。虽 AsyncStream 遵循 AsyncSequence 有部分操作符,但与 Combine 相比,处理复杂数据流时功能不足。作者建议根据场景选择,复杂响应式场景用 Combine,简单发布订阅用 AsyncStream,很多项目也会混着用。

[支付宝体验科技] 支付宝 MYTab重构 KMP Compose UI 移动端开发

支付宝 MYTab 三端一码重构与性能攻坚实战
支付宝终端技术团队用KMP方案重构“我的”Tab实现三端一码并提升效能质量。
本文是支付宝终端技术团队对“我的”Tab进行“三端一码”重构与性能攻坚的实战分享。为应对移动端架构升级,团队选定KMP方案,在MYTab率先落地。重构难点在于迁移存量MVC代码到KMP体系。业务逻辑梳理时发现产品形态和视觉呈现代码深度耦合,设计模式重构采用Compose UI的“State驱动、强MVVM”范式。线上灰度遇到帧率下降和稳定性问题,通过开启高刷适配、治理过度重组、回滚实验逻辑、避免平台层接口访问等解决。MYTab达成“多端一码”目标,提升了研发效能和代码质量。未来,团队将继续打磨KMP框架,回馈业界。

[奇舞精选] AI开发 前端开发 提示词 工程化

如何让AI写出一个稳定的应用
360奇舞团分享让AI写出稳定应用的经验。
文章是360奇舞团前端工程师分享让AI写出稳定应用的经验。首先指出前端需转型,成为AI驱动的项目开发者。接着从两方面阐述:一是提示词,要明确输入输出、结构化描述需求,采用分层反向提示,避免一次性让AI做所有事,且多写边界情况;二是工程化,AI开发要过程可控、分步骤,增加模板限制AI发散,选择claude系模型,还提及开发中遇到的编写速度、上下文同步等问题及业界的解决办法,如claude code等agent产品。

[奇舞精选] 前端开发 rrweb 录制回放 前端技术

解决前端 “复现难”:rrweb 录制回放从入门到精通(上)
文章介绍了前端录制回放工具rrweb的应用价值、特性及使用方法。
文章聚焦前端录制回放工具rrweb,介绍其应用价值、特性及使用方法。前端开发常遇问题复现难,而rrweb能精准复现操作链路。它是轻量级、高保真、可扩展的Web页面录制与回放解决方案,由核心录制库、DOM快照处理库和回放组件库构成。与传统方案相比,具有轻量、高保真、可分析、高兼容等优势,还具备隐私保护、增量录制等特性。文章还详细介绍了rrweb的使用,包括依赖安装、状态管理、录制与回放功能实现,以及验证调试方法。高级功能方面,涵盖隐私保护、录制配置优化和数据管理,如输入掩码、元素屏蔽、采样率控制、数据下载上传等。

[阿里云云原生] 开源官网重构 AI开发 SEO优化 Hiress官网

Qoder+Skills,一个人一周完成开源官网重构
Qoder+Skills一人一周完成开源官网Higress重构。
文章介绍了用Qoder+Skills一人一周完成开源官网Higress重构的过程。Higress作为AI时代流量基础设施,旧官网存在产品孤岛、AI阅读障碍和能力短板等问题。升级后采用Astro 5和Starlight,实现技术栈换血、产品矩阵统一、用户引导分流等,还为AI阅读做专项优化。同时,用Skills补齐营销短板,如SEO、CRO优化。AI在设计稿转代码、资源清理、性能优化等方面发挥重要作用,但也会犯错,需人工审核。未来开发需深度编排AI能力,文末提供了相关资源和社区讨论途径。

[ByteDance Web Infra] Rspress 2.0 文档站工具 AI集成 性能提升

Rspress 2.0 发布:面向体验与 AI 的全新升级
ByteDance Web Infra发布Rspress 2.0,实现多方面升级
本文宣布 Rspress 2.0 正式发布。Rspress 是基于 Rsbuild 的静态站点生成器和文档站工具,1.x 版受开发者欢迎。2.0 版本聚焦文档站体验升级,有全新主题,提供多种定制方式,支持多语言;集成 llms.txt 生成和 SSG - MD 功能,便于 AI 理解;默认用 Shiki 编译时代码高亮;开启按需编译和持久化缓存提升性能;优化文档开发体验,如死链检查、文件代码块等。还介绍了与 Rslib 集成、新增官方插件等特性,以及从 1.x 迁移的注意事项,未来将推进生态集成和 AI 与文档的深度融合。

后端与云原生架构

[得物技术] 服务拆分 测试流程 灰度切量 得物技术

服务拆分之旅:测试过程全揭秘|得物技术
文章从测试视角复盘Bidding服务拆分与治理的过程、原则、目标、测试计划及进展。
文章从测试视角复盘Bidding服务拆分与治理。先指出Bidding服务存在核心链路未隔离、大单体等痛点,因此进行拆分。介绍服务拆分原则,如单一职责、高内聚低耦合等。Bidding服务拆成四个应用,分四期推进。目标是解决大单体问题、隔离核心链路等,收益有优化应用结构、提升开发效率等。测试计划含自测接口对比、测试功能回归等五道流程,还有各流量类型灰度切量方案。目前拆分接近尾声,流量迁移处第一阶段。

[腾讯云开发者] K8S命令 语音识别 Chaterm ASR热词表 LLM纠错

言出法随 -- Chaterm如何通过ASR精准操作K8S
Chaterm团队提出利用语音实现K8S命令精准操作的方案。
本文介绍了 Chaterm 团队利用语音实现 K8S 命令精准操作的方案。先指出现有移动端输入 K8S 命令效率低,传统 ASR 有识别问题,如专有名词识别不准、参数易丢失等。Chaterm 采用双层架构设计,通过客户端、网关、外部服务三层实现语音交互。具体包括实时语音采集、低延迟 ASR、LLM 语义纠错、终端人工确认。还阐述 ASR 热词表和 LLM 纠错原理,前者提升专业术语识别率,后者将自然语言等转为标准命令,并给出设计原则及多个纠错示例。最后给出实际案例,提及未来优化方向及 Chaterm 下载方式。

[phodal] AI应用架构治理 平台工程 能力原子化 LLMOps AgentOps

平台工程视角下的 AI 应用架构治理:从碎片化 AI 到规模化智能
文章从平台工程视角探讨AI应用架构治理的方法与挑战。
文章从平台工程视角探讨AI应用架构治理。AI进入企业常始于局部突破,绕过既有规范,早期有效,但项目增多后易失控。治理AI需明确治理对象,包括模型、智能体等。AI交付应从项目思维转向能力原子化,以避免系统脆弱。平台工程因需统一接入、编排和审计而成为核心,其核心组件AI网关可解耦资源。AI架构治理要建立生命周期管理,将其纳入工程约束。真正挑战是能否治理复杂系统。

[TesterHome社区] 容器安全 漏洞测试 长尾镜像 修复速度提升

容器安全测试预警:98%漏洞藏于长尾镜像,测试策略急需重构
Chainguard报告指出98%容器漏洞在长尾镜像并给出修复建议。
2026年1月31日,Chainguard报告指出98%的容器漏洞藏于长尾镜像,颠覆传统测试逻辑。热门镜像仅占1.37%却占近半拉取量,长尾镜像占超6成却成漏洞重灾区。报告给出修复时效标杆,强调合规测试,还从融入CI/CD、优化镜像等方面给出测试流程优化建议。此外,文章补充6类提升容器漏洞修复速度的方法,包括构建情报体系、标准化依赖、借助自动化工具等,核心是让漏洞早发现、修复低成本、验证高效率。

[快手技术] 快手 增量计算 数据处理 通用增量计算(GIC)

破解千亿数据处理痛点:快手增量计算如何解决时效、成本、运维三大难题?
快手数据平台团队与云器科技合作探索通用增量计算架构。
在数据驱动业务时代,快手日均处理千亿级数据,传统离线处理架构难满足需求。快手数据平台团队与云器科技合作探索通用增量计算(GIC)架构。实践从简单、中等、复杂场景验证目标,结果显示:简单和中等场景下,增量计算时效性好、资源开销低;复杂场景也有不错时效性,资源开销可按需调整。该架构能灵活平衡时效性和成本,提升数据处理稳定性。未来,快手计划业务上选关键业务试点迁移,技术上推动架构升级、优化能力并融合AI。

[阿里云云原生] OpenClaw SAE 弹性托管 数字员工 钉钉AI助理

打造云端数字员工:OpenClaw 的 SAE 弹性托管实践
OpenClaw开源项目采用阿里云SAE托管实践并介绍部署步骤。
本文围绕OpenClaw的SAE弹性托管实践展开。OpenClaw是开源项目,将AI从“对话框”升级为“智能代理”,其架构含交互、决策、执行子系统。选择阿里云SAE托管,是因其全功能容器环境与Serverless资源调度,可零门槛释放能力、实现弹性算力分配、保障服务高可用。文章给出部署配置步骤,如前置准备、应用部署、初始化配置、模型配置、沙箱设置、访问控制界面等。还介绍构建钉钉AI助理的步骤,包括创建应用、连接流,配置机器人等。

[阿里云云原生] 可观测数据采集 LoongCollector CDN 跨云传输 阿里云

告别高昂出站费用:LoongCollector + CDN 打造跨云低成本可观测数据实时采集链路
阿里云可观测团队设计LoongCollector+CDN跨云低成本采集方案。
在多云战略下,跨云数据传输成本高阻碍企业统一可观测性战略实施。阿里云可观测团队设计 LoongCollector + CDN 跨云低成本采集方案。现有纯公网、纯公网 + SLS 加速域名、跨云专线打通方案均有成本高、网络质量差、建设维护复杂等问题。新方案利用 CDN 价格优势和全球加速能力,以 CloudFront 为例,可将 10TB 数据传输成本节约 70%。介绍了整体架构、CloudFront 和 LoongCollector 详细配置,网络质量测试显示同地域下 CloudFront 与公网访问质量持平。该方案能降低成本、提升性能、易于实施和灵活扩展,LoongCollector 将持续提供跨云数据采集解决方案。

[阿里云云原生] OpenClaw Ingress NGINX迁移 Higress AI辅助开发

OpenClaw 在严肃场景下的实践:迁移 Ingress NGINX
作者为迁移退役的Ingress NGINX选择Higress,为OpenClaw配置迁移Skill完成生产迁移
Kubernetes官方声明Ingress NGINX将于2026年3月退役,作者需在限期内给出迁移方案。经对比,作者选择Higress,为OpenClaw配置迁移Skill。迁移时,OpenClaw先分析K8s集群现状,搭建Kind仿真环境,验证迁移兼容性,遇复杂逻辑自动开发WASM插件。验证通过后输出操作手册,作者依此在生产环境完成迁移,全程零报警、零回滚。作者认为仿真环境是安全网,AI是工具,好的Skill设计和有测试依据的操作手册很重要,有AI辅助,迁移验证可在一天内完成。

工程效率 & 工具链

[转转QA] 人工智能 售后测试 智能助手 Dify平台

AI赋能售后测试:从“黑盒”到“智能伙伴”
转转QA团队基于Dify平台构建售后业务智能助手。
文章介绍转转QA团队基于Dify平台构建售后业务智能助手,解决售后测试难题。售后系统如“黑盒”,存在逻辑理解难、数据构造繁、规则响应慢问题。智能助手聚焦三大场景,解决痛点。它能实时解答业务问题,为开发测试提供支持,服务内部团队和业务合作方。选用Dify是因其低门槛搭建、内置模块、扩展性强等优势。还介绍了智能助手搭建实现,包括多层AI节点协同工作,如参数提取器、Agent智能代理等。已实现售后单状态查询等场景演示,目前助手初步覆盖核心问答场景,后续将扩充知识库、优化分类等,推动流程自动化。

[数字生命卡兹克] OpenClaw AI助手 使用技巧

OpenClaw一战封神,给大家分享6种官方不会告诉你的神级技巧。
作者分享OpenClaw(Clawdbot)6种使用技巧。
文章于2026年2月4日发布,作者分享OpenClaw(Clawdbot)6种使用技巧。作者深度使用后,习惯用其代替OpenCode等。OpenClaw适配Mac体验更佳,作者测试后选Claude Opus 4.5为主力模型。6种技巧:一是本地文件管理,能找文件、整理报销发票、重命名文件、清理硬盘;二是个人知识库管理,可总结网页文章、项目、论文存备忘录;三是日程管理,借助Mac日历Skills自动识别微信截图建日历;四是自动化任务,可作定时器、监控器;五是大一统ChatBot入口,手机上可通过它使用画图等功能;六是桌面截图,能截电脑屏幕或网页。

[大转转FE] Mock数据 AI生成 前端开发 规则匹配 团队共享

基于 AI 生成高质量 Mock 数据的实践
某公司开发AI Mock工具解决前后端联调等问题并内部使用。
本文围绕基于AI生成高质量Mock数据展开介绍。前后端分离开发中,前端和测试常遇联调阻塞、场景覆盖难等问题,现有方案无法满足需求。介绍了Mock工具整体架构,包括ai_mock、mock-sdk和后端服务。详细阐述了核心实现:一是重写方法拦截请求,解决递归和只读属性问题;二是构建规则匹配引擎,支持多场景参数匹配;三是依据接口文档描述和字段名语义,用AI生成高质量数据;四是采用三层作用域管理数据,实现团队共享。还提及快速开始步骤、推荐工作流,该工具已在公司内部使用,未来计划有流量录制回放、基于真实数据生成、移动端支持和规则推荐等。

[字节跳动技术团队] 存储SDK AI Agent 火山引擎TOS 日志服务TLS

TOS Vectors + TLS Trace:打造更高效、更智能的存储 SDK 工厂
字节跳动技术团队借助AI Agent等将SDK研发转为自动化生成流水线。
火山引擎对象存储 TOS 为多种编程语言提供全栈 SDK 支持,但多语言架构和 OpenAPI 迭代使 SDK 维护繁杂。字节跳动技术团队借助 AI Agent、TOS 和日志服务 TLS,将人力研发转为自动化生成流水线。他们对比传统生成器,凸显 AI Agent 理解业务语义的优势;架构演进经多阶段优化,打造全自动虚拟工程团队。介绍核心组件协作机制和模块,如 SDK Agent 知识库用 TOS Vector Bucket 降本。评估反思机制确保质量,通过执行者 - 评估者架构和 TLS 动态观测保障系统稳定。效果评估显示代码生成质量高、节省人力,未来将拓展能力和覆盖边界。

[Datawhale] Claude Code 使用技巧 人工智能

Claude Code创始人再次公开:团队的10个使用技巧!
Claude Code团队公开Claude Code的10个使用技巧。
2026年2月,Claude Code创始人Boris Cherny在X上再次公开了Claude Code团队的10个使用技巧。包括并行处理更多任务,同时开启3 - 5个git worktree并行工作;复杂任务从Plan Mode开始;用心经营CLAUDE.md;创建专属Skill并复用;Claude可自主搞定大部分Bug,如处理Slack里的Bug讨论串、修复失败的CI测试等;还可提升Prompt技巧、进行终端与环境配置、使用子智能体、用Claude进行数据分析和学习等。

[与数据同行] 数据团队 年度计划 写作指南

数据团队年度计划:不是愿望清单,是一份“对赌协议”
数据团队年度计划写作指南建议列3个“主战役”并采用特定策略。
本文是数据团队年度计划写作指南。指出多数计划存在误区,老板只关心别出事、少花钱、能增长。建议计划只列3个“主战役”,选保命、提效、增量仗。写计划要风险前置,先讲不做的后果;绑定业务目标,让业务站台;将技术指标转化为业务结果;治理写成机制建立。要人要资源给老板选择题,标清项目砍掉后果,明确今年不做什么,把依赖列成老板拍板清单,让计划成集体承诺。

[AI大模型应用实践] AI编程 SDD 规范驱动开发 软件工程

AI 编程别光凭感觉:手把手实操 SDD,把 Vibe Coding 拉回工程轨道。
文章介绍了SDD(规范驱动开发),强调“规范先行”,让人定义规范、AI负责实现。
文章介绍了SDD(规范驱动开发),2025年“Vibe Coding”流行,AI快速产出代码,但项目规模扩大后有架构不一致、维护性差等问题。SDD把重心移到“定义规范”,让人负责规范、AI负责实现。其核心理念是“规范先行”,有Github SpecKit等工具。开发流程是规范、计划、实现、验证、反馈的闭环。文中还通过Spec Kit + Github Copilot实战演示,最后分析落地问题,包括三个强度等级、流程重塑、角色进化等,指出需提升规范工程能力,应对推行阻力。

[搜狐技术产品] 前端开发 Chrome扩展 埋点校验 MV3架构 Plasmo框架

从痛点到架构:用 Chrome DevTools Panel 做埋点校验,我是怎么落地的
作者团队开发了用Chrome DevTools Panel做的埋点校验工具zzChromeTools。
文章介绍了用 Chrome DevTools Panel 做埋点校验工具 zzChromeTools 的落地过程。前端埋点校验存在效率低、认知负荷高的问题,现有工具在该领域有局限性。开发中因 Chrome 推行 Manifest V3 面临诸多难点,如穿透隔离世界、解决 Service Worker 数据连续性及多上下文通信问题。业界方案也各有不足,作者采用主世界注入的 AOP 旁路捕获模式。该工具核心架构含主世界注入、旁路通信和数据持久化模块,利用 Plasmo 框架构建,采用轮询策略。它在时间、心理、资产维度有价值,还有其他前端提效小工具。未来计划升级持久化存储、全协议覆盖和集成自动化测试。

[蚂蚁技术AntTech] 支付宝 MYTab 三端一码重构 KMP ComposeUI

支付宝 MYTab 三端一码重构与性能攻坚实战
支付宝终端技术团队采用KMP完成MYTab三端一码重构并解决性能问题
本文为支付宝终端技术团队的悟桐分享的支付宝 MYTab 三端一码重构与性能攻坚实战经验。随着鸿蒙系统问世,团队选定 KMP 作为多端一码方案并在 MYTab 率先落地。重构中,业务逻辑迁移是难点,需将 Android、iOS 存量的 MVC 代码迁移至 KMP 的“State 驱动、强 MVVM 范式”体系。线上灰度时遇到帧率下降和稳定性问题,通过开启高刷新率适配、拆分巨型函数等解决帧率问题,回滚实验逻辑、避免平台层接口访问等解决稳定性问题。目前已达成“多端一码”目标,提升了研发效能和代码质量,但 KMP 仍需持续打磨,团队未来将扩大落地范围并回馈业界。

[搜狐技术产品] 国产规则引擎 LiteFlow 业务编排 EL语法

再见 if-else 地狱!这款国产规则引擎让业务编排效率提升 10 倍!!
文章推荐国产规则引擎LiteFlow以解决复杂业务逻辑耦合问题。
文章推荐国产规则引擎 LiteFlow,它能解决复杂业务逻辑耦合问题。传统业务系统存在改一处动全身、难以热变更、组件复用难等痛点。LiteFlow 以“工作台模式”将业务逻辑组件化拆分,用 EL 表达式编排。其核心功能丰富,如支持多脚本语言、热部署、可视化编排等,底层规则引擎升级带来性能提升。文章还介绍了快速上手步骤、使用场景、EL 规则语法,指出其不适合审批流转等场景,并与其他方案对比。它适合业务规则多变、步骤多且有并行需求的系统。

[TesterHome社区] CI/CD集成测试 Jenkins GitLab CI 测试流水线

测试质量进阶|核心技术与工具篇(7)CI/CD集成测试:Jenkins与GitLab CI的测试流水线搭建
TesterHome社区推出《测试质量进阶》系列文章聚焦CI/CD集成测试。
TesterHome社区推出《测试质量进阶》系列文章,此篇聚焦CI/CD集成测试。先介绍CI/CD核心价值,能实现测试自动化。接着阐述核心概念、优势,对比Jenkins和GitLab CI。Jenkins搭建含环境、插件安装等多步骤,提供详细脚本;GitLab CI需配置Runner、编写配置文件。还给出常见问题的解决方案。最后总结搭建要点与选型建议,为后续专项测试奠定基础。

[TesterHome社区] 软件测试 功能测试 深度实践 复杂场景 异常流程

测试质量进阶|专项测试实践篇(1)功能测试深度实践:复杂场景与异常流程覆盖
TesterHome社区推出《测试质量进阶》系列文章聚焦功能测试深度实践。
TesterHome社区推出《测试质量进阶》系列文章,本文聚焦功能测试深度实践。先阐述深度功能测试与基础测试区别,明确核心覆盖维度及价值。接着介绍前置准备,包括搭建多类型测试环境、复用工具并补充专用工具、设计复杂异常场景用例。全流程实操按复杂、异常、边界、回归测试顺序,结合工具实现自动化集成。最后进行结果管理,生成报告、管理用例和缺陷,从用例、工具、流程维度优化,建立复盘与常态化机制,降低线上故障风险,提升产品质量。

[前端充电宝] npm npmx.dev 前端界面 查包工具

npm 新网站来了?更快,更好看,更全面!
开源项目npmx.dev推出第三方前端界面,优化npm包查询体验。
文章介绍了开源项目npmx.dev,它并非新包管理器或镜像站,而是第三方前端界面。该界面速度极快,搜索即时,配合无限滚动基本秒出结果;布局清晰,将开发者关心的版本历史、依赖树等信息清晰展示,还能内置源码预览,降低调研成本。其细节设计贴心,有原生暗色模式、全键盘支持、安全预警,还可无缝迁移。虽未用新技术,但把查npm包小事做到优雅快速。

[TRAE.ai] 产品经理 TRAE 工作流重构 AI工具

不止是写代码|产品经理如何用 TRAE 重构工作流
B端产品经理李恒分享用TRAE重构工作流的方法与应用。
本文由B端产品经理李恒分享,介绍如何用TRAE重构工作流。首先强调TRAE是高效“想法翻译器”,协作要“小步快跑”。接着通过三个场景展示其应用:需求迭代中,其替代传统工具,效率提升4倍;0 - 1项目验证里,让产品经理掌控技术方案;文档编写时,能快速完成结构化和可视化,效率提升2倍。最后总结使用技巧,如页面还原、细节微调等方法,还给出TRAE和MCP配置指南及资源占位建议。

[TRAE.ai] 软件开发 业务缺陷检测 Agent Skills TRAE

不止是写代码|研发如何用 Skills 驱动业务缺陷检测
文章围绕研发用Skills驱动业务缺陷检测展开,通过SOLO模式和自定义Agent Skills提升检测效率。
文章围绕研发如何用 Skills 驱动业务缺陷检测展开。先明确缺陷分通用和业务两类,传统工具对业务缺陷检测无力,而当前质量平台与 IDE 脱节。通过 SOLO 模式和自定义 Agent Skills 探索,将质量检测能力拆分为原子化技能,在 IDE 内编排 5 个 Agent Skill 实现业务缺陷检测链路自动化,实战数据显示提升了研发质量意识与缺陷拦截效率。还以“消息夜间防打扰”功能为例,展示了包括建立全局认知、提炼需求、对齐规则、锁定变更范围和裁决缺陷在内的串行检测流程,最后强调该模式开启了人与 Agent 协同进化的研发范式。

[阿里云开发者] AI编程 SDD 研发范式 人机协作

AI 原生研发范式:从“代码中心”到“文档驱动”的演进
文章阐述AI原生研发范式中从“代码中心”到“文档驱动”的演进及SDD方法。
文章围绕AI原生研发范式中从“代码中心”到“文档驱动”的演进展开。先指出AI编程时代面临上下文腐烂、审查瘫痪、维护断层等“工程失序”问题,引出SDD(规范驱动开发)方法。介绍SDD核心理念,它以文档为AI间“通信协议”,有解决上下文丢失等五大收益。阐述程序员实操SOP的RIPER工作流及旁路流程LAFR,通过用户积分系统签到功能展示端到端闭环实战。还提及团队协作SOP,构建“文档即接口”协议,实现去噪音化协作。强调积累Prompt知识作为资产沉淀,提出数据安全分级等风险防范措施,最后解答常见问题并点明SDD是时代趋势。

[货拉拉技术] 货拉拉 UI自动化测试 AI自愈 移动端测试

货拉拉UI自动化新范式:从人工维护到AI自愈
货拉拉引入AI自愈构建UI自动化测试新范式
货拉拉技术团队为降低移动端测试工作量,曾建立UI录制回放和多机同步两条提效路径,但面临自动化需人工维护、新功能靠人工驱动的问题。传统UI自动化测试有脚本维护和执行稳定性困境,团队引入AI自愈能力,构建智能闭环体系。该体系架构多层设计,通过五步诊断法精准定位问题。弹窗智能处理引擎构建特征认知体系,页面变化智能感知引擎结合控件画像感知与修复。实践效果显著,脚本通过率提升,节省人力。未来,AI自愈能力将向智能生成用例、赋能其他智能体、降低成本方向演进。

系统性能与底层优化

[Unity官方平台] 游戏开发 性能优化 Unity引擎 微信小游戏

《永远的蔚蓝星球》小游戏性能优化实战
诗悦网络星辰工作室分享《永远的蔚蓝星球》微信小游戏性能优化实战。
2026年1月24日,诗悦网络星辰工作室黎其桂分享《永远的蔚蓝星球》微信小游戏性能优化实战。该游戏上线后成绩出色,优化工作主要针对微信平台局限在多方面开展。包体优化通过清理模块、裁减代码、优化Lua封装等,并用工具校验。代码分包采用工具辅助管理,使首包占比约30%。大量同屏元素处理上,用GPU序列帧、GPU粒子和怪物GPU动画优化。飘字优化使用CBuffer传递信息。团结引擎优化带来约100MB内存下降且减少闪退率,iOS平台用Metal渲染后端降低功耗。

[转转技术] CDN 视频带宽 FFmpeg MP4文件 流媒体格式

一条命令让CDN视频带宽成本降低90%!!!
作者分析并解决了CDN视频带宽消耗异常问题。
文章讲述了CDN视频带宽消耗异常的问题及解决办法。作者先定位到问题流量来自几个MP4视频,验证发现播放视频会产生大量206请求和高额流量。经探究MP4文件结构、浏览器播放流程、源码分析和测试验证,得知问题源于moov box在文件末尾和视频文件交错不良。使用ffmpeg处理视频可重新编排音视频位置解决问题。最后总结,短视频用FFmpeg处理,长视频采用HLS等流媒体格式。

[小红书技术REDtech] 小红书 MySQL内核 RedSQL 数据库优化 数据一致性

支撑亿级流量:小红书 2025 MySQL 内核做了哪些关键改造?
小红书2025年启动自研MySQL内核RedSQL建设并完成0-1部署。
2025年小红书启动自研版本MySQL内核RedSQL建设,已完成0-1的建设,内部完成80%以上部署。其核心挑战包括难以支撑高脉冲流量、核心业务RPO=0诉求、大表加字段耗时久、流量突增时稳定性不足。为此,形成三个解决方案:一是合并秒杀,通过缓存可见性、行锁优化等技术提升性能,支撑高并发秒杀等业务;二是依托自研Binlog Server和ORC高可用组件,实现300MB/s+高速复制和RPO=0,解决多项技术问题;三是实现秒级加列,将元数据与物理存储解耦,解决读写问题,使加列从周级缩至分甚至秒级。此外,还有CCL精准限流、SQL语法扩展、BP并行加载等优化。

[腾讯云开发者] Go语言 C++重构 系统优化 游戏服务

用Go重构C++老系统,一次降本82%的极致之旅
腾讯云陈颀玮用Go重构QQ游戏C++系统,降本82%并提升稳定性。
本文讲述腾讯云开发者陈颀玮用Go重构QQ游戏生态中C++老系统的过程与成果。重构前,系统基于C++同步直写架构,资源利用率低、CAS碰撞惨烈。重构核心是引入Kafka分区机制,将并发写变为串行写。代码重构方面,Go解决了CAS噩梦,在数据结构操作和合并策略上更优。成果显著,资源成本降82%,稳定性提升,告警与监控能力增强,还能实现精细化运营。

[GSYTech] Flutter Android 字体裁剪 Skia FreeType

Flutter 在 Android 出现随机字体裁剪?其实是图层合并时的边界计算问题
Flutter在Android出现随机字体裁剪问题,给出规避方法。
文章围绕 Flutter 在 Android 出现随机字体裁剪问题展开。介绍 issue #161721 下的问题表现,即 Text 被特定控件包裹后字体被裁,该问题与系统、字号有关。指出问题出在图层合并时边界计算,因 SkTextBlob::bounds() 偏小,Opacity 的 layer clip 切掉溢出像素,本质是 Skia 在 FreeType 后端使用的 glyph bounds 不能代表真实像素覆盖范围。虽 Flutter 有 Impeller 渲染后端,但文本 bounds 仍由 Skia/FreeType 计算。修复此 Bug 复杂度高,最后给出避开问题字号、减少 saveLayer 触发等规避方法。

[GSYTech] 小米 HyperOS 4 Rust Flutter 系统更新

详细揭秘 小米 HyperOS 4 大变样:核心应用以 Rust / Flutter 重写,不兼容老系统
小米将发布HyperOS 4以移除旧架构提升系统稳定性。
2026年2月5日消息,xiaomi time称HyperOS 4将是小米最稳定的更新。从HyperOS 3.1起,小米分阶段弃用旧版代码架构,移除部分系统模块的MIUI SDK,HyperOS 4将彻底移除向后兼容层,消除冗余调用和依赖链。系统核心应用以Flutter和Rust重写,在HyperOS 3.1试点,4旨在统一UI渲染和逻辑稳定性,取代旧架构。新应用不兼容旧系统,入门级和中端设备在HyperOS 4性能提升更显著。有人猜测这是为跨平台产品及独立系统布局,影响待官方发布后确定。

[大淘宝技术] 大文件处理 性能优化 Java C++ Rust

一次大文件处理性能优化实录
营销交易技术团队优化4GB文件处理性能至3.2秒并提出新架构。
营销交易技术团队对4GB大文件进行“删除每行中间1/3内容”操作并优化性能。受内存限制,采用双进程流式处理。围绕减少系统调用等四大主线,展示从初始637秒(Java)到最终3.2秒(新架构)的过程。介绍通用优化策略,对比不同语言优化过程,如Java用批量处理、字节操作;C++原地修改、用原生系统调用;Rust用字节切片、零分配行处理。总结优化原理、优先级,提出新的IO+Processor进程架构,优势是解耦、利用多核、契合优化原则。

[阿里云开发者] 阿里云 宕机智能诊断 Linux系统 AI技术

宕机智能诊断利器来了,助你告别 Linux 宕机分析“三座大山”
阿里云推出Linux宕机智能诊断功能,解决传统运维难题。
文章指出Linux系统突发宕机是运维难题,传统分析有“三座大山”:日志难理解、VMCORE分析耗时费力、找补丁困难。阿里云操作系统控制台的宕机智能诊断功能基于大模型技术,有三大核心能力:智能日志解析,自动提取关键信息;专项诊断,针对不同内核问题精准分析;智能补丁匹配,利用混合向量检索技术推荐补丁。以Hardlockup死锁问题为例,该功能几分钟完成分析推荐,降低成本。它支持部分主流Linux发行版,可通过SysOM MCP或直接调用OpenAPI接口使用。

[AndroidPub] Kotlin Multiplatform KMP编译 Android iOS

揭秘 KMP 编译魔法:同一份 Kotlin 代码是如何在 Android 和 iOS 上原生运行的?
文章揭秘Kotlin Multiplatform跨平台编译底层逻辑
文章揭秘了KMP编译魔法,即同一份Kotlin代码在Android和iOS上原生运行的原理。先介绍核心心智模型,即一份共享Kotlin代码经不同编译器编译成对应平台代码。接着阐述编译管线,前端生成中间表示,后端分别处理,在Android生成DEX字节码,在iOS生成原生机器码。还介绍了expect/actual机制处理平台差异,以及Kotlin/Native内存管理变革。说明了Kotlin与Swift/Objective - C互操作、.klib文件作用。最后讲了工程实践链路、常见问题及建议,指出KMP是编译期生成的硬核科技,实现业务与平台、编译前后端分离。

大模型 & AIGC 前沿

[梯度不陡] 大语言模型 多智能体系统 商业谈判 基准测试 AgenticPay

AgenticPay:用自然语言谈生意,大模型议价能力全面测评
伯克利团队发布AgenticPay基准测试,测评大模型议价能力。
伯克利团队发布AgenticPay基准测试,测评大模型议价能力。它是首个语言驱动的多智能体交易测评框架,构建可扩展语言驱动市场仿真环境,含环境、任务、智能体三大组件,采用三维评估体系。实验显示,顶级模型如Claude Opus 4.5等表现优异,达成率100%;开源模型如Llama - 3.1 - 8B严重落后,超时率高。所有模型存在卖方优势、金融资产谈判薄弱、接近成功时缺乏战略耐心等问题。研究给出启示,指出应用场景,也提及安全伦理考量和下一步研究方向。

[智东西] 人工智能 AI社交网络 Moltbook OpenClaw

改写AI历史的魔幻周末:154万Agent疯狂社交,赛博诈骗横行,大牛API密钥被盗
AI社交网络Moltbook用户激增后曝数据库裸奔等问题,卡帕西回应肯定其潜力。
智东西2月2日报道,AI社交网络Moltbook用户5天破154万,可能是史上增长最快的社交网络之一。这里用户是AI Agent,人类只能旁观。周末Moltbook口碑反转,从被盛赞到被曝数据库“裸奔”、账号被盗、诈骗、数据造假等问题。其走红围绕OpenClaw框架展开,上线两天用户超120万,有惊人“社会化行为”,但也逐渐失控,出现诈骗、软文等。科技圈人士质疑平台,如注册数据易造假、网站安全性低。卡帕西发文回应,肯定其是最大的Agent共享记忆平台,强调Agent网络潜力大。Moltbook虽有问题,但也让人思考AI在未来社会的角色与边界。

[DAMO开发者矩阵] 人工智能 自然语言处理 奖励模型 GRAM - R²

AAAI'26 Oral|从黑盒打分到显式推理,详解自训练奖励模型 GRAM-R²
东北大学等团队分享GRAM-R²,提升奖励模型推理能力。
2026年AAAI预讲会上,东北大学自然语言处理实验室、小牛翻译团队王成龙博士与微信AI团队分享成果GRAM - R²。当前奖励模型面临数据瓶颈且缺乏显式推理,GRAM - R²通过两个阶段让模型学会推理:先用少量标注数据训练PPM逆向生成逻辑依据,初步训练基础模型;再对无标注数据打标、合成理由并滚动训练。多基准评测显示,它参数效率高、多任务能力强、领域适配性好且有良好可扩展性,有望成可解释对齐工具。

[黑夜路人技术] AI软件开发 大模型 AI编程工具 AI实战开发

【原创】万字长文介绍 AI 软件开发全链路实战
文章介绍AI软件开发全链路实战,涵盖模型、工具搭建、IDE、开发案例及程序员发展方向。
文章围绕AI软件开发全链路实战展开。先介绍大模型,包括物理本质、运行过程、参数量与能力、算力经济学、上下文窗口等知识。接着展示全球模型军备图谱,涵盖国际和国内梯队、模型排名及选择决策。然后说明工具搭建,如硬件环境、包管理器、本地模型运行时等。再介绍AI - Native IDE,对比各工具特点与选择。之后给出实战开发过程案例,如环境搭建、遗留项目分析、功能开发。还提出AI编程“八荣八耻”规则及固化方法。最后点明新时代程序员分超级个体和被淘汰者,给出行动清单,鼓励成为AI - Native开发者。

[软件工程3.0时代] 人工智能 AI工具 创业者讨论 自我进化 IM入口

从Clawdbot到OpenClaw:130位创业者齐喊:"这一次,狼可能真的来了"
创业者讨论OpenClaw透露AI发展信号及面临的安全和市场问题。
2026年2月4日,130多位不同赛道创业者围绕Clawdbot(现OpenClaw)展开讨论,透露出多个关键信号。AI开始自我迭代,IM成新操作系统入口,AI与AI互动提升效率,Apps向Skills转变,Memory是Agent进化关键,但OpenClaw也面临安全短板,且大众市场尚未广泛触及。讨论还提出端侧与云端新平衡思路,创业者需思考在新范式中的定位。

[CourseAI] nanobot AI自动化 模块化设计

港大nanobot4,000行代码复刻Clawdbot
港大nanobot复刻Clawdbot解决AI从被动回答到主动服务问题
2026年2月3日消息,港大nanobot用4000行代码复刻Clawdbot,解决AI从“被动回答”到“主动服务”的问题。其核心架构是永不停歇的消息循环,LLM决定用工具,最多循环20次完成任务。有三大主动触发机制:Cron定时任务、心跳服务、子Agent。采用模块化设计,如工具、技能、内存等系统。坚持文件即配置、队列解耦等原则,让AI成为自动化助手,项目开源在GitHub。

[CourseAI] OCR GLM - OCR 人工智能 自然语言处理

智普入局OCR! GLM-OCR 0.9B 也杀进来了~
智普推出GLM-OCR 0.9B,功能丰富且采用创新架构与训练机制并开源。
2026年2月4日消息,智普入局OCR领域,推出GLM - OCR 0.9B。当下OCR任务中,小参数模型在大量训练数据加持下,颠覆了传统CNN架构。GLM - OCR功能丰富,可进行文本识别,支持多种输入与特殊文字识别;能精准解析复杂表格并输出HTML代码;可从卡证等提取信息输出JSON格式;还支持批量解析。其采用‘视觉编码器→跨模态连接层→语言解码器’架构,视觉编码器为CogViT,跨模态连接层轻量级桥接,语言解码器是GLM - 0.5B。此外有两阶段流水线和创新训练机制,代码开源。

[腾讯设计族] 人工智能 设计 营销 OpenClaw Claude Skills Kimi 2.5

[A's周刊17] 控制与权限
腾讯设计族周刊涵盖科技(OpenClaw、Claude、Kimi 2.5等)与设计(爱马仕、东京TDC等)领域动态。
这是腾讯设计族发布的周刊,涵盖科技与设计领域动态。科技方面,OpenClaw更名后爆火致Mac Mini断货,其是有高权限的个人AI助理,还推出“AI Only”社交平台Moltbook,更接近「零员工公司」所需能力;Claude推出Skills功能,将AI推向专业执行;月之暗面发布Kimi 2.5,在多项指标上表现领先。设计方面,爱马仕开展“远航之召”新年营销活动;东京TDC字体设计赏揭晓;丹麦女子足球联赛推出新视觉形象和品牌推广方案。

[数字生命卡兹克] Clawdbot QQ机器人 云服务器部署 AI教程

有手就行,5分钟教会你在QQ上玩转全网爆火的Clawdbot。
文章作者推出用云服务器结合QQ使用Clawdbot的低门槛教程。
文章围绕如何在QQ上玩转Clawdbot(现名OpenClaw)展开。因该机器人主动性强、有数据风险,推荐用云服务器结合手机QQ使用。作者先介绍Clawdbot热度,此前本地部署加飞书打通的教程受关注,此次推出云服务器加QQ的低门槛教程。接着详细说明操作步骤:一是上云部署,用QQ推荐腾讯云,也介绍火山引擎价格,以腾讯云为例说明购买、实名认证、配置模型(建议用Kimi k2.5且注意版本对应);二是在QQ创建机器人,需先注册QQ开放平台账号,完成认证后创建机器人,添加成员,配置IP,获取并保存AppID和AppSecret,最后在腾讯云服务器配置相关信息,完成后即可在QQ与机器人畅快交流。

[数字生命卡兹克] AI 计算机视觉 色盲测试 信息组织

AI看不懂的色盲测试背后,藏着一场像素与诗意的战争。
作者发现多数AI模型色盲测试表现不佳,因缺乏人类视觉的整体理解能力。
作者与同事闲聊时让AI做色盲测试,发现多数模型表现不佳,唯一答对的GPT 5.2 Thinking还靠代码作弊。作者深入研究后找到相关论文,指出现在的AI是在计算世界,无法像人类一样理解像素和模式组合后的整体意义。论文通过图灵视力测试验证,绝大多数顶级多模态大模型在色盲测试等任务中表现差。使用Grad - CAM技术发现,AI看图方式存在缺陷,是“先切碎,再拼凑”,对局部敏感,对整体迟钝。相比之下,人类视觉是主动且懂得取舍的。AI并非真正的色盲,更像有“注意力缺失症”,缺乏高效的信息组织方式。此外,AI常答“74”是因参考了维基百科上石原色盲测试标准图的答案。

[机器学习AI算法工程] seekdb AI原生数据库 智能搜书应用 AI开发

基于seekdb,教你从零开始构建智能搜书应用
OceanBase开源AI原生数据库seekdb,可作AI统一数据底座。
本文围绕OceanBase开源的AI原生数据库seekdb展开。先介绍seekdb是为AI应用打造的混合搜索引擎,能统一处理多种数据,其优势在于开箱即用、统一存储与检索、兼容AI场景。作者上手体验全流程顺畅,零门槛零负担。seekdb可作为AI时代的“统一数据底座”,重新定义AI应用数据层。使用门槛低,有本地RAG/个人知识库、构建AI Agent长期记忆、多模态RAG三种玩法。最后给出基于seekdb实现智能搜书应用的教程,包括数据导入、运用三种搜索能力及索引优化等内容。

[数字生命卡兹克] 可灵3.0 AI视频 分镜能力 语言能力 可灵3.0 Omni

实测可灵3.0 - 属于每个人的AI导演时代。
可灵升级至3.0,提升视频模型能力,新增分镜和语言特殊能力。
2026年2月,可灵从2世代跨越到3世代,升级成可灵3.0。作者提前内测,认为它将视频模型能力带到新高度。其升级除画质和质量提升外,还有分镜和语言两种特殊能力。分镜能力方面,可选择3 - 15秒视频并规定分镜数量和时长,有智能和自定义分镜,还解决了正反打镜头难题,可用于制作视频demo或用故事板控制出视频。语言能力方面,能让多人分开说多种语言,可生成邪修背单词视频,还能与分镜能力结合。此外,Omni模型从可灵O1升级到可灵3.0 Omni,主打改视频。两者基本可包揽90%视频生成场景,未来有望提升AI视频生产力,带来创作盛世。

[数字生命卡兹克] 人工智能 AI模型 Claude Opus 4.6 GPT-5.3 Codex

中门对狙!Claude Opus 4.6和GPT-5.3 Codex同时发布,这下真的AI春晚了。
Anthropic和OpenAI同日发布Claude Opus 4.6与GPT-5.3 Codex新模型。
2026年2月6日凌晨,Anthropic的Claude Opus 4.6和OpenAI的GPT-5.3 Codex同时发布。Claude Opus 4.6跑分表现出色,在多项评估中领先,还具备1M token上下文窗口、输出上限提升、上下文压缩等实用功能,Agent Teams功能让其工作更高效,且已全面上线,API价格有额外定价规则。GPT-5.3 Codex开发中AI参与自身开发,跑分虽与Claude Opus 4.6基准有差异,但含金量足,开发方面或更强,还能自主做出完整可玩游戏,运行速度大幅提升。两家头部AI公司同日发布新模型,行业竞争激烈,传统SaaS公司面临压力。

[得物技术] 大模型网关 得物技术 人工智能 成本管控 模型调度

大模型网关:大模型时代的智能交通枢纽|得物技术
得物构建大模型网关以应对AI部署挑战并实现技术突破。
本文介绍了得物大模型网关。大模型时代企业AI应用面临多LLM适配等挑战,大模型网关可管控AI流量。得物自建网关是因AI部署遇资源、成本、安全和稳定方面挑战。市场有多元网关方案,得物构建网关分六步:打造模型市场统一选型,统一业务模型入口,建设成本管控体系,夯实稳定性架构,实现分钟级观测,管理Key生命周期。其有成本管控等技术突破,使用后平台搭建、模型纳管完善,接入效率提升,节省成本。未来将向AI网关演进,承担成本管控,兼容多模型,发展为AI编排平台。

[Hugging Face] 人工智能 科学多模态模型 Intern-S1-Pro 上海人工智能实验室

社区供稿丨迈向AI4S 2.0,上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
上海人工智能实验室开源万亿参数科学多模态大模型Intern-S1-Pro。
2月4日,上海人工智能实验室开源万亿参数科学多模态大模型Intern-S1-Pro。它是全球开源社区参数规模最大的科学多模态模型,核心能力跃升,评测居国际领先。其基于SAGE架构和混合专家架构,通过技术创新突破训练瓶颈。它验证了自主技术链路,降低科研门槛。在底层架构上,通过傅里叶位置编码等创新提升感知,革新路由机制解决训练痛点。该模型科学能力进化,通用能力协同发展,智能体能力进步。还构建了‘算力 - 算法’一体化基座,提升训练效率。上海AI实验室已有丰富书生大模型家族和开源工具体系,未来将持续开源。

[Hugging Face] MiniCPM - o 4.5 全模态模型 开源 OpenBMB开源社区

社区供稿丨MiniCPM-o 4.5开源:「眼耳口」并用,模型交互从「一问一答」变为「即时自由对话」
OpenBMB开源社区开源新一代全模态旗舰模型MiniCPM-o 4.5。
2026年2月6日,OpenBMB开源社区开源新一代全模态旗舰模型MiniCPM - o 4.5。它是原生全双工全模态大模型,能“边看、边听、主动说”,实现“即时自由对话”。该模型已在多平台开源,结合llama.cpp - omni框架使部署更优,在6款芯片上推理性能提升,还提供免部署线上体验版。其亮点有刷新端侧全模态能力上限、开启全时感知、升级为即时自由对话、语音自然饱满等。它采用端到端全模态架构,有全双工多模态实时流等机制,可通过多种方式部署使用。

[ScienceAI] Scaling Law AI科研 SLDBench SLDAgent

让AI自己发现Scaling Law!北大斯坦福联手打造「AI科学家」,预测精度超越人类专家
北大、斯坦福等团队提出Scaling Law Discovery并被ICLR 2026接收。
北大、斯坦福等团队提出开创性工作Scaling Law Discovery (SLD),其成果被ICLR 2026接收。Scaling Law是AI领域重要工具,但发现过程艰难,人工试错成发展瓶颈。为此团队构建含5000多个真实实验的基准测试SLDBench,提出基于进化算法的智能体框架SLDAgent,实现公式和优化算法共进化。实验显示,SLDAgent在预测精度和外推能力上超越人类专家,能发现简洁且具物理意义的定律,还能推导最优超参数闭式解。该研究为评估AI科研能力提供新视角。

[PaperAgent] 人工智能 强化学习 TTT - Discover 英伟达 斯坦福

测试时也能RL,英伟达等提出全新范式:TTT-Discover
斯坦福、英伟达等联合提出并开源TTT-Discover测试时范式。
近日,斯坦福、英伟达、Together AI等联合提出并开源全新测试时范式TTT - Discover。它在测试阶段用强化学习微调模型以刷出最佳结果,花费几百美元,用开源的gpt - oss - 120b就刷新多个领域SOTA。作者将单测试问题化为MDP,把“发现新SOTA”变为“刷最高分”,并对传统RL做两个改动,包括目标函数和探索策略。实验显示其在多领域提交即夺冠,消融实验表明“Entropic + PUCT”组合效果最佳。该范式将测试集变为训练场,证明应让模型在关键时刻继续学习。

[PaperAgent] xMemory Agent记忆 RAG 人工智能 自然语言处理

不止是RAG变体!xMemory重新定义Agent该如何记住和回忆
伦敦国王学院团队提出xMemory改进智能体长程对话记忆。
2026年,伦敦国王学院团队提出xMemory,改进智能体长程对话记忆。RAG在Agent场景有「水土不服」问题,如检索易出现冗余、剪枝会破坏推理链。xMemory采用「拆-聚-检」三步策略。拆是建立四级层级,聚用稀疏 - 语义目标函数优化主题,检使用自顶向下检索和不确定性闸门精准召回。实验表明,xMemory能减少Token使用、提升分数,跨不同LLM趋势一致。消融实验显示各部分相互补充。最后给出实战建议,并提到xMemory代码已放出,未来将支持多模态和联邦隐私版本。

[人人都是产品经理] AI应用 产品设计 业务闭环 普通人机会

AI能帮你点奶茶了,但真正改变的不是技术进步
大厂将AI升级为交易入口演练“AI办事”能力。
本文从作者用AI点奶茶的经历切入,指出大厂将AI从聊天工具升级为交易入口,这是对“AI办事”能力的演练。低风险的奶茶场景适合做试验,能训练用户把操作权交给AI。未来AI产品竞争力在于形成业务闭环,大厂有数据和业务链路优势。对普通人而言,机会在于做垂直场景的AI代理人,把AI嵌入场景形成流程或闭环。未来赚钱核心从内容能力转向流程能力,自媒体人要争取被AI推荐。普通人应提前升级能力结构,抓住AI带来的机会。

[PaperAgent] 人工智能 机器学习与深度学习 参数高效微调 TinyLoRA Qwen

13个参数,让Qwen学会推理,没错,不是13B!
Meta提出TinyLoRA方法,仅用13参数微调Qwen2.5-7B数学推理准确率达91%。
Meta提出TinyLoRA方法,仅用13个参数微调Qwen2.5 - 7B,在GSM8K数学推理任务达91%准确率,此效果仅在RL下实现,SFT需100到1000倍更大更新量。传统参数高效微调方法需大量参数,作者受RL与SFT区别启发探索极限。TinyLoRA通过特定公式突破参数下限。实验显示,RL比SFT参数效率高,模型越大达相同性能所需参数量越少,在高难度数学基准测试表现良好。低参数下,FP32精度和Tiled共享策略更好,Qwen在超低参数区域表现远超LLaMA - 3。从信息论视角解释,RL信号稀疏干净,允许用极少参数调整策略。

[火山引擎开发者社区] OpenClaw 飞书分析 Moltbook 火山方舟 AI应用

OpenClaw + 飞书分析Moltbook 150万 Agents 每天都在聊什么
OpenClaw可借助火山方舟模型分析Moltbook网站帖子生成文档。
本文介绍 OpenClaw 与飞书分析 Moltbook 相关内容。先展示使用火山方舟 Coding Plan Kimi K2.5 模型实现的效果,在飞书给 OpenClaw Agent 发送消息,分析 Moltbook.com 网站帖子,生成文档。OpenClaw 受关注,有观点称其可能是第二个 ChatGPT 时刻,Moltbook 3 天突破 100W 用户量。还给出 5 分钟完整版安装教程,包括 OpenClaw 软件安装和配置、方舟大模型配置、飞书聊天和文档配置等内容。

[腾讯云开发者] OpenClaw Skills 腾讯云 AI开发

王炸组合!OpenClaw+Skills可以做什么?
腾讯云轻量云Lighthouse团队支持OpenClaw的Skills功能并介绍使用方法
文章由腾讯云开发者社区联合轻量云Lighthouse团队发布,介绍OpenClaw+Skills组合。此前已发布OpenClaw部署和IM支持攻略,如今Lighthouse团队支持Skills功能。Skills可扩展OpenClaw能力,像浏览器操作插件agent - browser v0.2.0就集成在新版OpenClaw应用模板中。文章展示网页浏览、信息搜索、查询安装量最高邮件Skills等体验场景。还介绍安装新Skills方法,在OpenClaw配置面板可视化配置Skills,以Email Skills为例,演示查找、安装及验证可用性的过程。

[字节跳动技术团队] UGC 人脸增强异常检测 图像增强 CVPR竞赛

UGC 人脸增强异常检测挑战赛
字节跳动技术团队计划在CVPR 2026 NTIRE发起人脸增强异常检测竞赛。
字节跳动技术团队计划在CVPR 2026 NTIRE发起“Anomaly Detection of Face Enhancement for UGC Images”竞赛。因生成式模型发展,人脸增强出现结构、纹理等异常,影响观感与可信度。竞赛目标是建立UGC人脸增强异常检测基准,推动质量提升,促进算法落地。任务是在成对图像上检测人脸增强异常并评估严重程度。关注联合建模、生成式模型协同等核心问题,具有学术和社会价值,有望推动社区关注、形成评测体系及促进大模型融合。

[硅谷101] 人工智能 大模型 商业化 阿里云 视频生成 意图识别

应用爆发之年:聊聊模型技术进化与商业化
《硅谷101》邀请阿里云等企业探讨大模型商业化路径与应用。
《硅谷101》邀请阿里云徐栋、影石亓鲁、语忆科技吕瀛杰探讨大模型商业化。徐栋介绍阿里千问、万相、Fun等模型,视频生成模型从娱乐到生产,AI漫剧、广告生成发展快,成本降低。语言模型在多方面提升,推理、模型规模和工具调用推动AI应用。模型与硬件结合可执行更多任务,阿里从企业和产品两方向商业化,客户关注性能、成本,推理成本每半年降近十倍。开源吸引人才、助迭代。评价应用可参考Token量。亓鲁讲影石用千问和万相模型自动剪辑,难点是理解用户意图。吕瀛杰说语忆科技为企业搭建消费者意图识别小模型,企业从关注降本到增效。

[OpenBMB开源社区] 人工智能 全模态模型 MiniCPM - o 4.5 OpenBMB

MiniCPM-o 4.5开源:「眼耳口」并用,模型交互从「一问一答」变为「即时自由对话」
OpenBMB开源社区开源原生全双工全模态大模型MiniCPM - o 4.5
2026年2月4日,OpenBMB开源社区开源新一代全模态旗舰模型MiniCPM - o 4.5。它是原生全双工全模态大模型,能“边看、边听、主动说”,实现“即时自由对话”。该模型在GitHub等多平台开源,结合llama.cpp - omni框架,部署更优,在6款芯片上推理性能提升,还有免部署线上体验版。其亮点包括刷新端侧全模态能力上限,开启全时感知,语音自然饱满等。介绍了模型架构和使用方式,还发出直播及线下观摩Meetup邀请。

[海外独角兽] AI投资 AGI Continual Learning 多模态技术 Proactive Agent

How To Play AI Beta:拾象 2026 AGI 投资思考开源
拾象投研团队开源2026 AGI投资思考报告,分析AI格局、趋势及投资方向。
拾象投研团队开源2026 AGI投资思考报告,复盘AI变化,判断时局与趋势。全球AI模型头部格局确定,OpenAI、Anthropic和Google构成第一梯队,呈现“交替领先”和“分化”状态,算力形成GPU和TPU两大阵营。Continual Learning成新范式,2026年有望现明确信号。AGI竞赛如“马拉松+自动驾驶”,是持久战和现金流之战。AI需回答商业模式和效率质疑,投资应关注技术成长陡峭处。重要趋势包括模型即产品、数据即模型;2026年是多模态大年;Proactive Agent成主赛场等。二级视角下,AI Beta是科技创新主旋律,应坚守并关注新物种,还给出潜在受益公司。

[海外独角兽] 人工智能 Agent产品 Token消耗 开源模型 软件发展

深度讨论 OpenClaw:高价值 Agent 解锁 10x Token 消耗,Anthropic 超越微软之路开启
文章围绕OpenClaw等Agent产品展开深度讨论,分析其价值、市场前景及发展思路。
文章围绕OpenClaw等Agent产品展开深度讨论。先指出这波Agent爆发消除了‘AI Bubble’顾虑,高价值体现在能执行复杂任务。如OpenClaw预装Claude Skills,有诸多设计巧思,与Manus各有优势。Cowork和Claude in Excel或打开‘10x微软’市场,高价值Agent会切分企业工资预算。2026年Token用量至少10x增长,开源模型‘下限达标’是动力,Token消耗是衡量AI-native程度指标。还提到互联网infra对Agent不友好,催生新机会。对于软件,有被吞噬和退为工具两种观点。最后给出实现Agent泛化的三条思路,包括人群分层渗透、普及形态探讨及走向实体机器人。

[W3C资讯] Generative UI W3C 标准化 大模型 AI

Generative UI专题交流会召开·社区组成立推进标准化探索
W3C中国召开Generative UI研讨会并成立相关社区组。
2026年1月29日,W3C中国召开Generative UI专题线上研讨会,会后Generative UI社区组成立。会上,胡春明教授、王佐博士开场分享观点,指出AI辅助软件开发关注重心转向Web前端UI,业界应探索通用标准语言。多位产业专家分享实践经验,陆沉建议聚焦提升安全性等三个方向;莫春辉分析技术本质与路径,提出工作重点;祖明介绍百度工作并开源方案。开放讨论围绕加载速度、标准合作、UI组件等问题展开。最后,社区组计划围绕评估与性能等领域进一步探索。

[Datawhale] 姚顺雨 腾讯 CL - bench 大模型评测

加入腾讯的姚顺雨发表首篇Paper!
腾讯混元与复旦联合发表论文《CL-bench》考核大模型"现学现卖"能力。
2025年12月17日姚顺雨加入腾讯任职,2026年1月10日在峰会亮相。近期腾讯混元与复旦联合发表论文《CL - bench》,姚顺雨参与审阅提升质量。CL - BENCH有重要价值,首次将“现学现卖”单独考核,围绕严格原则构建,有四大题型18个子类,采用“全或无”评分机制。测试中10个前沿模型集体“翻车”,暴露诸多问题,如归纳能力弱、长文本处理差等,显示现学现卖是下一代大模型缺失的通用能力。

[Datawhale] 大模型 Claude Opus 4.6 GPT-5.3-Codex 人工智能

刚刚,Claude Opus 4.6与GPT-5.3-Codex同时发布!
Anthropic与OpenAI分别推出Claude Opus 4.6和GPT-5.3-Codex。
2026年2月6日凌晨,Anthropic与OpenAI分别推出Claude Opus 4.6和GPT-5.3-Codex。Claude Opus 4.6有重大升级,有100万token上下文窗口,引入「智能体团队」功能,在多项评估中表现出色,已在多平台上线。研究员用其智能体能力构建了基于Rust的C语言编译器。GPT-5.3-Codex编码性能佳,多项基准刷新纪录,速度提升25%,能执行开发人员多种操作,可支持软件全生命周期工作,已包含在ChatGPT付费套餐。最后提到春节前国内大模型或会竞争激烈。

[Datawhale] 阶跃星辰 Step 3.5 Flash模型 人工智能 机器学习与深度学习

阶跃星辰Step-3.5-Flash模型团队分享实录
阶跃星辰发布Step 3.5 Flash模型,总参196B,推理速度350 TPS,已上线官网及OpenRouter限免。
2026年2月4日,Datawhale联合阶跃星辰团队揭秘“如何打造为Agent而生的极速模型”。阶跃星辰算法专家吴鑫介绍Step 3.5 Flash模型,其总参196B、激活11B、稀疏度20:1,推理速度350 TPS,混合上下文支持256K。训练引入Midi - train阶段,灌输原子能力数据。架构上,MTP提升速度但带来工程挑战,注意力机制3:1混合。演示中,模型在复杂场景表现出色,端云协同探索差异化路线。该模型适配开发者生态,支持标准OpenAI格式和Claude Code的MCP协议。QA环节解答了速度与成功率、语言支持等问题。目前模型已上线官网及OpenRouter限免。

[追问nextquestion] AI 科学发展 科学家 科学范式 知识创造

AI时代,科学进入乱纪元
文章指出AI不会取代科学家,科学本质是人类协商构建共享意义的过程。
文章探讨AI时代科学发展,指出虽有人认为AI将成万物解释者,如Google DeepMind的AlphaFold可大规模预测蛋白质结构,但它无法解释物理机制等。科学是基于共识的文化体系,存在绑定问题和主观体验的差异,知识需可共享,模型是抽象仿象。AI有信息处理局限,科学范式受人类影响常发生转变。科学思想源于共识解读,AI虽能处理大量数据,但创造性构建新框架能力不足,不会取代科学家,科学本质是人类协商构建共享意义的过程。

[追问nextquestion] 脑科学 AI行业 AI驱动科学 神经机制 基因变异

追问daily | Nature:首个能写综述论文的AI模型;重度抑郁症患者大脑指纹模糊;告别坏习惯的新思路
2月7日追问daily涵盖脑科学、AI行业及AI驱动科学动态。
这篇文章是2月7日的追问daily,涵盖脑科学、AI行业及AI驱动科学动态。脑科学方面,揭示肿瘤与大脑通讯回路、帕金森病机制,发现人类回声定位潜能、焦虑症基因变异等,还涉及抑郁症治疗、梦境工程等研究。AI行业中,OpenClaw大会展示技术突破,Claude Opus 4.6和GPT - 5.3 - Codex竞争激烈。AI驱动科学领域,OpenScholar能准确生成文献综述,还有神经植入物、赋予AI人格、类脑AI控制软体机器人等成果。

[GSYTech] Anthropic AI Coding 职业技能衰退 软件开发

Anthropic :AI Coding 是如何造成你的职业技能衰退,你是如何一步步被蒙蔽
Anthropic发布论文指出学习编程时过度依赖AI可能导致掌握程度降低。
近日,Anthropic发布论文《How AI assistance impacts the formation of coding skills 》,探讨AI写代码是否会让人“学得更慢、懂得更少”。研究通过让52名工程师学习Python异步库Trio并测验,发现AI组速度提升不明显,掌握程度显著低于手写组。论文归纳出6种交互模式,指出用AI也可学好,要把它作为“促进理解”的工具。研究存在样本量小等局限,结论是在学习新东西时,AI易使人用最小阻力完成任务,学习需主动保留摩擦,初级工程师应避免过度依赖,企业要警惕长期专业能力流失。

[MacTalk] 人工智能 视频大模型 Vidu Q3 AI视频

昨天夸国产大模型争气,今天Vidu Q3就霸榜了
中国视频大模型Vidu Q3在国际榜单获全球第二、国产第一。
2026年,中国视频大模型Vidu Q3在国际权威AI基准测试机构Artificial Analysis的最新榜单里表现出色,在Video Arena冲到全球第二、国产第一。它是Vidu最新商业级视频模型,支持16秒音视频直出,声画同出、高清直出,还支持多语种对话。其镜头感强,可通过自然语言提示词控制节奏和运镜,能精准渲染中、英、日三种文字。Vidu Q3让AI视频可切入专业级内容表达,行业场景开始成形,标志着中国视频模型从技术追赶转向内容生产力较量。

[腾讯云TVP] 企业智能体 AI应用 腾讯云

腾讯云程伟:拒绝AI焦虑,企业智能体如何从“工具”到“生产力”?
腾讯云程伟解析企业智能体并发布智能体战略全景图
本文由腾讯云副总裁程伟深入解析企业智能体。2025年AI Token调用量飙升300倍,企业对AI从观望到认同,但面临价值转化难题。腾讯双端发力,C端让AI融入生活,B端使AI成员工。智能体可将AI从答疑变解决问题,目前多处于L2.5阶段。其落地面临性能、安全、ROI三重瓶颈,腾讯云提出系列解题思路并发布智能体战略全景图。未来将从单体智能走向多智能体协作,重构流量秩序。零售企业需回归体验、做好数据治理、实现组织进化,让智能体创造可持续价值。

[蚂蚁技术AntTech] 知识型视觉问答 对比学习 TAG框架 多模态内容生产

以极低成本实现SOTA性能的KVQA高效框架|AFAC技术物语
浙江大学和蚂蚁集团合作提出TAG高效框架并被收录。
浙江大学和蚂蚁集团合作撰写的论文提出TAG高效框架,被IEEE Transactions on Big Data收录。当前多模态内容生产面临效率与成本挑战,现有技术依赖知识库和大模型,存在检索质量和计算成本问题。TAG将KVQA重塑为对比学习任务,通过三重不对称对齐和辅助推理生成,以低成本实现SOTA性能,并在多个数据集上验证了效果。该框架未来可用于智能客服、金融直播等领域。

[搜狐技术产品] Kimi K2.5 多模态模型 Agent集群 开源模型 人工智能

开源版Claude Code来了,48小时的深度使用教程
文章评测Kimi K2.5模型,称其为具实战能力的国产开源原生多模态模型。
文章介绍开源版Claude Code,重点评测Kimi K2.5模型。它似开源版Gemini 3 Pro与Claude Sonnet 4.5结合体,代码生成距最强有差距,但实战表现佳,多榜单排名靠前。提供Kimi Code+K2.5安装配置教程,通过页面复刻测试,体现其降低编程门槛能力。在日常开发文档整理和增量开发中,质量达一线水平但工程完整性需人工把关。还解析Agent集群小说创作协作机制,包括任务分配、并行执行、续写机制等,指出它在多模态融合和工程化实现有突破,是具实战能力的国产开源原生多模态模型。

[MacTalk] 中美AI竞争 AI模型 开源闭源 商业模式

关于中美 AI 竞争的差距,我可能真的说错了
作者分析中美AI竞争,指出中国基模落后但部分领先,五年内差距或缩小。
作者因AI新品发布写中美AI竞争短文,经读者反馈,认识到理解不全面。专业判断中国基模能力落后美国3 - 6个月,但个人感受有差异。整体上中国基模能力落后美国,但部分领域领先。若2026年中国解决部分算力问题,差距将缩小。以Opus 4.6为例,展示其能力及不足,每代模型拓展协作方式。LMArena评测榜单有价值。中美AI商业模式不同,美国简单,中国复杂。美国顶级模型闭源,中国开源,与发展策略、环境有关,未来双方将螺旋上升,五年内见分晓。

[甲子光年] 360 纳米AI 漫剧流水线 智能体 AI应用

All in Agent实战练兵:为什么360纳米AI率先跑通漫剧流水线?|甲子光年
360上线纳米漫剧流水线,以智能体协同实现工业级漫剧高效优质生产。
2026年初AIGC生态面临产能与品质问题,漫剧创作效率与质量难兼顾。360于2月上线纳米漫剧流水线,其以智能体协同为核心,实现低成本、高效率和高品质工业级输出。该流水线终结漫剧‘抽卡’,打造工业级生产逻辑,保证分镜高效生成且可回溯修改,在二维、三维、四维一致性上表现出色。技术核心是纳米蜂群智能体和纳米空间引擎,架构含用户层、智能体层、资产层与生成层。它是360纳米AI技术演进的结果,有安全理念保障。纳米漫剧流水线标志360开辟新路径,已与多家公司合作,其智能体系统在多领域落地,有潜力成为产业智能化‘操作系统’。

[谷歌开发者] FunctionGemma 模型微调 谷歌开发者 AI工具

实战指南 | 轻松微调,解锁 FunctionGemma 的无限潜力
谷歌开发者发布文章介绍FunctionGemma模型微调实战及推出Tuning Lab。
谷歌开发者发布文章介绍FunctionGemma模型微调实战。该模型可将自然语言转为API操作,但通用模型有局限。文章指出微调可消除工具选择歧义、实现极致专业化和模型蒸馏等。通过案例展示用Hugging Face TRL库微调,以区分内部文档和Google搜索,还强调数据分布对训练的重要性。微调后模型能遵守企业策略。此外,推出FunctionGemma Tuning Lab,它有无代码界面、自定义数据导入等功能,助开发者简化微调过程。

[谷歌开发者] 人工智能 自然语言处理 Gemma 3n CastFox 播客应用

CastFox 利用 Google 开放模型 Gemma 3n 重塑播客互动体验
Guru Network用Google Gemma模型开发CastFox应用下载量破百万。
2026 年 2 月 7 日消息,全球化娱乐与游戏公司 Guru Network Limited 开发的 CastFox 应用,上线 3 周下载量破 100 万。它旨在将传统播客转为互动式知识库,需高效 AI 模型。因预算考量,团队在对比后选了 Google 开放模型 Gemma 3n E4B,其成本低、易自托管、精度高。团队用 Ollama 在轻量级设备运行该模型,实现高精度结果。Gemma 3n 成其音频理解后端核心,处理多语言稳定准确、速度快,成本效益高,吸引大量活跃用户。

[硅星人Pro] 人工智能 上下文学习 大模型评估 CL - bench 姚顺雨

姚顺雨在腾讯首个研究:在“上下文”这事上,在座的各位都不及格
腾讯混元团队和复旦大学联合发布上下文学习基准测试CL-bench。
2026年2月3日,腾讯混元团队和复旦大学联合发布论文CL - bench,项目负责人为姚顺雨。该研究构建了严格的上下文学习基准测试,通过虚构平行宇宙和假知识等方式防止数据污染。测试中AI需扮演四种角色完成任务,研究团队对十个前沿语言模型测试,平均任务解决率仅17.2%,失败主因是忽略或误用上下文等。姚顺雨曾预判AI发展进入下半场,评估比训练更重要,CL - bench关注模型上下文学习能力,这一能力此前被低估。2026年AI发展可能转向上下文学习,后续挑战是记忆巩固。腾讯关注此基础问题,或为核心业务打地基。

[硅星人Pro] 人工智能 自然语言处理 机器学习与深度学习 AI应用领域

分水岭!Claude 4.6做出Agent集群,GPT-5.3开始"自我繁殖"
OpenAI和Anthropic分别发布GPT-5.3-Codex和Claude Opus 4.6。
2026年2月5日,OpenAI和Anthropic分别发布GPT-5.3-Codex和Claude Opus 4.6。GPT-5.3-Codex是首个参与自身开发的AI编码模型,具40万token上下文窗口等升级,实现AI开发正反馈循环;还能长时间运行、自主构建项目,有网络安全能力,API待开放。Claude Opus 4.6支持多智能体协作,上下文窗口提升到100万token,新增上下文压缩等。它能团队协作完成复杂工程,如造C编译器、发现漏洞、生成PPT等。二者分别开启递归自我改进和群体智能协作大门,加速AI迭代。

[十字路口Crossing] AI 涂津豪 主动式AI Memory AI安全

他看到的未来,和我们有什么不一样?| 对话18岁的涂津豪:DeepSeek 前实习生、阿里数竞 AI 组冠军
涂津豪分享与AI相处日常及对AI发展方向等的看法。
这是对18岁的涂津豪的访谈,他是DeepSeek前实习生、阿里数竞AI组冠军。他分享了与AI相处日常,每天对话约2小时,常探讨时间流动、AGI冲击等。他偏爱Claude,因其对话风格舒服且能反驳自己。他认为2026年主动式AI和Memory是关键方向,前者是更高级的autocomplete,未来交互或卡片式;后者当前方案单一,模型架构待变。他还提到通向AGI模型缺人类进化优势、情绪和持续学习能力;AI安全重要,国外部分公司探索多。此外,谈了在DeepSeek实习感受、读大学价值、2025年度盘点及停用AI的金钱条件等。

[火山引擎] 火山引擎 记忆库Mem0 AI应用 大模型

火山引擎记忆库Mem0发布,全面兼容Mem0开源社区生态
火山引擎发布AI应用记忆系统记忆库Mem0,兼容开源生态。
2026年2月2日,火山引擎发布AI应用记忆系统——记忆库Mem0,全面兼容Mem0开源社区生态。它直击大模型‘上下文窗口局限’和‘会话记忆清零’痛点,与大模型分工协同。基于核心技术链路,能大幅下降响应时间。Locomo Benchmark测试显示其性能领先。它有省时、省力、省钱、省心四重优势。目前已落地游戏智能NPC等场景,还将在多领域发挥价值,推动AI向持续认知服务升级。

[十字路口Crossing] OpenClaw AI创业 智能眼镜 AI Agent信用系统 AI交互方式

OpenClaw 爆火之后,我们看到了这些创业信号
OpenClaw爆火打开创业方向,有四大相关创业方向及Agent帮找创业者。
OpenClaw爆火,意味着创业方向被打开。它验证了AI能从「聊天」变「做事」、功能可「装上去」、能持续运行。基于此有四个创业方向:一是OpenClaw与智能眼镜结合,让AI有移动视角;二是t54.ai团队做的claw.credit,为AI Agent建立独立金融身份;三是RentAHuman.ai,让AI Agent雇佣人类完成物理任务;四是ElevenLabs让语音指挥OpenClaw,重新定义AI交互方式。此外,Agent还能帮人找到合适创业者。

[十字路口Crossing] OpenClaw Agent 创业项目 人工智能

OpenClaw 爆火之后,我们又看到了这些创业信号 ( 第二弹 )
作者分享OpenClaw爆火后5个相关新产品,证明搭建Agent独立协作环境可能。
本文发布于2026年2月7日,在OpenClaw爆火后,作者分享5个相关新产品。ClawCity是持久化虚拟城市,用于观测Agent行为,改变评测方式、训练多Agent和生产内容;ClawTask是赏金任务市场,测试Agent赚钱能力;ClawLove是Agent约会平台,本质是协作配对,帮其找长期搭档;MoltThreats是威胁情报平台,减少Agent信息差,保障经济安全;Church of Molt是Agent宗教网站,形成信仰叙事系统。这些项目证明搭建Agent独立协作环境是可能的,不过还处于早期。

[奇舞精选] 智能体 长时间运行 Claude Agent SDK 上下文窗口

如何高效的长时间运行智能体
为解决长时间运行智能体挑战,为Claude Agent SDK设计双层方案。
文章围绕长时间运行智能体面临的挑战展开。智能体在多上下文窗口工作时存在难题,因只能在离散会话工作且会遗忘之前信息,缺乏跨会话衔接能力。为此为Claude Agent SDK设计双层方案,包括初始化和编码智能体。实践中Claude有一次性做太多、过早宣布完成两类失败模式。提出两阶段方案,初始化智能体搭建基础,编码智能体做增量开发。还介绍环境管理、测试等方面要点,给出失败模式解决方案。最后指出未来可探索通用或分工智能体,方案有推广潜力。

[TRAE.ai] Remotion Skills 视频制作 TRAE React框架

不止是写代码|如何用 Remotion Skills 做视频
Remotion推出Remotion Skills,可通过对话快速制作视频。
本文介绍用Remotion Skills制作视频的方法。Remotion是用React编程创建视频的框架,Remotion Skills打破传统视频制作边界,可通过对话快速做视频。在TRAE中用其Agent Skills,能通过自然语言生成完整视频,适合产品演示等场景。实操步骤:先将Remotion添加到TRAE Skills,有从GitHub仓库下载和用命令行安装两种方式;然后想好视频开场元素,明确提示词生成开场片段;接着附截图创建视觉元素并添加动效;最后添加截图或UI元素完善细节。还推荐了其他实用提示词,鼓励大家体验。

[阿里云云原生] 阿里云 函数计算 AgentRun 知识库功能 智能体

函数计算 AgentRun 重磅上线知识库功能,赋能智能体更“懂”你
阿里云函数计算AgentRun推出全新知识库功能。
2026年2月2日,阿里云函数计算AgentRun推出全新知识库功能,为智能体注入更强语义理解与上下文感知能力。传统智能体开发存在缺乏特定业务知识理解能力的痛点,AgentRun知识库功能通过RAG技术解决该问题。它支持百炼和RAGFlow双知识库引擎,覆盖多元知识形态。集成方式有快速创建集成、代码集成和MCP集成三种,可适配不同开发场景。该功能上线标志智能体发展迈入新阶段,未来知识库持续进化将降低构建智能体的门槛。

[阿里云云原生] 智能体 在线训练 Java AgentScope Trinity - RFT

Agent 越用越聪明?AgentScope Java 在线训练插件来了!
提出面向Java Agent的AgentScope Java + Trinity-RFT端到端在线训练方案。
随着大模型能力成熟,智能体从实验走向应用,但模型上线后难以持续学习。当前 Agent 优化面临训练-部署环境分离和 Java 生态支持缺失两大瓶颈。为此提出面向 Java Agent 的 AgentScope Java + Trinity-RFT 端到端在线训练方案,该方案利用线上真实交互数据,低侵入且对 Java 友好。其核心流程是筛选样本、记录交互、生成奖励信号,积累轨迹后触发训练。架构上分为 Agent Runner、Explorer、Trainer 三个组件。文中还介绍了安全约束、快速开始步骤,包括 Maven 依赖、请求筛选、奖励函数定义等。最后通过 SQL Agent 训练 Demo 展示效果,训练后 SQL Agent 在不同难度下的 SQL 生成准确率均有提升。

[极思TopMinds] 人工智能 百度 OpenAI 深度研究评测 Agent工作流

登顶权威评测全球第一!百度这次真赢了OpenAI!
百度在DeepResearch Bench评测中超越OpenAI、谷歌Gemini等登顶。
2026年2月6日消息,百度在DeepResearch Bench评测中超越OpenAI、谷歌Gemini等登顶。该评测是实战考核,涵盖100个博士级研究任务、22个学科,评估端到端完整能力。OpenAI通用能力强,但在深度研究场景表现欠佳,因其策略类似全科医生。百度靠完整工程化Agent工作流取胜,其工作流程包括任务理解、规划调度、反思和报告整理。此外,百度搜索生态也是优势,其索引库庞大、能精准语义过滤、实现深度RAG协同。这启示人们在AI时代要选合适场景和工具,百度千帆深度研究功能值得相关人员尝试。

[阿里云开发者] 阿里云 RDS MySQL 儿童科普应用 AI驱动

春节带娃不崩溃指南:用 MySQL 一键部署AI驱动的儿童科普动画片,娃安静一整天!
基于阿里云RDS MySQL搭建儿童科普生成应用《知深识易》。
文章介绍基于阿里云RDS MySQL搭建的儿童科普生成应用《知深识易》。先指出教育者和家长面临内容难整合、制作门槛高、注意力匹配难等难题,为此打造端到端系统实现内容生成。接着介绍应用的知识源管理、内容脚本生成、多模态内容生成功能。还说明如何用RDS MySQL搭建RAG和记忆服务,可避免双系统问题。最后提到能在AgentRun平台一键部署该应用,RDS MySQL向量能力可将知识存入数据库、记住用户,简化架构和运维。

[京东技术] 智能代码评审系统 双RAG架构 知识工程 JoyAgent

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践
京东物流研发团队构建双RAG智能代码评审系统提升效率
文章围绕京东物流供应链商家导入研发团队构建的基于知识工程&JoyAgent双RAG的智能代码评审系统展开。大促封板前代码评审任务重,传统模式和现有AI工具存在效率低、误报率高等问题。介绍两种现有技术方案及其局限性,如全局上下文缺失、知识归纳失真等。通过线上问题分析凸显问题严重性,提出双RAG架构,包括识别项目类型、代码分块处理、RAG增强与重排序机制,经实际应用验证有效。最后总结该架构优势,并展望未来向多模态代码理解、构建全域业务知识库、实现需求上下文自动关联等方向发展。

[Web3天空之城] 人工智能 太空算力 机器人 管理哲学 政府效率

5万字完整版: 马斯克最新谈AI算力登月-文明韧性与硬件霸权 |图解全文+视频
马斯克探讨AI发展边界,称太空部署AI更具经济吸引力。
这是马斯克3小时深度访谈内容,探讨AI发展终极边界。他指出地球AI发展受能源瓶颈限制,未来30 - 36个月太空部署AI更具经济吸引力,太阳能板效率高且成本低。为解决硬件问题,他或自研涡轮机、晶圆厂。他认为人形机器人Optimus是“无限金钱漏洞”,纯AI和机器人公司效率将远超人类参与的组织。在AI价值观上,要确保其追求真理、保留人类。在管理上,他有独特风格,关注限制因素。他还谈到政府效率、国债问题,认为AI和机器人可拯救经济,同时担忧政府利用技术压制民众,倡导有限政府。

[AI 深度研究员] 人工智能 AI应用 工作变革 创业趋势 学习方法

a16z 联合创始人:别怕 AI 抢饭碗,怕的是没人干活
a16z联合创始人称AI改变岗位任务,能驾驭AI的人将更突出。
2026年1月30日,a16z联合创始人Marc Andreessen在访谈中表示,人们不应担心AI抢饭碗,而是有能力干活的人会减少。他指出AI抢走的是岗位里的任务,使岗位职责改变、边界消失,人们需判断何事交AI、何事自己做。能驾驭AI的“超级个体”与普通使用者差距大,前者能借AI让自己变得惊人地好。一个人若懂运用AI,有可能撑起一家大公司,公司起点正在变小。在学习方面,学会自学比学什么技能更重要,AI可辅助学习,但人要先学会判断。总之,AI让能干活的人脱颖而出,让不动的人掉队。

[腾讯研究院] AI 科技史 数学等式 社会经济结构 信息过载

张笑宇:我为什么成了坚定的AI“降临派”?
张笑宇在腾讯科技向善创新节2026分享对AI的多方面思考。
张笑宇在腾讯科技向善创新节2026上分享对AI的思考。他认为AI强大源于数学,以“人类当量”等式说明其智力输出远超人类,将使社会经济结构围绕该数学关系调整,带来供给侧改革等影响。同时用《21世纪资本论》等式指出资本与社会总收入关系决定技术对劳动力的影响,还提到人类感官与思维处理信息的巨大差距,说明脑机接口在认知提升上可能意义不大。此外,他认为AI能带来智慧革新,但也会让人们陷入独断论天堂,需抵御信息过载,未来社交应将人从虚拟世界拉回现实。

[AI 深度研究员] 人工智能 软件开发 AI编程 智能体协作 闭环验证

80% 的 App 会被替代?Clawdbot 创始人更在意:AI 能不能把事办成
PSPDFKit创始人Peter Steinberger用AI智能体开发OpenClaw新协作模式。
2026年2月1日,PSPDFKit创始人Peter Steinberger称80%的App或消失,因智能体可完成诸多App功能。他离开团队,用AI作伙伴开发OpenClaw。他指挥5到10个智能体并行工作,像调度员规划验证。验证机制采用闭环验证,智能体自行测试验证,2分钟完成,效率超传统。他不写文档,与AI对话设计产品,对话自动记录成文档。其工作方式是新协作模式,靠任务边界、反馈验证和上下文共享,保持产品完整性。Clawbot上线后受开发者关注,证明一人靠AI智能体可干团队的活。

[信息与交互设计研究所] 大模型 学术交互设计 南雍闻道 AI4S LAB Elicit

大模型驱动学术交互设计
南京大学图书馆等推出“南雍闻道”平台,北大深研院与百度智能云打造AI4S LAB体验版,Elicit提升学术研究效率。
大模型浪潮为学术交互设计带来新变革。南京大学图书馆等推出“南雍闻道”平台,覆盖学术资源、学科领域等多方面,构建三层交互体系,自2025年9月上线后成果显著。北京大学深圳研究生院与百度智能云打造AI4S LAB体验版,整合“算力—模型—数据—实验”要素,实现一站式云端科研体验。Elicit智能文献搜索工具以大语言模型与RAG技术为核心,构建自然交互体系,提升学术研究效率。

[腾讯研究院] 人工智能 腾讯研究院 OpenAI 智谱 xAI Adobe SpaceX

腾讯研究院AI速递 20260204
腾讯研究院AI速递涵盖OpenAI、智谱等公司多项AI进展。
2026年2月4日腾讯研究院AI速递涵盖多项进展。OpenAI推桌面版Codex,迎战对手;智谱开源GLM - OCR登顶SOTA;腾讯混元技术博客上线,发布CL - bench成果;xAI发布Grok Imagine 1.0视频生成模型;腾讯ima接入混元图像3.0;Adobe关停Animate;SpaceX收购xAI;谷歌用Gemini攻数学题,指出AI辅助成本高;a16z认为AI时代软件构建快,护城河更重要。

[AI 深度研究员] AI Sam Altman OpenClaw Codex 企业应用

思科AI峰会,Sam Altman:热闹会退潮,能干活的 AI 才刚开始
Sam Altman认为AI社交平台非长久,更应关注AI接手工作及深层变化。
2026年2月4日,思科AI峰会上Sam Altman发表观点,他认为刷屏的AI社交平台Moltbook或只是一时狂欢,更重要的是AI能否接手工作。他谈到AI三个深层变化:一是OpenClaw让AI从对话型走向操作型,能自主完成任务,将成为未来工作生活一部分;二是Codex使开发者与AI工作方式转变,从调用工具到管理团队;三是企业还没做好用AI准备,面临安全机制、软件支持、法律权限体系三个障碍,但他提出全AI公司概念,未来企业输赢在于敢不敢重构组织流程。

[腾讯研究院] 人工智能 人在回路中 红旗法案 思维转变

1865年《红旗法案》的幽灵,仍在今天游荡
文章认为“人在回路中”理念限制AI潜能,应转向“人在回路之上”。
文章围绕“人在回路中”理念展开讨论。该理念在人工智能与自动化领域被视为理想人机共处模式,随生成式AI崛起受重视。但从技术演进看,这种控制执念或成发展阻力。文中以1865年英国《红旗法案》为例,其虽符合当时社会实际,却使英国汽车产业停滞。“人在回路中”类似新“红旗法案”,限制AI潜能。AI是时代“奇迹材料”,应从“人在回路中”转向“人在回路之上”,进行元规则设计,同时改变责任归属模式,警惕自身惯性,释放AI潜力。

[AI 深度研究员] AI 太空机房 马斯克 电力瓶颈

太空机房这件事,马斯克为什么认真了
马斯克指出电力是AI瓶颈,xAI等公司计划未来36个月部署太空AI。
2026年2月5日马斯克访谈指出,AI繁荣背后电力是瓶颈。xAI为让Colossus集群上线,跨州修电厂、考虑自制关键部件,因电力供应受审批、冷却和设备交付周期限制。他认为地面发展受限,未来36个月太空将成部署AI最便宜之地,太空太阳能成本低、无地面障碍。5年后,太空AI每年增量达数百吉瓦,会超地球累积总和,更远可从月球发射达每年1拍瓦。SpaceX、特斯拉、xAI分别提供运力、制造、应用场景,形成闭环使太空AI计划可执行。

[深思圈] 人工智能 桌面AI 天工Skywork Claude Cowork

支持Windows的桌面AI来了,比Claude Cowork还能打?
昆仑万维推出支持Windows的桌面版AI天工Skywork,对标Claude Cowork。
文章介绍昆仑万维天工Skywork推出支持Windows的桌面版AI,对标Claude Cowork。它能理解文件系统,成为真正的桌面助手。其优势在于支持Windows、多模型与智能路由、多模态生成能力强。通过生成网站、提取图片等场景展示其实用性。在安全上采用本地处理、虚拟机隔离和操作确认保障。未来2 - 3年桌面AI agent有望成标配,但面临用户习惯、企业市场拓展等挑战。

[深思圈] 软件开发 AI编程 判断力工程

软件股崩盘启示录:当 AI 让代码变得廉价,软件真正的价值在哪里?
文章讨论AI使代码廉价后软件价值转向明确意图和判断力。
文章围绕AI使代码廉价后软件的真正价值展开讨论。指出软件开发正从稀缺经济转向丰富经济,价值从‘能否写代码’转向‘知写何代码’。随着代码丰富,清晰表达意图能力变稀缺,工作从执行转向澄清判断。还提到不可接受代码违反系统隐含契约,反映出工程意图的重要性。不同类型代码规范化程度不同,AI在明确意图处表现好。软件开发从个人技能转向组织能力,软件扩散到更多领域,价值积累到决定自动化决策的人。最后思考了转变对软件工程师、工程教育、行业格局的影响,认为要找到人与AI的协作模式,判断力将成新竞争维度。

[SQB Blog] AI Coding 前端开发 收钱吧前端团队 人机协作

收钱吧前端团队的 AI Coding 实践:从盲用到掌控
收钱吧前端团队分享AI Coding实践与实战方法论
收钱吧前端团队分享AI Coding实践,经历盲用、摸索、持续学习实战三阶段。盲用期零散用AI提效;摸索期通过分享会理清人机边界;持续学习实战阶段针对性补短板。还介绍三个案例,如音频交互组件、智能客服对话页面重构、黑客马拉松项目。团队认为AI是角色重塑者,非替代者,提出实战方法论,强调工程师要理解系统,善用AI并保持独立思考。

[阿里云开发者] AgentScope Skills支持 渐进式披露 大语言模型 Agent系统

AgentScope 正式发布 Skills 支持 - 实现渐进式披露
AgentScope发布Skills支持,实现渐进式披露
2026年2月4日,AgentScope正式发布Skills支持,实现渐进式披露。大语言模型驱动的Agent系统存在核心矛盾,常见上下文加载方案各有局限,根源是缺乏灵活机制。Skill机制可解决问题,Skill是独立可复用单元,包含结构化指令、资源文件和可执行脚本;渐进式披露分三层加载知识。以订单处理为例说明工作机制。AgentScope - Java实现了Skill机制,包括存储层抽象、创建Skill对象、多级披露、Tool渐进式披露和代码执行能力。Skill机制是拓展Agent能力的有效方式,但也有局限性,未来将在生命周期管理和分发机制上优化。

[code秘密花园] Agent Skills 知识库检索 传统 RAG 知识检索 Skill

使用 Agent Skills 做知识库检索,能比传统 RAG 效果更好吗?
ConardLi 探索 Agent Skills 知识库检索效果及实现
文章探讨使用 Agent Skills 做知识库检索是否优于传统 RAG。先回顾 Skills 工作原理与使用方法,其具渐进式加载策略。作者不满传统 RAG 调优过程,期望用 Skills 设计模式实现知识检索 Skill,解决指定目录检索、跨格式查询等问题。通过示例知识库演示检索效果,介绍实现原理,包括定位领域、文件、内容及关键设计原则与技巧。指出该方案轻量智能,但存在首次检索效率低、Skill 调用不稳定、Token 消耗大等缺陷。还介绍让已有文档站秒变知识库的方法。

[阿里云开发者] 大模型编程 传统编程 AI编程 软件开发

从传统编程转向大模型编程
阿里云开发者分享从传统编程转向大模型编程经验
文章围绕从传统编程转向大模型编程展开。核心目标是让开发者从‘代码产出者’变为‘文档定义者’,实现代码自动化生成。阐述了用大模型编程的原因,如从关注‘怎么做’转向‘需要什么’,还介绍人 + AI 结对编程的角色、好处及尝试任务,以及新工作节奏。讲解模型、工具与技巧,包括模型选择、工具形态、提示词工程和进阶技巧。基于文档的开发流程强调文档即源码,给出标准工作流和示例。指出常见陷阱及策略,提出对抗‘复杂度熵增’与‘最后 10% 陷阱’的防守策略,介绍安全与合规方法,最后明确个人和团队在大模型编程中的职责,并解答常见疑问。

[智东西] 腾讯 大语言模型 CL - bench 上下文学习

刚刚,腾讯姚顺雨团队首个成果发布!揭示大模型真正瓶颈
腾讯姚顺雨团队发布CL - bench基准揭示大模型瓶颈
2026年2月3日,腾讯混元官网发布姚顺雨团队成果CL - bench基准,用于评测大模型从上下文学习新知识并应用的能力。大模型依赖预训练静态记忆,与人类实时学习不同。CL - bench含500个复杂上下文任务,涵盖四类现实场景。研究人员评估十个主流大模型,平均任务解决率仅17.2%,得出五大结论揭示模型瓶颈。该基准上下文自包含、任务无污染设计,后续团队关注提升模型上下文学习及知识持久化能力,认为大模型记忆将成2026年核心主题。

[阿里巴巴终端技术] Google A2UI Agent交互 GenUI 前端开发

界面即推理:解读 Google A2UI 如何探索 Agent 交互新标准
Google 专家 Jennie Shi 将在 D2 大会分享 A2UI 探索成果
Google 内部多团队联合探索让 Agent 交互由模型按需生成。Google AI 资深专家 Jennie Shi 是 A2UI 开源项目推动者,致力于探索 LLM 驱动下的 UI 开发新范式。本次 D2 大会,她将分享 A2UI 背后设计理念与工程实践,包括交互协议演进,其通过流式 JSONL 和声明式组件标准解耦 UI 结构与数据;A2A 协作中作为‘通用胶水层’打通交互路径;还会介绍开源生态进展及 GenUI 未来规划,探讨前端开发者如何利用 A2UI 构建应用。大会于 2026 年 3 月 21 日在浙江杭州阿里巴巴全球总部访客中心举行。

[阿里云开发者] A/B实验 Prompt工程 自动化推理 大语言模型

生产级Prompt自动化推理评估A/B实验结果的工程实践
阿里云开发者张超设计部署自动化推理系统评估A/B实验
本文围绕生产级Prompt自动化推理评估A/B实验结果展开。在互联网流量竞争激烈的当下,传统人工巡检A/B实验数据存在低效、误判率高的问题。作者设计并部署了基于大语言模型的自动化推理系统,介绍了其背景、核心主Prompt、六层优先级决策树。通过分析典型Bad Cases,建立了从Bad Case到Prompt改进的闭环,优化了Prompt。同时总结了生产级Prompt的五大原则和迭代方法论,指出大模型适合规则明确但复杂的任务,Bad Case具有重要价值。最后展望了扩大自动化作业范围、持续优化Prompt和沉淀大模型工程学习等方向。

AI 技术与算法实践

[58UXD] 人工智能 自然语言处理 AI应用领域 文案设计

当设计师亲自下场训练AI:它开始先“看页面”,再写文案
58UXD团队训练AI替代文案设计师完成英文文案工作。
2026年文章介绍58UXD团队将AI训练成文案设计师的成果。业务出海后写英文文案需考虑语境文化,团队目标是让AI替代文案设计师。他们从三方面着手:一是懂用户,引入schema让AI通过图片理解界面,用MECE搭建工作流兼容复杂输入;二是懂业务,用RAG机制让知识库成硬规则,使AI遵循规范;三是去AI味儿,优化工作流关键节点,经多次调试和AB测试锁定关键因子。最终将语义助手做成落地产品,让设计师高效完成英文文案工作。

[腾讯技术工程] 人工智能 自然语言处理 神经网络 大语言模型

这大概是我读过关于AI大模型最全面、好读又易懂的文章了
腾讯程序员白玉光从神经网络入手全面介绍AI大模型。
文章由腾讯程序员白玉光撰写,从神经网络入手全面介绍AI大模型。先介绍神经网络,包括其起源、结构、信号传播方向、神经元特性、激活函数、权重偏置等概念及参数,还讲述其学习原理,含矩阵运算、反向传播、梯度下降等。接着引入大语言模型,介绍其处理自然语言相关内容,如分词、词表、向量化、输出概率等。为解决记忆和性能问题,介绍循环神经网络、Transformer等架构。然后说明大模型训练相关要素,如训练数据、超参数、批量、步长等,还涉及过拟合、欠拟合、监督学习等问题及解决方法。最后谈及AI浪潮下的基础设施,如GPU卡、CUDA平台、并行计算方式和大模型使用的思路,如Agent、MCP、RAG、A2A等。

[腾讯技术工程] 腾讯TRS团队 HiGR 生成式推荐 列表级推荐 推荐系统

推理速度提升5倍+:腾讯TRS团队首创列表级生成式推荐HiGR
腾讯TRS团队提出端到端生成式推荐框架HiGR。
2026年2月6日腾讯TRS团队提出分层规划的端到端生成式推荐框架HiGR。传统推荐系统有目标不一致、误差累积、GPU算力利用不足等问题,多数生成式推荐研究基于NTP范式,面临推理效率受限和缺乏全局规划挑战。HiGR含语义编码、分层规划、列表级偏好对齐三个核心模块,解决了语义ID纠缠、推理耗时长等问题。实验显示其离线评估效果优,线上A/B测试有正向收益,Scaling Law实验证明有扩展性。HiGR还有服务架构、推理加速等落地方案,提供全链路托管和模块化组件接入两种方式。

[硅星人Pro] AI 交通安全 鹰眼守护预警系统 交通视觉语言模型

每天预警8800万次,这个AI在悄悄救人
中国安全生产科学研究院与高德联合推出鹰眼守护预警系统,提前预警交通事故。
文章指出AI发展存在质疑,应落在真实需求上,如安全领域。鹰眼守护预警系统是范例,由中国安全生产科学研究院与高德联合推出,基于空间智能架构与云端AI大模型,提前预警交通事故。它能超视距感知24类风险,秒级预警,将个人预警升级为群体预警。其原理是通过交通孪生还原系统“看见”交通,用交通视觉语言模型TrafficVLM“理解”交通。该系统还依托北斗和移动通信网络等新基建技术。上线后G2京沪高速事故数下降,春运期间其核心能力升级,提供更可靠安全保障,体现AI关键时刻救命的价值。

[TRAE.ai] 数据分析 TRAE AI IDE

不止是写代码|如何用 TRAE 进行复杂数据分析
TRAE团队介绍使用IDE进行复杂数据分析的中国版指南。
本文由TRAE团队战略分析同学分享,以TRAE中国版介绍使用IDE进行复杂数据分析。先解释数据分析是从数据提取有价值信息、为决策提供依据的过程,并指出Excel在大数据量级处理时存在卡顿崩溃等痛点,而AI让非技术人员可零门槛操作。接着对比Excel和Chatbot,阐述TRAE IDE在效率、适配性和智能化上的优势。然后通过两个场景实操演示:一是用Stack Overflow 2025开发者调研数据进行单文件分析,涵盖工具安装、数据准备、分析、图表生成、结果导出;二是用电商推荐数据集做跨文件分析。最后表明AI IDE可高效完成多数数据分析任务,能提升效率与专业性,让非开发者也能用其搭建智能工作台。

[阿里云开发者] 阿里云 评测agent 自动化评测 多模态大模型

自动化评测的九九归一——评测agent
阿里云建设统一评测agent,提升机审率及困难样本打分准确率。
文章围绕阿里云评测agent展开,去年自动打分技术难以应对业务发展。今年建设统一评测agent,可学习标准、试标打分、自动打分、预验收和分析badcase。面临提升机审率难题,需优化业务理解、抑制幻觉和提升推理能力。架构上融合多种机制提升可靠性,采用识图-推理解耦方法抑制幻觉。对主模型专项优化、评估基座切换,制定多阶段训练方案,从数据清洗到奖励机制设计,通过三个数据集评估。考虑成本最终选择部署全参模型,提升了域内困难样本打分准确率,业务上机审率持续提升,节省大量标注成本。

[阿里云开发者] AI Coding Spec RAG MCP

告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
文章介绍用 Spec + RAG 打造 AI 程序员的方法及落地实践与规划。
文章介绍用 Spec + RAG 打造 AI 程序员的方法。AI Coding 需构建上下文感知的知识体系,包括 Spec 与 RAG 知识库。Spec 是精确描述,为 AI 提供“硬规则”,Spec Coding 比 Vibe Coding 更可靠;RAG 结合搜索与生成,补全 LLM 短板,包括分块、向量编码等关键技术。MCP 是标准化通信协议,支持工具集成。落地实践构建“SPEC + RAG + MCP”体系,Spec 知识库已在猫超导购落地,RAG 知识库处于初步验证阶段,包括统一托管、智能检索等。后续规划完善 SPEC、优化 RAG、推动 MCP 云端化。

[京东技术] AI医疗 京东健康 创新 人文关怀

什么是AI产品真正的创新?扎扎实实解决用户最痛的点!
京东健康阿奇团队推出AI医疗产品“AI京医”解决用户痛点。
文章围绕京东健康AI产品经理阿奇的经历,讲述了AI医疗产品研发故事。阿奇毕业没进医院,而是加入京东健康。看到深夜医疗咨询需求及网络‘诊断’不靠谱,他参与用大模型重塑AI医疗,推出‘AI京医’。AI医生‘大为’能温暖慰藉求助者,还指导处理伤口、保留证据。同时,京东重视回复准确性,与专家合作、真人质检。强调AI创新要解决用户痛点,体现人文关怀,京东在AI医疗领域走得扎实。

[京东技术] 电商推荐系统 OxygenREC框架 生成式推荐 快慢思考

突破传统限制:OxygenREC——一个基于指令跟随的“快慢思考”电商生成式推荐框架
京东零售OxygenREC团队提出OxygenREC框架解决电商推荐系统问题。
现有电商推荐系统存在目标不一致、误差累积、延迟和计算成本高、多场景扩展性差等问题。京东零售OxygenREC团队提出OxygenREC框架,引入‘快慢思考’模式,解决推理与延迟矛盾,实现‘一次训练,多处部署’。该框架解决有限演绎推理、多场景适应与资源效率矛盾、工业级部署工程挑战等难题,有‘快慢思考’架构、语义对齐指令控制机制等核心贡献。经实验验证,其在离线实验和在线A/B测试中效果显著,提升关键业务指标。未来团队将向非自回归生成范式演进和开展跨场景用户轨迹建模。

[Web3天空之城] OpenClaw Windows WSL AI智能体

节省5000元的秘籍:无需Mac Mini本地完美运行OpenClaw, 在Windows上(基于WSL子系统)
文章介绍在Windows基于WSL运行OpenClaw的方法以节省成本。
文章介绍在Windows基于WSL子系统运行OpenClaw的方法,可省5000买Mac Mini的钱。OpenClaw在AI智能体领域火热,其工程整合出色,降低使用门槛,但安装多推荐Mac Mini。而Mac Mini有成本与性能局限,Windows直接安装也有问题。WSL是Windows里可运行Linux二进制文件的兼容层,使用它运行OpenClaw,可发挥Linux环境优势并调用Windows硬件算力。文章给出WSL安装、初始化、配置隔离性、解决网络代理问题的步骤,最终能实现OpenClaw一键安装。

[信息与交互设计研究所] 智能体 多模态交互 人工智能 医疗大模型

智能体多模态交互创新
蚂蚁集团等公司通过多模态感知能力变革智能体交互范式。
文章指出智能体正借助多模态感知能力变革交互范式。蚂蚁集团的百宝箱Tbox,构建中枢系统理解多模态意图,实现任务级交互,解放用户操作。魔珐科技的星云平台攻克AI智慧表达难题,实现多模态精准同步驱动,达成人格化一致交互。联通云智的元景屏幕操控智能体以视觉理解和精准操控改变交互逻辑,融合CV与LLM,让设备可编程自动化。联影智能的元智医疗大模型在医学知识图谱下跨模态对齐推理,构建专业多感官专家智能体,提升医疗诊断决策水平。

[深思圈] AI 金融服务 贷款催收 创业

用AI干催收,年入2500万美元,估值5亿美金
创业公司Salient用AI改造贷款服务行业并实现零客户流失率。
本文介绍了创业公司Salient用AI改造贷款服务行业的故事。其创始人Malik和Tibrewala发现贷款催收领域存在巨大需求与技术革新空间,于2023年创立公司。借助GPT - 3.5等闭源模型及Llama系列开源模型,实现业务扩展,用AI克隆乔布斯声音突破市场。公司做到零客户流失率,源于技术优势、业务价值和深度客户关系。Salient从语音AI切入,计划扩展成全栈服务平台,其成功为创业者带来诸多启示,也展现了AI重塑金融服务的潜力。

[高德技术] 人工智能 AI Agent 智能任务架构 大语言模型

从被动唤醒到主动守望:基于AI Agent的智能任务架构实践
高德AI Agent团队实践智能任务架构,提升用户体验
文章围绕基于AI Agent的智能任务架构实践展开。行业趋向让AI Agent处理异步、长耗时、可订阅任务。“小高老师AI Agent”构建了智能任务框架。范式从“定时提醒”到“智能订阅”,任务逻辑从时间驱动变为事件感知。实践中任务分周期性、监测性、长耗时三类。构建此架构面临全链路闭环、高并发稳定、系统扩展等挑战。采用分层抽象架构与“分身”部署,还介绍了任务执行保障、性能与稳定性保障措施。上线后业务反馈良好,与竞品比灵活性优,未来会朝更智能高效方向优化。

职业成长 & 技术认知

[Gartner公司] Gartner CIO AI 人机关系 职场变革

Gartner:CIO要引领组织打破人机“次元壁”
Gartner指出AI重构职场并提出评估模型和AI素养计划路线图。
Gartner高级首席分析师雷丝接受采访,指出AI对职场深度重构。技术技能半衰期缩短,企业面临“人才断层”,Gartner提出评估模型和“AI素养计划路线图”。企业需成果驱动的敏捷学习,催生“建设者”群体。组织向“融合团队”和“微型团队”演变,“数字员工”成为正式劳动力,但带来治理问题。企业CIO要完成 “三重转身”。AI下半场拼组织进化效率,企业需以人为本。

[数字生命卡兹克] AI时代 创业感悟 团队管理

给公司全员送了iPhone 17 Pro Max,也分享下我在AI时代创业的10条感悟。
作者在公司年会给全员送iPhone 17 Pro Max并分享AI时代创业十条感悟。
作者在公司年会上给全员送iPhone 17 Pro Max,并分享AI时代创业十条感悟。团队年轻,业务扩张但无融资仍现金流健康。感悟包括好奇心比聪明重要,好问题更值钱;超级个体借助AI可独当一面,岗位需重新定义;非程序员也能用AI写代码,但要明确AI边界;鼓励试错,坚持线下办公、不看工时看产出;创业要先想商业模式,保证现金流。

[大数据文摘] 程序员 AI编程 卡帕西预言

卡帕西最新预言:程序员正在分裂成两个物种
卡帕西发文称程序员正分裂成喜欢写代码和喜欢造东西两类。
2026年2月3日卡帕西在X上发长推文,分享使用Claude编程随笔。他预言程序员正分裂成喜欢写代码和喜欢造东西两类。他还描述编程中7个关键变化,如AI错误本质从语法错误变为概念性错误,缺乏简洁审美;AI有永不疲倦的韧性,让编程能力边界扩张。编程对喜欢造东西的人更有趣,对喜欢写代码的人则剥夺快感。他还预测2026年垃圾信息大爆发,最后给出不同类型程序员建议,认为2026年是行业消化AI新能力的‘高能量之年’,即分化之年。