
借CES开幕展望2026年科技趋势
本文借CES开幕展望2026年科技趋势。CES将率先呈现2026年科技趋势,焦点在于生成式AI实际应用。新终端方面,OpenAI将推无屏语音操作“AI终端”,Meta开发AI眼镜型终端,苹果将推折叠屏iPhone,折叠屏手机市场规模预计增长。物理AI将成CES主角,英伟达欲借此获“第三桶金”,机器人将进入多领域,但需应对监管等课题。生成式AI开发有不同观点,有人认为AGI或2026年实现,也有称开发迎平台期。中美竞争激烈,2026年投资者期待值或调整,部分企业或上市,AI治理必要性加强。

看完 Manus、Cursor 分享后的最大收获:避免 Context 的过度工程化才是关键
文章结合 Manus、Cursor 思路分享上下文工程要点。一是上下文缩减,Cursor 将信息文件化,采用动态上下文发现模式;Manus 设腐烂前阈值,分紧凑化、摘要化两步缩减。二是给工具搭建行动空间,Cursor 把工具描述文件化,降低 Token 消耗;Manus 设计分层行动空间,包括原子函数调用、沙盒工具、软件包与 API。三是多 Agent 协作,Manus 有任务委托和信息同步两种模式,还设计‘Agent 化的 MapReduce’系统保证输出结构化。最后提到两家设计哲学,Cursor 强调少即是多,Manus 主张少构建多理解。

深入vLLM大模型推理引擎源码:Multi-LoRA启动、加载、推理过程详解
本文围绕vLLM 0.8.4单机单卡下Multi - LoRA启动、加载、推理过程展开。58同城打造大模型平台及灵犀大模型,为节省成本基于vLLM的Multi - LoRA功能构建推理服务。文中先介绍单LoRA与Multi - LoRA部署概念及vLLM部署特性,给出类图。启动流程从vllm serve命令展开;服务加载包括model加载和Multi - LoRA加载,前者由DefaultModelLoader执行,后者有静态和动态加载入口。推理流程含请求处理、调度和执行,调度时考虑多种约束条件,执行时预处理与LoRA联动激活LoRA,加载阶段有支持LoRA推理的前置处理,推理时使用punica_wrapper。最后总结流程和原理,后续将分享落地实践。

全面解析 Agent Engineering 的 10 大工程维度:生产级 Agent 系统的炼成之路。
技术突破让AI智能体成热点,但应用中暴露出工程瓶颈,催生出智能体工程。文章介绍智能体工程概念、出现原因及10大工程维度。从Demo到生产有五道鸿沟,凸显智能体工程重要性。其定义为将不确定的基于LLM的系统迭代为可靠生产级应用的过程,使命是提高AI可控可预测性,找到性能、成本等平衡。10大工程维度包括交互、模型、推理与执行等工程,各有要解决的问题和典型实践。最后指出智能体进入工程时代,工程能力决定其能否规模化,不同企业可按需建设,开发者需提升能力。

Context Engineering 实践:我们如何管理智能体的记忆
文章围绕上下文工程展开,指出其是控制智能体记忆的关键。先介绍上下文工程核心是只给智能体必要信息,避免上下文腐化。接着阐述CAMEL框架落地的三种技术:上下文压缩聚焦关键信息,提供基于token自动、手动和基于工具包三种压缩方式;工作流记忆记录解决任务经验,通过开发者指定、基于角色匹配和智能体自行筛选加载,已在研究中提升性能;工具输出缓存曾因信息丢失和性能下降被回滚,虽节省token但会带来问题。最后表明将实施新技术、修复改进现有方法并进行基准测试,激励更多人参与AI该领域。

达摩院 AAAI'26 Oral|EarthCrafter:用双稀疏扩散模型,让AI学会“造3D地球”
本文介绍达摩院在AAAI'26提出的EarthCrafter框架,用于地理尺度3D地球生成。地理尺度3D生成挑战大,数据上存在地物类别多、范围受限、重建有问题等;方法上场景生成方法匮乏、训练架构困难。EarthCrafter从两方面创新,数据上构建最大航空3D数据集Aerial - Earth3D,模型上设计双稀疏潜在扩散生成架构。数据处理先筛选场景、规划视点,再进行Mesh重建与后处理,最后快速3D属性贴图。生成框架分两阶段、双流,包括双稀疏VAE和条件感知流匹配模型。实验表明,该框架在超大尺度3D生成任务中显著优于现有方法,兼具高保真度、多样性和地理合理性。

The Batch: 890 | 开源终将胜利
文章作者希望开源AI繁荣并胜利,认为开源生态是创新发动机,曾塑造互联网。如今一些参与者试图控制AI,如OpenAI和Meta的‘开源模型’未真开放。真正开源AI潜力大,不应被单一主体拥有,人人可参与塑造。开源开发可降低供应商锁定风险、提高定制能力。中国正形成开源生态,但有地缘政治因素,国家间缺乏信任,数据易被‘毒化’。IBM等机构践行真正开源,公开模型细节和数据,获高透明度评分,但地缘政治阴影仍在。最后作者希望2026年AI更开源。

作为 Cursor 和 Claude Code 的研发者,他们是如何看待和使用 AI
本文分享了Cursor VP Lee Robinson和Claude Code之父Boris Cherny的AI感悟。Lee Robinson认为AI写代码能力已超人类,开发者不应纠结写代码能力,要让AI接管繁琐重复工作,关注产品构建与管理、用户体验等。如他用AI实现图片压缩工具和游戏开发,感受到软件工程版图巨变而加入Cursor。他还指出模型在各领域进步快,开发者应善用AI。此外,文中提到Manus服务非专业技术人员体现AI应用方向。Boris Cherny介绍Claude Code使用技巧,如并行运行进程、团队共享文件、做好计划等,强调规模化和流程化配置可提升AI可维护性,未来程序员或成AI管理者。

Flutter 3.38.1 之后,因为某些框架低级错误导致提交 Store 被拒
Flutter 3.38.1 之后版本打包提交 iOS 包可能出现 The binary is invalid 错误,被 App Store 拒。原因是 Native Assets 功能下,构建脚本逻辑缺陷致“脏构建”,模拟器架构 Framework 被错误打包进正式发布 App。解决办法是发布前用 flutter clean 清理,若之前打过包还需清理 Xcode 构建缓存。sqlite3 作者提交 #179251 修复,读取 native_assets.json 文件,仅复制其中列出框架,但因缺少 integration test,PR 卡在等待 Review 阶段。

Dart 官方再解释为什么放弃了宏编程,并转向优化 build_runner ? 和 Kotlin 的区别又是什么?
近日,Dart 团队解释放弃宏编程、转向优化 build_runner 的原因。一是配置 Macros 存在‘undefined area’问题,解决依赖关系梳理成本高,用 JSON 格式尝试也麻烦不灵活;二是架构分裂致工作量爆炸,宏代码运行多次,系统臃肿不可扩展,且实现宏编程会影响编译速度和 IDE 性能;三是宏能力‘高不成低不就’,无法替代 build_runner 。与其他语言对比,C++、Rust 宏不适合 Dart 场景,Kotlin 无严格宏但 KSP 和 Compiler Plugins 实现更好,Swift 宏有特点。2026 官方目标是优化 build_runner,Augmentation 是新方向。

罗技鼠标因为证书过期无法使用?我是如何解决 SSL 证书问题
文章以罗技鼠标因证书过期无法使用引出 SSL 证书有效期缩短问题。作者介绍用「Let’s Encrypt + acme.sh」解决证书自动更新。主域名方面,先安装 acme.sh,适配 80 端口配置,排除 acme 验证跳转,签发证书时解决默认 CA 和系统信任链问题,最后安装证书并开启定时续期。第三方平台上,以七牛云为例,通过获取 DNSPod API Token 和七牛云 AK/SK,用 acme.sh 自动签发和部署证书。最后提到可查看证书状态、强制续签,acme.sh 靠 cron 定时任务自动续签,不依赖 systemd 服务,能解决个人证书管理问题。

更新 Flutter 重要 Fix 快讯和两个有趣的东西
2026年1月9日更新 Flutter 相关内容。Flutter 3.38.6 发布,修复 iOS 26 棘手问题,WebView 点击问题合并临时修复方案;针对上传 App Store 校验失败,有 native assets 的开发者用 main 渠道,存档前执行相关命令,无 native assets 的可用 main 或 stable 渠道。还分享 2025 应用端最受欢迎 SDK 排名,数据源于 appfigures 分析数百万应用和游戏后按 SDK 安装数排名。最后提到最近做的十个动画合集更新,动画存于指定 GitHub 链接。

社区供稿丨Reachy Mini 亮相 CES 黄仁勋主题演讲:一场开源共创的科技旅程
本文介绍了Reachy Mini亮相CES 2026黄仁勋主题演讲的情况。NVIDIA在演讲中发布新开放模型,黄仁勋展示用其驱动Reachy Mini,演示具身智能三大支柱。Reachy Mini是Hugging Face首款开源桌面机器人,能与用户语音和动作互动,可完成对话、管理清单等任务。从原型到量产,Seeed Studio等团队紧密协作,攻克声学难题并按时发货。它是开放AI试验场,集成先进模型、全栈开源且社区驱动。Seeed Studio还支持其他开源套件和计算平台,呼吁共同构建物理AI基础设施。

你的应用被视障用户吐槽?可能是没支持这个新功能
文章介绍了苹果在 WWDC25 推出的 Accessibility Nutrition Labels 功能,用户在 App Store 可查看应用无障碍功能支持情况。此功能对有需求用户和开发者有益,标签由开发者声明并经苹果审核。还阐述了多项无障碍功能,如 VoiceOver 需手动优化自定义控件,Voice Control 与 VoiceOver 支持重叠,Larger Text 要支持 Dynamic Type,Dark Interface 可用系统颜色适配,Differentiate Without Color Alone 不能仅靠颜色传达信息,Sufficient Contrast 要保证文字与背景对比度,Reduced Motion 可通过环境值检查设置,Captions 要确保视频有字幕轨道,Audio Descriptions 需媒体文件有音频描述轨道。最后说明在 App Store Connect 声明及各类型应用的应用场景。

iPhone Fold 上手:比 mini 还小,比 iPad 还大
文章介绍了Apple 2026年产品计划。重头戏是9月将发布的折叠屏iPhone Fold,作者拿到其3D打印模型,折叠时比iPhone 13 mini小,便于携带和单手操作;展开后接近小尺寸平板,适合多场景使用,但iOS适配和是否支持Apple Pencil存悬念,且相比三星Galaxy Fold系列风险更大。此外,Apple将推低价MacBook面向教育和入门用户;全新Siri将搭载大模型,功能更强大;还曝光了早期AirPods彩色充电盒原型,但最终未量产。

如何提高 iOS App 评分?99% 的开发者都用错了时机
文章围绕如何提高 iOS App 评分展开。iOS App 评分影响推荐算法和用户下载决策。介绍 StoreKit 2 的 RequestReviewAction 请求评价方式,其一年最多 3 次。苹果建议在用户完成成功操作后请求,避免启动时、操作直接结果、用户遇问题时请求。给出 SwiftUI 和 UIKit 实现代码,都要延迟 2 秒。还提到用 ReviewPromptManager 管理版本,避免同一版本重复请求。最后列举习惯追踪、游戏等不同应用适合请求评价的场景,也指出 iOS 有隐私设置,部分用户不喜欢评价属正常。

ChatDev 2.0:零代码构建多智能体,快速开发一切
清华大学等联合团队开源 ChatDev 2.0,这是人人可用的零代码多智能体工具。它将多智能体系统构建门槛降至接近零,通过“拖拽+配置”范式实现零代码开发。其底层编排能力强,有丰富节点类型,连边实现控制流与数据流解耦,支持无限嵌套与自由拓扑。它还提供标准化模板和代码级拓展,满足不同开发者需求,可构建支持多种功能的多智能体系统。文章欢迎社区参与共建,期待与关注多智能体系统的人共同探索。

Agent上下文工程被Cursor玩出了新高度~
本文介绍了Cursor在Agent上下文工程方面的创新。Cursor的agent为所有模型使用动态上下文,能更智能填充上下文,使用多MCP服务器时可减少总token数。随着模型能力提升,动态上下文发现模式出现,它按需提取相关上下文,效率高且能提升回复质量。文中还介绍了在Cursor中使用动态上下文发现的做法,包括将长工具响应转化为文件、摘要时引用聊天记录、支持Agent Skills开放标准、仅加载所需MCP工具、将集成终端会话视为文件。最后提到文件可能成为基于LLM工具的接口形式,未来会分享更多进展。

SentGraph:一句一句把多跳RAG“画”成图
文章介绍了SentGraph方法解决多跳RAG问题。传统RAG在多跳场景易“断链”,原因是检索单元粒度粗、逻辑关系乱。SentGraph将检索单元从“段”缩到“句”,构建三层图,包括Topic层、Core句层、Sup句层。线下建图分拆句、找关系、架桥梁三步;线上推理有Anchor初选、精炼、路径扩展三步。实验表明,该方法在多个数据集上表现优于基线,更省token,小模型也适用。不过,它存在建图依赖大模型、关系类型需针对任务设计、线下构图计算量大等局限。

微软:DeepSeek-R1等推理模型循环的原因找到了
微软等对推理模型循环问题展开研究。近期DeepSeek - R1论文更新,包含数据配方、基础设施等内容。研究发现推理模型(如DeepSeek - R1、OpenThinker等)在低温/贪心解码下易循环,根源是学得不对。小模型比大模型更爱复读,升温只能打断循环,不能纠正概率分布。通过星图随机游走等实验,揭示风险规避和时序相关误差两种循环机制,且模型会越复读越自信。最后提出训练时干预、课程学习、架构改进、解码策略、蒸馏方法等解决方向,强调真正解决需在训练阶段减少误差。

刚刚,Anthropic分享了他们在AI Agents评估的最佳实践
Anthropic发布《揭秘AI Agents评估》,指出良好评估能助力团队自信发布AI智能体,避免生产环境问题。评估分为单轮和多轮,智能体评估更复杂,有任务、试验、评分器等组件。构建评估可明确成功定义、加速迭代。评估结合基于代码、模型和人类的评分器,有能力和回归评估。不同类型智能体评估方式有别,如编码、对话等。还介绍了思考非确定性的指标pass@k和pass^k。给出搭建优秀评估路线图,强调结合自动化评估、生产监控、用户反馈等多种方法全面了解智能体性能。

R1论文更新,V4春节发,DeepSeek又酝酿大动作?
最近DeepSeek动作频频,元旦发表mHC论文,1月4日DeepSeek - R1论文从22页涨至86页,The Information称其新一代模型V4将于春节前后发布。V4是2024年12月发布的V3模型的继任者,初步实验显示V4在编码方面已击败Anthropic的Claude和OpenAI的GPT系列。此外,还介绍了DeepSeek - R1论文更新的相关内容,包括精确数据配方、基础设施、训练成本明细等,还罕见披露‘失败尝试’,如PRM和MCTS为何失效,并且扩大了评测对比范围,还有10页安全报告。

超越AlphaFold3,实现模型容量的规模化扩展,字节提出分子结构预测模型SeedFold
高精度生物分子结构预测对结构生物学和药物发现很重要,构建基础模型关键在于确定规模化技术方案。字节跳动 Seed 团队提出 SeedFold 模型,实现模型容量规模化扩展。它采用 AlphaFold3 架构并改进,通过宽度扩展和大规模数据蒸馏提升容量,还推出 SeedFold - Linear 高效变体。研究确定控制模型规模扩展关键因素,提出线性三角注意力降低复杂度,构建大规模蒸馏数据集。在 FoldBench 测试中,SeedFold 及其变体在多数蛋白质任务上超越 AlphaFold3,且不同模型在特定任务有优势,凸显异构注意力机制对优化性能的价值。

OpenAI发布ChatGPT新功能,专为健康打造的个人服务体验
2026年1月7日,OpenAI推出新产品ChatGPT Health,整合用户健康信息与智能,帮助用户了解自身状况、做健康决策。全球每周超2.3亿人用ChatGPT问健康问题,ChatGPT Health可结合用户健康信息与情境,连接电子医疗记录和健康应用,支持处理日常健康问题。它独立运行,有多层隐私保护,先向部分用户开放,未来扩大范围。该功能由OpenAI与医生合作打造,用HealthBench评估回复质量,旨在辅助而非取代医疗护理。使用时,获取权限后选‘Health’,导入信息,围绕健康聊天,还能自定义体验。

OpenAI for Healthcare——面向医疗保健的AI产品
2026年1月9日,OpenAI宣布推出OpenAI for Healthcare,含1月7日推出的ChatGPT for Healthcare并已推广至部分领先机构。该产品旨在帮助医疗机构提供更优质护理,通过提供安全企业级AI基础支持HIPAA合规,缩小医疗差距。其ChatGPT医疗平台有构建医疗工作流模型、证据检索带引用等特点,能减轻行政负担。早期医院合作伙伴已推广该服务,开发者可借助OpenAI API构建医疗应用。产品由GPT - 5.2驱动,能提升护理质量。未来,OpenAI会基于过往工作,结合实际经验改进医疗产品。

深势科技发布Deploy-Master:一天部署5万个科学计算工具,这可能是Agentic Science真正的起点
2026年1月9日深势科技发布Deploy - Master。过去科学计算领域开源软件多,但大多无法直接运行,存在部署瓶颈,制约可复现性等。AI for Science兴起使问题放大,尤其在Agentic Science场景。Deploy - Master围绕部署链路设计成一站式自动化工作流,Search Agent从约50万个仓库筛选出52,550个候选工具;Build Agent采用双模型辩论机制将构建成功率提至95%以上。成功部署50,112个工具,可观测部署行为。它为Agent提供基础前提,虽未解决所有问题,但让执行成为能力成立前提,是迈向执行现实的尝试。

担心 AI 执行命令风险大?揭秘 TRAE 的安全防护
随着大模型与 Agent 能力增强,AI 编程助手成开发者“副驾驶”,但将代码仓库“编辑权限”交予 AI 存在风险,如某网友使用 AI 产品时 800G 文件被删。规避此类风险需 LLM、开发者和 IDE 三方共同努力。TRAE 致力于打造安全可信 IDE,通过“沙箱”等多重安全机制降低命令运行风险。沙箱模式为 Agent 命令执行提供环境,明确文件系统权限边界,识别越权操作;Shell 拦截机制对高危命令越权操作检测拦截。当前沙箱功能在灰度中,支持 macOS 及远程 Linux,Windows 功能待开发。TRAE 愿与开发者共建安全防线。

用第一性原理拆解 Agentic Coding:从理论到实操(上)
本文是用第一性原理拆解 Agentic Coding 上篇,先介绍 LLM 本质,其按自回归生成预测下一个 token,推理即生成,无独立记忆,生成有概率性,带来局部最优等局限。Attention 机制助其阅读上下文,但受上下文长度限制。强化学习让模型学会做事,通过尝试、反馈、调整循环适应 Agent 任务。接着阐述 Coding Agent 实现原理,包括 API 结构、工具调用、推理内容保留、Prompt 缓存和 Agent Loop 等。最后指出常见问题如会话间失忆、上下文窗口耗尽等,并给出对应解决方案,下篇将走向实操。

用第一性原理拆解 Agentic Coding:从理论到实操(下)
本文围绕 Agentic Coding 展开,介绍了提升效率的策略。主张采用“短对话、精简上下文”模式,将大任务拆分为小任务,以对话为单位组织工作,传递必要上下文。强调编写有效项目配置文件,控制文件内容和长度,采用渐进式披露策略。指出 200K Token 对多数任务足够,应合理使用上下文窗口。还阐述了 Compounding Engineering 理念,将经验沉淀到项目文档,让 bug 修复和代码审查产生长期价值。此外,说明提升人类开发者体验的工作对 AI 同样重要,要为 AI 优化测试、提供快速反馈等,同时要考虑 AI 与人类的差异,设计友好的工具接口和错误信息,避免过度干预 AI 决策。最后鼓励开发者刻意练习,成为 Expert Generalist,在 AI 时代发挥更大价值。

让性能瓶颈自己开口说话:AI 驱动的下一代 JVM 性能诊断革命
文章介绍了一种基于AI的JVM性能诊断方案,将JFR事件采集、日志投递系统与大语言模型融合。传统性能分析工具依赖专家经验、效率低,而此方案能实现‘感知 - 分析 - 决策’一体化。数据采集通过自研JVM探针集成JFR,性能分析让AI结合运行数据与代码上下文。该方案已成营销团队排查首选,以立减中心为例展示诊断报告和优化方案,包括缓存、RPC调用等问题的分析与优化,并给出实施计划、监控验证指标和风险控制措施。未来可扩展至多语言生态,实现自主优化闭环。

2025京东零售技术年度精选 | 技术干货篇
2025年将结束,京东零售精选10篇零售技术好文分享,新一年会继续输出干货。包括供应链智能规划算法,赋能业务;自研数据库DongSQL,为电商提供支撑;开源OxyGent框架,推动群体智能;介绍生成式推荐系统、广告主智能助手、商家智能助手技术;还涉及ClickHouse查询、Text2SQL技术突破、Taro鸿蒙方案和架构提效探讨。

ACM Multimedia | 京东零售广告创意:统一的布局生成和评估模型
本文介绍入选顶会ACM Multimedia的Uni - Layout框架。当前布局生成方法任务特定、评估标准与人类感知不一致。Uni - Layout实现统一生成、模拟人类评估及二者对齐。它将布局任务整合到统一分类系统,用多模态大语言模型构建统一生成器。编制含10万个人工标注布局的Layout - HF100k数据集,开发结合视觉和几何信息、采用思维链机制的模拟人类评估器。提出动态边距偏好优化(DMPO)技术对齐生成器和评估器。实验表明,评估器准确率达85.5%,远超现有MLLMs;生成模型在多个任务指标及人类模拟评估中表现出色,验证了Uni - Layout的有效性。

Apache Hudi 在京东的最新架构演进
本文介绍京东数据湖现状、自研技术、业务实践、社区贡献与未来规划。京东数据湖规模超500PB,基于HDFS和Hudi,京东大数据平台提供全生命周期产品能力。京东基于社区0.13.1版研发Hudi,在组织协议层和IO传输层做优化。自研技术特性有Hudi MoR LSM - Tree、Partial Update Foreign - Key Join、Hudi NativeIO SDK。业务实践以流量数仓ADM数据湖升级为例,解决了写入性能、数据倾斜等问题。京东Hudi团队向社区贡献109个PR,未来将推进版本演进、支持多模态、探索湖流一体等。

京东AI购,一句话搞定吃喝穿用,背靠自研大模型
本文介绍京东AI购APP,它于12月27日上架,以自研“京东大模型JoyAI”为底座,以对话交互,解锁按需找货体验。首页左“灵感空间”有六种类型模块,点击触发指令,覆盖生活场景;右“爱购”区域推荐零碎商品。亮点是各模块绑定指令引导对话,如“外卖下单”“穿搭灵感”等。底部输入栏可随时对话,“对话”界面还有“找优惠”“AI试穿”快捷入口,“AI试穿”体验好。该应用能听懂主流需求、给出合理反馈,但也存在小瑕疵,是从信息型电商到服务型AI助手的体验变革。

京东购物车的商品推荐,为什么淘宝不学?
文章探讨淘宝不学京东购物车商品推荐功能的原因。一是用户使用购物车习惯不同,京东用户买高价标品,购物车使用频率低,加购推荐不打扰;淘宝用户常买低价商品,用购物车凑单比价,加购推荐易打断流程。二是推荐命中率不同,京东推荐配件转化阻力小、命中率高;淘宝推荐受多种因素影响,转化效率有限。三是用户对‘推荐即加购’接受度不同,京东用户可直接下单,淘宝用户需核验信息。此外还指出竞品分析要注重颗粒度,不能只看表层,可延伸出设计点。

GenAI输出内容控制的5种设计模式
本文介绍GenAI应用中控制模型输出内容的五种设计模式。Logits掩码模式在束搜索时干预token选择,适用于品牌一致、准确合规等场景,反例是用规则集校验重生成。语法模式类似内置正则,控制输出格式,但部分模型不支持,与Logits掩码相比各有优劣。样式转换模式适用于难定义规则场景,有few - shot和Fine - Tuning两种方案。逆向中和模式先生成中性结果,再用微调模型转换风格。内容优化模式通过偏好调优生成最优内容,避免明确定义差异因子。最后对比各模式的问题、方案和使用场景。

AI工程vs传统工程 —「道法术」中的变与不变
本文从“道、法、术”三个层面剖析AI工程与传统工程的异同。指出AI工程是在传统工程基础上为应对不确定性的架构升级。在“道”上,目标原则不变,但对“正确性”理解从追求绝对正确转向管理概率预期;“法”方面,经典软件工程原则延续,不过核心建模转向上下文工程,要设计可控的不确定性边界;“术”里,工程基本功仍重要,同时需补充如上下文工程、多维度评估体系等新工具。最后给出AI工程建设建议,如理解大模型原理、升级系统目标等。

HLS流媒体技术:畅享高清视频,忘却MP4卡顿的烦恼!
转转学堂为超3000员工提供培训视频课程,此前视频(mp4格式)播放卡顿问题突出。为解决该问题,团队尝试多种方案:一是搭载腾讯云TCPlayer播放器,虽页面样式改善,但未解决根本问题且成本高;二是优化视频分辨率、编码等参数,能减少部分卡顿,但规范难统一且不能完全解决;三是采用HLS流媒体(m3u8格式)播放,经对比测试效果好。实现方式上,考虑腾讯云转码接口、前端实现文件转码服务、架构组支持转换三种,最终选架构组支持的前端调用sdk上传后再调用转码接口方案,搭配腾讯TCPlayer播放器,解决卡顿。此外还记录使用TCPlayer播放流媒体时遇到的问题及解决办法。上线一年后,业务反馈视频加载快、体验佳。

前端平台大仓应用稳定性治理之路|得物技术
随着业务发展,前端平台新建应用增多,稳定性问题突出。2023年7月试行前端大仓研发模式,2024年初开始体系化治理。形成“定义指标→制定目标→过程跟进→结果复盘”闭环治理体系,围绕Git元数据大小、代码质量分等5大指标治理。治理成效显著,如Git元数据减小、代码质量分提升等。各业务域在Q3普遍达成质量标准线,未出现因治理导致的线上故障。后续将结合AI加固稳定性。

得物技术文化|2025年度回顾
这是得物技术2025年度回顾。得物技术团队自2019年成立,以成上海最好技术团队为目标,规模增长二十几倍。2025年围绕关键指标打造学习型组织,助力技术人成长。技术文化阵地成果丰硕,技术博客发文多、阅读点赞评论量高,内部分享、技术夜校等活动也有出色表现,还申请多项专利、发表多篇顶会论文。得物获官方认可,入选全国首批商业技术应用创新中心培育名单,团队和个人获多项安全、公司、社区荣誉。最后欢迎优秀同学加入,一起探索未知领域。

深度实践:得物算法域全景可观测性从 0 到 1 的演进之路
文章介绍了得物算法域全景可观测性从 0 到 1 的演进之路。先介绍可观测性的“四大支柱”联动愿景,即 Trace、Metric、Log、Event 协同。接着阐述核心攻坚方面,Trace 标准化解决 C++ 侧 SDK 缺失问题,采用自研 SDK、压缩方案等;Log 标准化实现跨语言语义对齐与格式规范。以“场景”为魂构建知识图谱,通过场景化建模、动态元数据与流式计算实现。智能化演进上,异常检测用改进型 IQR 算法,事件标准化统一协议并关联场景。最后总结一期聚焦实用性打通纵向关联,二期将解决存量问题并延伸观测维度到业务效果指标。

EEPO:“采样后遗忘”,帮助大模型在RL训练中更“聪明”地探索
大语言模型强化学习中,“探索与利用的平衡”是难题,训练易使模型熵崩塌、探索和泛化能力下降。微软亚洲研究院与香港中文大学提出 EEPO 方法,用“采样后遗忘”机制打破自我强化闭环。该机制分两阶段采样,先采样后遗忘,抑制主导模式,提升探索多样性,实现策略优化与探索解耦。EEPO 在何时、遗忘什么及如何遗忘上有关键设计,还具有自适应功能。实验显示,它在多个数学推理基准上显著提升平均准确率,增强探索能力同时保持利用能力,提升泛化性能,且训练开销低。此外,它是通用探索增强插件,适合多种推理任务等场景。

机器人缺大规模数据?VITRA用人类视频重建VLA预训练新范式
数据稀缺限制通用机器人操作大模型发展,传统机器人数据采集高成本、低效率且多样性不足。微软亚洲研究院提出 VITRA 方法,将无标注人类活动视频转化为与机器人训练数据格式对齐的数据。该方法分三步:用 3D 视觉技术重建视频轨迹;按运动速度最小值切分长动作;将重建的 3D 手部轨迹叠加到视频帧生成语言指令,构建了大规模 VLA 数据集。同时,针对人类视频特点优化 VLA 模型,使其更“懂镜头”,并引入因果注意力机制。验证显示,新方法预训练的模型零样本预测与泛化能力强,为可泛化 VLA 模型提供新范式。

精通 UITableViewDiffableDataSource——从入门到重构的现代 iOS 列表开发指南
文章围绕UITableViewDiffableDataSource展开,介绍其优势并通过音乐播放列表App示例讲解使用方法。该工具解决传统数据源管理痛点,如状态同步、批量更新和动画计算问题。首先介绍基础入门,包括项目初始化、定义遵循Hashable协议的数据模型,创建并使用DiffableDataSource填充数据。接着讲解自定义单元格和核心交互,如定制不同样式的单元格,实现拖拽重排和滑动删除功能。最后探讨高级技术与重构,涉及不同更新策略、手动操作快照及架构设计,体现其在构建高性能界面上的强大优势,代表了iOS列表开发的未来。

支付宝超级 App 架构演进实践:构建面向未来的支付宝组件化范式
本文分享支付宝超级App架构演进实践。随着产品矩阵扩张,支付宝面临包体积激增、代码复用难、工程复杂度高的挑战。为此,团队围绕多App复用、极致瘦包、结构标准化构建组件化架构范式。架构设计包括以组件为复用单元、构建可插拔应用模型等策略,提出八项设计原则。组件化框架在性能优化、动态化适配、多技术栈支持方面有突破,如优化对象创建性能、实现JNI静转动适配、支持KMP组件化。平台化建设涵盖依赖分析、元数据管理、防劣卡口和新产品孵化。此次架构演进使主端和预装包瘦身,代码复用效率提升,后续将推进组件标准化、迭代框架能力、强化平台治理并输出方案。

AI + 地图可视化:Nano Banana 生成手绘地图
在智慧旅游背景下,传统手绘地图制作成本高、更新慢。文章介绍通过AI与地图可视化融合探索手绘地图高效定制方案。该方案构建低成本、高效、可迭代工作流,能快速生成底图,经AI风格迁移成不同手绘效果,还能灵活编辑,实现局部精准修改。同时让手绘地图实用化,可自动配准。未来有望变革中小型景区手绘地图生产,延伸至多元场景。

AI 实践:Code Insight 代码搜索定位的实践分享
本文围绕Code Insight代码搜索定位展开实践分享。先介绍代码索引,它能提高搜索导航效率,不同工具索引策略有别,公司自建可支撑AI编码、保障安全和降低成本。接着阐述实现方案,基于向量嵌入的RAG方案含分块、嵌入、检索步骤,团队选LlamaIndex框架和合适模型;基于AST的方案结合AST与符号表构建结构化认知。落地应用于智能代码问答、TraceAI问题定位、智能测试用例生成。实践心得是重视数据质量、拥抱不确定性、拆解复杂问题,还对比业界方案。未来将探索跨仓库分析、问题定位Agent落地和业务文档自动生成。
用户体验视角的品牌设计:2025天猫双11品牌设计分享
本文是2025天猫双11品牌设计分享。初入淘天设计的校招新人尹川参与此项目,团队明确活动品牌主张“全新以赴,多彩生活”,从颜色、结构、元素、材质提炼视觉语言,主视觉KV营造轻盈灵动效果。新人需从商业角度做设计,让表达普适准确。项目注重视觉一致性,用视觉锤在多场景统一表达,提炼出四大核心原则。同时强调团队协作重要,成员头脑风暴确定设计逻辑,个人成长与团队协作相互促进,将个人能力转化为协同生产力。

2025 AI 游戏实测:被高估的生成,被低估的脏活
文章围绕2025年AI生成游戏展开探讨。先介绍了AI生成游戏的初尝试,如使用Gambo、Rosebud、灵光等工具,发现虽能快速搭建小游戏,但在需求理解和生成效果上有局限。接着分析产品形态,指出AI缺乏对交互体验的判断能力,vibe coding在游戏开发中虽能提效,但也面临数据、引擎等问题,remix和模板化有落地价值。然后探讨UGC社区发展,认为早期BCD融合,创作者生态发展需平衡创作者门槛、平台运营等因素。最后提及创业者机会,可关注资产对齐等脏活,利用垂类专业知识,设计不同交互方式。

当 veDB 遇上 AI:云原生数据库的智能诊断创新,覆盖重保/应急全场景
本文介绍火山引擎veDB智能诊断创新。veDB是字节跳动自研云原生数据库,对内承载大量业务,对外以DBaaS输出。诊断流程含问题发现、根因定位和故障止损。问题场景分资源瓶颈、时延升高、系统异常类,按紧迫程度又分日常运维、客户重保、紧急情况。采用全量SQL洞察、全链路时延分析、告警智能诊断、智能重保观测、秒级指标监控等技术应对。全量SQL洞察可定位资源瓶颈问题,全链路时延分析解决单条SQL时延问题,告警智能诊断通过SOP指南和智能RCA定位根因,智能重保观测用AI提升效率,秒级指标监控满足极端场景诊断需求。

AI赋能百度优选商家经营提效的交互设计实践
随着AI在电商渗透,百度优选商家后台面临‘不会用、不敢信’问题。为此以‘统一AI认知提升商家经营效率’为目标升级体验。采用嵌入式、伴随式、托管式三种交互范式,嵌入式用于复杂表单填写,缩短发品时长;伴随式主动触达与连续洞察,转变为主动赋能伙伴;托管式在客服场景实现自动化服务。还构建智能视觉语言体系和感知系统,解决体验困境,提升业务价值,沉淀的方法论为更多场景提供模板,未来将围绕需求迭代。

如何画好一张架构图丨终极典藏版
本文介绍如何画好架构图。首先说明架构图目的,它是团队沟通桥梁,可明确方向、降成本、提效率、便协同,目标用户有项目团队角色、外部客户和各层次TL。接着阐述好架构图标准,要结构清晰、外表美观、内容完整明确,可通过设计原则、色轮运用、黄金分割构图等实现。架构图核心要义是分层、分治、抽象,有自顶向下和自底向上两种抽象方法。然后介绍7种常见UML架构图画法,包括类图、时序图等。最后总结架构图用于思考和交流,不必纠结标准,还推荐画图工具https://app.diagrams.net/。

Agent全面爆发!万字长文详解上下文工程
文章围绕Agent时代的上下文工程展开。从Chatbot到Agent,因应用场景变复杂,模型需更大时间尺度理解任务上下文,上下文工程从提示工程演进而来。提示词工程在多步骤推理和持续决策场景有局限,而上下文工程易被误解为多塞信息,实际要解决在有限空间提供高价值信息、避免干扰的问题。其关键组成部分包括工具、工具调用结果反馈、思考过程表达、交互管理、平衡自主性与约束。MCP为上下文提供结构化落地方式,让其成为系统运转一部分。同时,可从可靠执行、错误处理、调试观测等维度加强智能体系统可靠性。未来,上下文工程重要性将凸显,AI将进入经验时代。

AI 辅助重构 20 万行代码:渐进式重建代码秩序
文章围绕AI辅助重构20万行代码展开。因技术债到临界点,作者开启推荐系统粗排服务重构,选择AI辅助是因其能理解代码结构等。重构分七步:先建立战略框架,再用AI看清现状,拆解大函数,用策略模式和依赖注入,引入Pipeline模式,进行性能优化和代码质量提升。还建立复用体系,沉淀依赖注入等组件。人机协作要明确分工、掌握提问技巧和迭代式流程。重构有收获也有坑,如代码质量提升但AI有局限。最后强调重构要把控节奏,架构源于实践,使用AI需独立思考。

Ray异构融合底座重构数据管道:架构演进与万卡落地实践
随着大语言模型和多模态技术发展,传统大数据引擎在处理非结构化多模态数据时局限性凸显。本文介绍基于Ray重构混元数据管道工作,先指出传统大数据引擎在AI数据管道中存在细粒度资源调度难、异构计算能力弱等局限。接着阐述基于Ray的新一代数据管道架构,包括云原生调度融合和计算范式融合。然后从容错、资源利用率、规模化、可观测性四方面介绍优化实践,如增强容错机制、提升资源利用率等。最后说明重构收益,Ray成混元数据管道统一底座,半年完成10+条管线重构,实现万卡生产化,还能节省资源、提升利用率和推理成功率、提高研发效率。

认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境
作者分享使用 Speckit 三个月后放弃,探索 AI 工程化方案的历程。起初团队尝试 AI 辅助编程遇规模化复用难题,Speckit 和 openspec 虽理念好但不适配企业现实,存在需求动态变化、无法应对‘考古’需求等问题。作者借鉴复合工程、上下文工程理念,设计 AI 工程化架构,包括 Agent + Skill 分层、目录结构等,实现经验沉淀和复用。落地时冷启动快、能持续迭代和团队协作。未来工具将隐形,AI 工程化让研发聚焦核心工作,解决企业场景上下文缺失、知识不沉淀等问题。

拥抱大模型:深入剖析ReAct的核心原理、技术架构及其对AI领域的深远影响
文章深入剖析ReAct的原理、架构及影响。ReAct是“推理+行动”的智能体架构范式,构建“推理-行动-观察”闭环,具备显式推理轨迹、外部环境锚定、少量样本泛化特征。其工作分初始化、循环迭代、终止输出三阶段,采用三层模块化架构。它破解传统AI“事实幻觉”“策略僵化”“决策不可解释”“多场景适配高成本”难题,还给出代码示例并介绍在多领域的应用场景。不过,ReAct存在依赖LLM上下文窗口、缺乏行动效果量化评估等局限,未来可与强化学习、外部记忆机制融合优化。

为什么有人选择和AI结婚?
文章围绕人们选择与AI结婚的现象展开。从美国到日本、欧洲,有人与AI建立深度情感关系,折射传统亲密关系断裂与重构。如美国克里斯·史密斯、纽约罗珊娜·拉莫斯、荷兰雅各布·范·利尔,及日本野口由里菜等案例,展示AI成为情感参与者,影响人类情感与行为。其原因是AI能提供个性化体验,满足情感需求,技术限制会加速情感确认,且交互可控、稳定。但这也带来法律伦理问题,如虚拟伴侣无法律身份、责任界定不明,过度依赖有现实风险,未来需建立相关框架。

数智时代的文脉赓续:中华优秀传统文化的保护与活化
文章探讨数智时代中华优秀传统文化的保护与活化。数字技术融入文化遗产保护全链条,构建“数字基因库”,推动保护提质增效。传承不止存档,科技挖掘文化内涵,通过体验消弭认知壁垒。文化遗产外溢效应凸显,融入社会经济循环催生新业态。数字文化产业出海助力文明交流。不过,文化科技融合要避免生硬拼接与过度炫技,解决数据孤岛问题。生成式人工智能为传承创新带来机遇,人类要以人文价值为指引,为其设定规则,服务文明赓续与人的福祉。

新出版:AI驱动的产业变革与知识文化创新范式
本文围绕“新出版:AI驱动的产业变革与知识文化创新范式”展开。首先阐述出版在知识文化传承中的角色,指出智能时代应与AI融合。知识生命周期含生成、应用、再生环节,出版在创新、传播、应用场域支撑其循环。接着说明出版与AI融合有思考工具等三方面分离与融合。融合分四阶段,从AI赋能到共创。之后提出数智网成技术新基座,新出版将构建生态但面临挑战。还提及共创可信和灵涌内容生态。最后展望新出版“AI化+游戏化”远景,如复旦大学开发系统、香港联合出版集团打造项目,期待共创文化新生态。

2025年意识科学十大前沿进展
本文介绍2025年意识科学十大前沿进展。两大意识理论对决,确立对抗性合作新范式;皮质下研究揭示丘脑等对意识作用;量子意识理论获实验支持;四分之一“植物人”被发现存在隐性意识;AI意识引发关注与争议,学者提出评估框架;语言影响意识认知;动物意识具基质独立性;研究基础设施升级;IIT引发“伪科学”之争,催生结构性转向;意识研究面临伦理挑战,“比困难问题更困难的问题”受关注。

[A's Trend] 智感无声|QQ浏览器PC版的AI进化
文章围绕QQ浏览器PC版的AI进化展开。首先提到在AI技术推动下,浏览器类产品迎来新生,QQ浏览器PC版也进行AI升级。在框架方面,构建简洁有序的AI“智感”基座,包括做减法精简入口、做合并优化功能查找、多变且减少层级、规整数据资产,还有UI表达从“待命”到“参与”。在AI旅程上,依据阅读、聆听、观看、代办四个核心场景定制“智感”体验,如网页阅读提纯信息,沉浸聆听实现声画共鸣等。最后指出下一代浏览器体验是“智感”,此次升级是对体验边界的拓宽。

[A's周刊 14] 解构视觉诗意
这是A's周刊14期内容,涵盖2025年12月29日至2026年1月5日设计与科技趋势。谷歌年度回顾展示AI在推理等方面突破,引入生成式用户界面,辅助创意工作。Rainbow Draws插画工作室用旅行元素创作有触感插画。Obys工作室为生物公司官网打造可交互数字体验。伦敦博物馆形象升级,以鸽子符号和碰撞字体传递核心宗旨。游戏《Clair Obscur: Expedition 33》以明暗对照为美学理念融合多种艺术风格获奖。《Nature》公布2025年度科学图片,涵盖天文、微观等领域,展现科学与视觉的结合。

面向可观测数据融合的 Exemplar
文章围绕货拉拉应用 Exemplar 技术解决可观测数据融合问题展开。可观测性领域异构存储架构致跨数据类型关联难,货拉拉现有 Monitor 系统关联能力待提升。Exemplar 技术可构建指标到原始观测数据追溯路径。行业主流 Exemplar 方案有局限性,货拉拉提出 Exemplar as a Dimension 理念。货拉拉选用 VictoriaLogs 为存储引擎,设计文本传输协议、SDK 数据上报机制和 Exemplar - Collector。可视化交互围绕结构化日志特性,具智能关联等四大能力。Exemplar 在货拉拉落地效果好,未来将深化其在数据融合应用,实现框架指标与链路精准关联及基于其数据的故障定位。

基于Jenkins的Docker零宕机部署实战方案
文章介绍基于Jenkins的Docker零宕机部署实战方案。先分析原始问题及根本原因,接着阐述整体架构,含核心脚本及部署流程。Jenkins集成方案涉及Pipeline和凭证配置。核心脚本包括主部署、智能启动、资源清理和磁盘监控脚本。零宕机部署通过容器切换和回滚机制实现。磁盘空间管理有监控告警和清理策略。还给出实践建议,如Dockerfile健康检查、Jenkins定时清理等。最后介绍常见故障排查手段,总结方案可实现全流程自动化,提高部署效率和系统可靠性。

2025 年终回顾:软件工程 3.0 全面落地,AI 重塑研发新范式
2025 年是软件工程 3.0 从概念走向规模化落地的关键一年。《软件工程 3.0 时代》公众号围绕 AI 原生研发等核心议题输出近百篇深度内容。文章核心覆盖软件工程 3.0 范式革新、AI 技术全流程渗透等领域;内容特点是趋势前瞻与实践落地、技术深度与普适性兼顾,痛点导向与解决方案闭环;核心观点涉及软件工程 3.0 本质、LLM 应用、AI Agent 等;还列出阅读量 TOP10 热门文章。2026 年将聚焦 AI Agent 等核心议题。

今年春节,程序员将过不好年吗?DeepSeek V4 携 mHC 架构突袭
春节前后,代号“编程之王”的DeepSeek V4将发布,坊间传闻其性能强劲。算法研究员通过分析10天前发布的《mHC: Manifold-Constrained Hyper-Connections》论文,从多方面实锤爆料亮点。一是训练稳定性有数学突破,mHC将失控信号增益压缩到稳定范围;二是推理能力实测提升,在BBH和DROP基准测试中表现更佳;三是架构创新支撑长上下文,提供4倍残差流带宽;四是编程能力有逻辑推导基础。mHC仅增加6.7%训练开销就带来诸多提升,这或许是程序员的新年礼物。

欢迎来到数字矿场:一条用人命和创伤喂养AI的全球产业链
文章揭示了人工智能发展背后用人命和创伤喂养的全球产业链。科技巨头宣扬AI强大审核能力,实则依赖人工审核。如阿布拉审核家乡战争内容,金斯筛选儿童性虐待材料,他们都遭受严重心理创伤。全球多地审核员面临相似困境,保密协议让他们沉默。数据工作存在直接创伤和系统性问题,AI发展牺牲工人健康。不过,数据工人积极组织工会争取权益,肯尼亚法院相关裁定是重要进展。文章还提出行业需建立全面心理健康协议、实施“创伤上限”机制,公众应推动变革,实现伦理AI和公平劳动。

杀死那篇PDF:一场由AI发起的学术出版大革命,正彻底终结传统论文
如今系统神经科学和神经回路模拟研究领域论文数据量大,超出人类认知极限。技术进步带来“论文机器人”,它能高效处理数据、让读者与数据互动、整合数据。未来论文数据更复杂,如设想的“终极论文”将记录神经元活动与个体行为并预测行为,但数据量让人难读。传统PDF文本不适合传递复杂数据,已有数据密集型研究发布雏形。应让“论文机器人”取代传统论文,它能解决线性化与非线性发展矛盾,生成科学见解。还可开发“元机器人”整合数据。未来科学出版模式由科学界选,但“终极论文”不会是传统纸质论文,使用“论文机器人”要谨慎评估准确性。

阿里云Tair KVCache仿真分析:高精度的计算和缓存模拟设计与实现
文章围绕阿里云Tair KVCache仿真分析展开。在大模型推理场景下,KVCache从性能优化手段升级为系统级基础设施,面临高维配置空间挑战。阿里云推出Tair - KVCache - HiSim仿真工具,可在通用CPU上实现高精度性能预测与配置探索。文中分析当前推理模拟实现方式,指出存在推理请求流程复杂、组件耦合、单步时延难建模、配置搜索效率低等挑战。介绍Tair - KVCache - HiSim架构,含负载生成、全局调度、推理引擎仿真等组件,各组件协同工作且可独立验证。经评估,该工具仿真速度快,开销降低超39万倍,端到端误差可控。未来,KVCache仿真分析将为AI基础设施演进提供指导,推动“软硬协同、以负载驱动”新范式发展。

AI Coding后端开发实战:解锁AI辅助编程新范式
文章围绕AI Coding后端开发实战展开,指出开发者使用AI工具有过分依赖输出、误当专家的误区。为帮助开发者用好AI,文章介绍:一是破解AI上下文限制,用上下文管理三步法及实战技巧提升效率;二是成为质量把关人,重新认识AI能力,从需求理解、输出判断体系等确保代码质量;三是给出核心使用流程,涵盖后台项目开发、Python脚本协助数据处理、Agent应用与提示词工程、文档整理输出及提示词沉淀实践,助开发者实现人机协同高效开发。

告别碎片化日志:一套方案采集所有主流 AI 编程工具
本文介绍一套基于MCP架构的多AI工具代码采集方案。AI编程工具普及带来缺乏统一数据收口、平台支持不足和度量数据缺失等问题。业界现有方案存在体验差、扩展性有限等不足。本方案采用分层解耦架构,含采集、处理和上报层。有统一加工指标,针对不同工具采用不同采集机制,如CLI工具用Hook或Telemetry机制,Qoder解析历史快照,Codex用OTLP接收器,还有通用采集入口。系统以服务形式运行,有自动更新机制,支持macOS和Windows。方案具轻量化、无感化、可靠和可扩展优势,已稳定采集大量数据,未来将扩大工具支持、增强分析能力和优化部署运维。

《生成式AI卓越架构设计指导原则》:从"能用AI"到"用好AI"
在2025云栖大会上,阿里云发布《生成式AI卓越架构设计指导原则》,助力企业从“能用AI”走向“用好AI”。该原则以云原生“卓越架构五大支柱”为基础,融合生成式AI特性。安全方面,涵盖数据全生命周期到Responsible AI,应对四大挑战;稳定性上,采用“面向失败”理念保障系统稳定;效率上,构建全生命周期高效运营框架;成本上,关注三大优化点并精细化管理;性能上,围绕用户体验优化全链路。阿里云将持续深耕相关领域,邀企业探索AI卓越架构。

从HITL(Human In The Loop) 实践出发看Agent与设计模式的对跖点
文章围绕在ReactAgent中引入并实践HITL机制展开。先阐述无通用人机协同时解决人类参与Agent问答的方式及问题,指出HITL核心在于交互和保持对话连续性。接着介绍HITL实现效果、细节,包括交互设计、作为工具的定义与渲染等。最后探讨Agent演进与工程设计的相似点,如HITL与Hook、Intercept,Dify与数据结构图,ReactAgent与循环+责任链等,并提出利用工厂模式自适应生成专业Agent的想法,后续尝试让LLM推理Agent进化方向。

Qoder NEXT 来了:补全功能全新升级,AI 代码采纳率提升 65%
2026年1月7日阿里云发布Qoder NEXT,其智能补全能力全面升级。过去AI编程工具代码补全有瓶颈,现有工具基于FIM范式,难应对真实场景。Qoder NEXT基于自研NEXT模型,能主动感知代码仓库与编辑历史,实现从单行补全到编辑意图预测,支持文件内多点位和跨文件智能感知、多语言协同更新。背后是“训练 - 反馈 - 优化”闭环体系,ActionRL算法让效果优化,代码生成占比提升超53%,采纳率提升65%,还避免过度保守预测,数据飞轮每24小时更新。未来将拓展至“预测开发者行为”,完善Agentic Coding“最后一公里”。

Bun 推出内置数据库客户端与零配置前端开发
Bun 发布 1.3 版本,是迄今最大更新,实现全栈开发能力。引入零配置前端开发模式,支持模块热替换和 React 快速刷新,可自动处理文件转译与打包。核心功能 Bun.SQL 是统一数据库 API,支持多种数据库且无外部依赖。还推出内置 Redis 客户端,性能超 ioredis 7.9 倍。社区反响不一,有人赞其内置组件丰富,也有人质疑性能基准。包管理功能扩展,有安全改进。此版本有破坏性变更,性能提升显著,内存占用减少,部分操作速度大幅提高。Bun 基于 JavaScriptCore,旨在替代 Node.js,可通过 bun upgrade 升级。

Claude Code开源了代码简化Agent,千年“屎山”代码终于有救了!
Claude Code 开源代码简化 Agent,可在不改变程序行为前提下降低代码复杂度。此智能体用于自动简化代码结构、减少冗余、提高可读性与一致性。开发者可通过官方插件市场安装,在 Claude Code 交互式会话中启用。它对处理大型遗留项目有重要意义,填补了手工重构耗力与简单自动化工具无法保行为不变的缺口。网友对此评价良好,认为实用,部分人肯定开源行为,也有人盼其开源更多内部技能。

Web dependencies are broken. Can we fix them?
文章指出Web平台依赖管理存在问题,虽有NodeJS等其他生态系统做对比,其依赖管理简单直接,但Web平台却将此功能外包给第三方工具,导致代码复用权衡困难。目前不用打包工具使用依赖的几种方法都不理想,如直接导入node_modules、从公共CDN导入等,存在安全、封装性等问题,且处理依赖的依赖时更糟糕。导入映射未解决问题,还带来新麻烦。打包工具虽普遍,但满意度逐年下降。最后提出改进方向,如改善导入映射、将依赖部署到URL、理清依赖图等,呼吁各方共同解决问题。

Not All Browser APIs Are "Web" APIs
文章指出很多浏览器 API 并非真正的“Web” API。虽接口标准化,但实现依赖第三方服务、专有系统或特定基础设施。如地理定位 API,不同浏览器依赖不同定位服务;语音合成和识别的实现因浏览器、系统而异,还涉及隐私问题;Passkeys 依赖浏览器密码管理器;支付请求 API 受浏览器合作钱包限制;Web Push 依赖不同推送网络;媒体源 API 和 DRM 受厂商策略影响;Chrome 的 AI API 为实验性且具专有性。这些 API 带来可移植性错觉、隐私问题,且大厂商借此排挤小竞争者。开发者应将其视为对厂商服务的抽象,做好功能检测、设计降级方案、保证隐私透明等。

Building Better Buttons
文章聚焦于构建更好的网页按钮,旨在让其使用更便捷、更具可访问性。首先指出部分用户通过屏幕阅读器和键盘访问网页,这影响了按钮构建方式。强调按钮与链接、<div>元素有不同作用和特性,应正确选用。接着阐述了防止按钮提交表单的方法,即添加[type="button"]属性。对于含图标按钮,可用[aria-label]或.visually-hidden类处理屏幕阅读器的识别问题。还介绍了利用[aria-pressed]属性表示按钮状态,用[disabled]或[aria-disabled="true"]属性处理按钮禁用情况。最后提醒构建按钮时要考虑其意图。

2025 JavaScript Rising Stars
本文是 2025 年 JavaScript Rising Stars 第 10 版报告。2025 年 JavaScript 领域创新与挑战并存,AI 变革应用开发方式,也出现了安全漏洞。报告对比了 GitHub 项目过去 12 个月新增星数,涵盖全栈热门项目。n8n 是 2025 年排名第一的项目,一年新增 11.2 万颗星,反映了无代码自动化工具需求增长。前端框架中 React 重夺桂冠,Ripple 是新进入前五的框架。后端新贵 Motia 整合了多种后端功能。工具方面,Bun 升至首位。AI 领域,工作流引擎崛起。移动端 Valdi 和 Lynx 取代 React Native 成为榜首。此外,还提及了行业内的收购、框架发展方向及安全问题,2026 年开发者需掌握代理工作流技能并平衡 AI 与代码质量。

Streaming JSON in just 200 lines of JavaScript
本文介绍用200行JavaScript实现流式JSON传输库Streamson。其核心是渐进式JSON流技术,数据就绪即发送,未就绪用占位符代替,数据到达后再替换。服务器端用application/x-ndjson和Transfer-Encoding: chunked头,遍历数据对象替换占位符,将待发送部分存队列,就绪后单独发送。客户端用Fetch API接收响应流,遇占位符用Promise替换,数据到达后解析。最后作者将代码封装成NPM库Streamson,给出使用示例,该技术能提升大型或动态数据集的感知性能和用户体验。

Critical jsPDF vulnerability enables arbitrary file read in Node.js deployments
文章指出 jsPDF 库存在严重漏洞(CVE - 2025 - 68428),影响 3.0.4 及更早版本的 Node.js 部署,不影响仅浏览器使用场景。该漏洞因文件路径未正确验证,使攻击者可通过路径遍历和本地文件包含,将任意文件内容嵌入生成的 PDF 中,可能暴露敏感信息。虽版本 4.0.0 已修复,通过默认限制文件系统访问,但因 Node.js 权限模式存在操作复杂性,很多生产环境难以实施。研究人员建议评估部署的可利用性并尽快升级。

Date is out, Temporal is in
文章指出JavaScript的Date对象存在诸多问题,如解析不一致、缺乏时区支持、不理解夏令时等,且其为可变对象,易导致意外修改。而Temporal作为替代方案即将登场,它是命名空间对象,含多个类和方法,使用时操作更直观,方法会返回新对象,避免修改原对象。目前Temporal草案规范处于标准化第三阶段,虽未正式成为标准,但Chrome和Firefox等浏览器已可试验,大家可提前体验,未来它将极大改善JavaScript的日期处理。

Simplifying JavaScript Prototypes in Constructor Invocation with Simple Words and Diagrams
文章旨在清晰阐述 JavaScript 原型及对象创建方式。指出在 JavaScript 里,每个对象都与一个现有对象(即其原型)相链接。介绍了通过构造函数创建对象时,新对象的内部原型会被设置为该函数的原型。阐述了创建对象的四种方式:函数构造、对象字面量、类、Object.create() 方法。说明箭头函数无原型属性,不能用作构造函数。构建原型图展示对象、构造函数和原型之间的关系,讲解了属性读取时的原型链查找规则与写入操作特点,还提到原型中 this 的指向由函数调用方式决定。

The Batch: 891 | 用于科学发现的人工智能
Adji Bousso Dieng展望2026年,希望AI从“提升效率的工具”转变为“推动科学发现的催化剂”。过去十年深度学习主导范式是“插值”,适合多数AI应用及部分科学挑战,但难以应对数据分布“尾部”。物理科学领域诸多挑战是“发现型问题”,需找到稀有对象。要实现从“插值”到“发现”跨越,AI社群要推动机器学习目标函数转变,将多样性提升为核心目标。Vertaix实验室提出Vendi Score引领此研究方向,优化它能帮助发现传统方法难探索的材料。2026年应把多样性作为科学发现核心引擎,让AI成为拓展人类知识版图伙伴。

The Batch: 892 | 教育应与 AI 协作,而非对抗
OpenAI 发布 ChatGPT 后教育发生改变,对学生是新工具,对教育者是新挑战。广泛传播的用 AI 检测器识别生成式 AI 文本的希望是幻觉,存在结构性问题,难以维持信任,还可能惩罚错误对象。但生成式 AI 可提升学习效果,传统家庭作业论文验证独立创作方式已失效。大学和学校应假设学生使用生成式 AI,采用有效评估模型,如用真实理解展示、教授 AI 素养、为 AI 设计作业等,以让教育更有效可信。

The Batch: 893 | 从预测到执行
文章指出 2026 年人工智能研究应认识到能预测的模型不等同于能行动的系统,需从解决代理任务转向解决现实任务。过去十年在被动预测和生成建模上成就斐然,但代理任务不能代表现实经济价值。如编程领域,现代智能体已能完成更复杂工作。将焦点转向长周期任务和目标导向的 AI 系统有两大好处,一是揭示当前 AI 模型局限和痛点,二是使研究与终端任务效用一致。深度学习进展为 AI 在硅基系统复现人类整合信息能力奠定了基础,未来要解决未知任务。

The Batch: 895 | 发起群聊的聊天机器人
文章由DeeplearningAI原创,Sharon Zhou提出2026年AI有潜力将人们聚集。当前互联网存在AI泛滥和阻止LLM进入两种极端情况,但AI可设计成连接人们的力量。研究者需做改变,如后训练、设计强化学习环境。文中举例凌晨3点用LLM解决感情问题,它能牵线并活跃群聊。AI作为集体工具可提升好奇心和创造力,其激励机制若促使聚集人们,能带来双赢,激发新模型架构,且相关技术接近可行,希望今年AI发挥更积极作用。

The Batch: 894 | 面向生物医学的多模态模型
文章指出过去几年多模态联合推理模型发展快,但生物医学领域其能力碎片化、脆弱且难解释。2026 年学术界应推进多模态模型建设。关键优先事项有深度多模态整合,通过新预训练目标等保持跨模态生物学意义;注重可解释性,发展跨模态解释方法;以数据效率和适应性为核心目标,让模型适应新任务等;进展评估应看模型在生物医学工作流的整合程度。若 AI 社群达成共识,多模态基础模型有望成生物医学研究可靠伙伴。

【Gartner报告精选】2026年重要战略技术趋势;2030年未来云计算;2030年未来软件工程;企业IT治理
本文是Gartner报告精选,包含多份报告内容。涉及2026年重要战略技术趋势,将影响各行业;2030年未来云计算和软件工程,强调AI的融合与影响;企业IT治理分上、中两篇,指导CIO工作;还提及中国生成式AI软件扩展、浪潮云AI数字伙伴案例等。此外,探讨AI原生时代软件工程基础、AI应用隐性障碍及软件工程领导者AI行动手册等,为相关从业者提供多方面指导。

Unite Shanghai 2025 | 团结动画系统 Tuanjie Animation
Unite Shanghai 2025 于 10 月 23 - 24 日举办,Unity 中国高级技术研发经理王刚分享团结动画系统新功能。动画系统改造长远目标包括节点化、timeline 蒙太奇化等。本次主要介绍三大功能:通用骨骼 IK & Retarget 扩展通用骨骼上 IK 和重定向能力,支持 runtime 使用;AnimGraph 是动画功能与控制逻辑编辑器,支持节点化和灵活控制;RigGraph 是团结引擎里的控制器系统,有前向和逆向模式,可配合 animator 和 animation graph,还具备优化、K 动画、双向烘焙等功能。
