2025乌镇峰会
开发者周刊

国内
[DAMO开发者矩阵] 多模态大语言模型 GeoPQA基准 感知 - 推理两阶段强化学习框架 几何视觉推理
达摩院EMNLP'25|先学会看,再学会想:新框架突破多模态模型几何视觉瓶颈
多模态大语言模型(MLLMs)在几何视觉推理任务中表现不佳,核心问题是视觉感知瓶颈制约推理训练效果。达摩院和新加坡南洋理工大学团队提出GeoPQA基准量化视觉感知缺陷,构建感知 - 推理两阶段强化学习框架。GeoPQA基准图像源于真实和合成图像,用Gemini - 2.0 - Flash - Thinking模型生成感知问题并进行质量控制。两阶段框架先进行感知训练,让模型学会识别几何元素与关系;再进行推理训练,用标准方法强化学习。演示结果显示,两阶段框架使模型几何推理能力提升,证明感知训练重要性,小参数模型也能有好表现。

[DAMO开发者矩阵] 达摩院 M - LongDoc 超长文档理解 多模态模型 检索感知微调
达摩院EMNLP'25|百页图文长文档看不完?M-LongDoc让大模型秒懂超长文档
近年来大型多模态模型处理超长复杂文档面临挑战,现有基准无法反映现实复杂性。达摩院推出M - LongDoc基准和训练框架。现存问题包括真实文档超长复杂、现有基准短视简单、检索增强生成有干扰陷阱。M - LongDoc基准库样本覆盖多领域,文档超长,问题开放式且数据构建质量高;设计自动评估框架,由多模型组成‘评委团’打分;提出检索感知微调策略,模拟不完美检索场景训练模型抗干扰。实验表明,检索感知微调使Qwen2 - VL - 7B模型性能提升,发现模型‘重文轻图’,微调后模型鲁棒性更强。

[DAMO开发者矩阵] 创意链 科研灵感生成 大语言模型 CoI Agent
达摩院EMNLP'25|提出“创意链”,让大模型像人类一样生成科研灵感
浙江大学和阿里巴巴达摩院研究者提出创意链(CoI),构建智能体CoI Agent。CoI将文献组织成链,引导模型模仿人类思考,降低处理文献难度。还开发Idea Arena评估创意质量,采用两两比较方式。实验结果显示,大语言模型评估一致性超90%,与人类评价一致率约70%,CoI Agent在多维度表现接近人类论文,尤其新颖性和重要性超现实论文,但可行性不足。研究还分析了创意链长度和数量对生成质量的影响,认为若智能体自主实验完善创意,能实现科研循环,推动科研自动化和创新。

[KooFE前端团队] 少样本提示词设计 模型偏见消除 示例构造方法
提示词工程:少样本提示词设计
文章围绕少样本提示词设计展开。少样本提示是提供少量示例助模型理解任务,有提升表现、快速适配、降低数据需求等优势。其原则包括结构含任务描述、示例集、待解决问题,任务描述要简洁,示例排序有逻辑,可添加解释增强可解释性。示例设计要考虑数量、排序、标签分布等因素。模型做任务存在多数标签、近期、常见词三种偏见,可通过测偏见、调参数校准。如今模型上下文窗口变大,可构造更多示例,有强化型上下文学习和无监督上下文学习两种新方法。

[TRAE.ai] AI代理驱动开发 BMAD - METHOD 吃豆人游戏 开发实战
AI 代理驱动开发实战:用 TRAE 构建经典吃豆人游戏
本文介绍用 BMAD - METHOD 框架构建经典吃豆人游戏的过程。该框架专注代理式敏捷驱动开发,解决传统 AI 辅助工作流问题。采用两阶段方法,先由分析师、产品经理和架构师协作生成文档,再由 Scrum Master 转化为开发故事供开发代理执行。文中展示了安装步骤,通过分析师头脑风暴确定游戏功能、状态、规则等;创建项目简报明确目标、市场等;产品经理输出 PRD;架构师生成前端架构文档。还进行文档分片、创建用户故事,经产品负责人核对后编写代码,过程中多次调优,最终构建出可玩的 MVP,体现了 AI 重塑开发工作流的能力。

[TRAE.ai] 树莓派智能小车 TRAE Spec - kit 控制系统开发
基于 TRAE + Spec-kit 实现树莓派智能小车控制系统
本文介绍利用TRAE + Spec - kit实现树莓派智能小车控制系统的方法。TurboPi是一款智能AI视觉机器人车套件,目标是在PC上实现React前端页面控制小车,在树莓派上实现FastAPI后端接收命令。详细说明了Spec - kit初始化及关键步骤执行,包括生成项目章程、需求规格、技术方案、任务拆分和代码实现。还提及优化过程,如修复代码问题、创建前端测试页面、启动后端服务。最终测试通过,展示了该工具链从需求定义到代码实现构建系统的过程,提升开发效率并保证质量和可维护性。
[TRAE.ai] 智能会议纪要助手 TRAE IDE MCP 语音识别 知识图谱
智能会议纪要助手:基于 TRAE IDE 和 MCP 的完整实践
本文介绍基于TRAE IDE和MCP开发智能会议纪要助手的实践。先阐述开发目标,借助TRAE IDE和MCP功能,实现集成语音识别、音频处理和知识图谱技术的助手。接着说明实践过程,包括创建项目文件、实现实时录音、语音识别等功能,运行中遇音频处理失败等问题,经TRAE分析解决。还提到增强技术实现的方法,如用MCP功能、说话人分离技术和标准化框架。最后进行系统架构设计分析、核心算法原理与实现探讨,指出性能瓶颈并给出优化建议,强调该项目融合多项AI技术,体现实用与创新结合,为未来扩展留空间。

[京东技术] 生成式推荐 LLM 传统推荐范式 工程挑战 未来方向
探索无限可能:生成式推荐的演进、前沿与挑战
本文围绕基于LLM的生成式推荐系统(GRs)展开。先指出传统推荐范式(MLR、DLR)有特征工程依赖、模型工程天花板等问题,而LLM有颠覆性潜力,其生态成熟与工业级验证促使GRs在2025年爆发。接着介绍GRs技术演进,从早期探索到在线应用范式,阐述判别式到生成式转变、语义ID生成等核心技术要点。工程上,GRs面临模型演变驱动架构升级、训练策略升级、推理性能瓶颈等挑战。未来GRs探索方向包括深度推理、奖励机制探索、多模态对齐等。生成式推荐是推荐系统认知升维,将重新定义人、货、场连接方式。

[京东技术] JoyCode Agent SWE - bench Verified 自动软件修复 多智能体系统
全球Top3正式开源|JoyCode:SWE-bench Verified打榜技术报告
本文是JoyCode Agent在SWE - bench Verified打榜技术报告。其在该测试中以74.6%通过率登全球Top3并开源。报告指出SWE - bench任务需AI综合编程能力,当前面临代码库理解、解空间管理等挑战。业界存在提示词工程失效、失败难归因等痛点。JoyCode提出“补丁–单测协同生成与迭代验证”框架,针对业界短板优化,如耦合补丁与单测、引入失败归因等。系统含Testing、Patch等智能体,通过协同工作形成闭环解决问题。最后以django - 16454实例展示工作流程,未来将持续迭代优化该技术。

[京东零售技术] AB实验分析智能体 数据分析 大模型 产品设计
一款AB实验分析智能体是如何诞生的
本文围绕一款AB实验分析智能体的诞生展开。背景上,以往算法实验仅关注正向指标提升不足,需评估潜在风险,且搜推实验分析工具不全。产品设计方面,形成‘汇总数据—分项分析—总结呈现’框架,采用模块化分层解耦架构;设计统一表单,解决多工具表单差异问题;工作流从初版planner升级为基于DAG的编排框架。工程技术上,前端用Vue 3框架等,有鉴权等能力;后端设计权限耦合机制。大模型选型结合R1和V3,通过提示词工程和重试机制提升生成质量。未来计划构建专家模型、优化数据工程框架、提升产品交互性。

[哔哩哔哩技术] B站基础安全 AI溯源 安全告警自动化 安全运营 MCP协议
B站基础安全在AI溯源方向的探索实践
文章介绍B站基础安全在AI溯源方向的探索实践。安全事件告警自动化运营历经人工查证、脚本驱动、SOAR阶段,AI发展使告警处理更智能。人与平台交互从账号密码登录到API、低代码平台,如今向“人与智能体协作”转变。技术方案上,将内部安全产品接口转化为MCP工具集,设计了告警处理链路。实践案例显示,AI - Agent在蜜罐、HIDS、EDR告警溯源分析中效果良好,可完成完整溯源链路。AI提效显著,如HIDS命令执行告警降噪率约93.33%。未来,安全产品将开放MCP工具集,AI在安全运营价值将进一步释放。

[大淘宝技术] AI编程 测试驱动工作流 自动化开发 收藏夹功能修复
让AI打出丝滑连招:编码-部署-自测-改bug
文章提出测试驱动的AI编程闭环工作流,解决AI辅助编程缺乏自测与迭代能力问题。当前AI辅助编程存在人工二次编辑和对话式修复模式,缺乏自动化验收和迭代机制。新工作流以明确测试用例为验收标准,让AI自主判断任务质量并迭代修复。其整体架构含iFlow CLI工具和qwen3 - coder - plus模型,核心组件有部署Agent和HSF调试工具。通过收藏夹功能修复案例验证工作流有效,未来可从测试、诊断、任务拆分等多方面优化。

[奇舞精选] 前端开发 事件循环机制 WHATWG规范 V8引擎 浏览器渲染
AI时代的前端知识拾遗:前端事件循环机制详解(基于 WHATWG 最新规范)
文章基于 WHATWG 规范,从多视角深入解析前端事件循环机制。先介绍浏览器多进程架构与渲染主线程,引出事件循环。其由任务队列和微任务队列构成,基本流程是取任务执行,再处理微任务,必要时渲染更新。异步操作委托给其他线程,完成后回调入队。微任务优先级高,当前任务结束后立即执行。以 Chrome 为例说明内部实现,V8 管理微任务队列,宿主控制检查点触发。浏览器维护多任务队列,动态调整取任务策略。渲染时机不固定,长时间占用主线程会阻塞更新。掌握该机制可提升前端代码性能。

[字节跳动技术团队] VR 院线 LBE 产业 云端协同 产业化 规模化
云端协同构建 VR 院线,加速 LBE 产业化与规模化发展
本文围绕云端协同构建 VR 院线,探讨加速 LBE 产业化与规模化发展。当前 LBE 产业存在内容稀缺、技术割裂、发行分散等问题。云端协同构建“高品质 + 轻量化”VR 院线生态,能破局产业制约因素。通过统一 VR 院线平台,云串流补“高品质”短板,一体机补“规模化”短板,从成本和场景维度形成产业正向循环。实施路径包括构建标准化基础设施体系、推动产业分工协作、形成规模正循环。未来,VR 院线有望推动 LBE 升级为大众消费业态,成为数字经济重要载体。

[字节跳动技术团队] Eino ADK AI Agent 智能体开发 Go语言
Eino ADK:一文搞定 AI Agent 核心设计模式,从0到1搭建智能体系统
文章围绕 Eino ADK 展开,介绍其为 Go 开发者提供的智能体开发框架。先解释 Agent 概念及功能,如推理、行动等。Eino ADK 参考 Google - ADK,有统一接口、组合模式和协作机制,能拆解复杂 AI 应用。核心构建包含 ChatModelAgent,实现 ReAct 模式,用于行业分析、IT 运维等;WorkflowAgents 有 Sequential、Parallel、Loop 三种模式;还提供 Supervisor 和 Plan - Execute 两种预构建的 Multi - Agent 范式。基础设计有统一 Agent 抽象、异步事件驱动架构、灵活协作机制、中断与恢复机制。最后通过项目开发经理智能体示例展示其优势,凸显在 Agent 抽象、输入输出、协作等方面比传统开发模式更优。

[小红书技术REDtech] ACL 2025 语言模型蒸馏 容量差距法则 小红书 北京理工大学
ACL 2025 杰出论文 | 小红书 AI 搜索和北理工提出“容量差距法则”
在ACL 2025大会上,小红书AI搜索团队与北京理工大学宋大为教授团队合作论文获杰出论文奖。研究聚焦语言模型蒸馏中‘容量差距诅咒’,提出‘容量差距法则’,揭示学生与教师模型最优规模呈约2.5倍线性关系,减少确定最优教师模型的算力成本。通过小规模试验发现该法则,跨规模实验验证其外推能力,据此蒸馏出高效小型模型MiniMA,建立了计算效率 - 性能帕累托前沿。还介绍了核心贡献者,发布了相关代码链接,并给出招聘岗位。

[得物技术] 得物 管理类目配置线上化 电商技术 规则配置
得物管理类目配置线上化:从业务痛点到技术实现
文章围绕得物管理类目配置线上化展开。电商业务发展使管理类目规则调整频繁,传统依赖数仓底层更新方式有痛点。如效率低,一次类目变更上线需3 - 4周;质量有风险,提报规则易重复遗漏;系统耦合,底层变更影响下游应用。技术方案采用分层架构解耦,核心模块实现规则生命周期管理等功能。数仓计算选定时任务方案,提升资源利用率、保障完整性、优化可维护性。项目成果显著,规则上线周期缩至1 - 2天,实现自动化校验,沉淀规则配置模型。未来可做规则冲突预警和实时计算优化。

[得物技术] 大模型 搜索相关性 得物技术 技术迭代
大模型如何革新搜索相关性?智能升级让搜索更“懂你”|得物技术
文章围绕大模型革新搜索相关性展开。传统搜索相关性技术存在搜不准问题,早期基于BERT的交互式模型有资源消耗大、扩展性不足、泛化能力有限等痛点。大模型在搜索相关性任务上有理解能力强、知识储备丰富、数据需求低等优势。得物围绕大模型优化迭代流程,采用知识蒸馏新路径,将其融入闭环。建模上实践二阶段流程和R1慢思考,提升了准确率。经两季度迭代,大模型效果超线上bert模型,中长尾场景泛化能力好。落地方面,降低了badcase率、节约成本。后续还将探索提升排序质量、寻找更高ROI方案等。

[快手技术] 广告素材修复 AhaEdit 快手技术 内容审核创新
从“拦路虎”到“修路工”!基于 AhaEdit 的广告素材修复
文章介绍了快手基于AhaEdit的广告素材修复技术。传统广告审核流程存在问题定位难、投放效率低等问题,AhaEdit致力于解决这些问题。它通过构建“审核 - 定位 - 修复 - 再审核”闭环系统,具备“风险定位”和“AI修复”核心能力。风险定位采用多模态精准打击和架构革新,提升定位精度;AI修复构建“理解 - 生成”协同流程,实现智能再创造。如今AhaEdit能支持多种模态素材修复,使“一键过审”成为现实。未来目标是构建下一代智能编辑架构,实现内容理解与生成统一。

[快手技术] HiPO框架 大语言模型 过度思考 自适应推理
快手&南大联合发布自适应推理框架 HiPO,突破 LLM “过度思考”困局
文章介绍快手与南大联合推出的HiPO框架,旨在突破LLM“过度思考”困境。当前LLM存在“过度思考”问题,导致效率低、成本高,现有解决方案有局限。HiPO框架有两大核心组件,混合数据冷启动为模型提供不同模式高质量回答示例,混合强化学习奖励系统精细化引导决策。实验显示,HiPO在多个基准测试中显著提升效率和准确率,有强泛化性。该框架推动LLM实用化,为模型轻量化提供新路径,增强模型“元认知”能力,相关资源已开源。

[搜狐技术产品] Nacos 配置调优 内存缓存 兜底配置 服务启动优化
浅谈Nacos获取配置两次调优经历
本文分享Nacos获取配置两次调优经历。Nacos是开源的动态服务发现、配置管理和服务管理平台,在项目中广泛用于配置管理。首次调优是因服务请求量大,获取配置超时,采用内存缓存配置和兜底配置解决。服务灰度上线后,发现超时错误日志,用注册监听器将新配置放入内存Map,获取配置时优先从内存取,无则从服务器拉取。第二次调优是服务启动后并发流量使部分请求被Nacos拦截器拦截,获取不到最新配置。经分析,是qps超服务端限流阈值。提出两种解决方案,增大服务端限流器阈值风险大,最终采用服务启动后、流量进来前先获取配置到内存并增加监听器,经测试验证有效。最后给出引入Nacos组件的最佳实践方式。

[搜狐技术产品] AI部署 nndeploy 开源项目 端侧AI
降薪跳槽,投身开源!只为 AI 落地“最后一公里”
本文介绍了专为AI落地最后一公里而生的端侧AI部署框架nndeploy。大厂工程师Always为解决AI落地重复流程问题,降薪跳槽做开源。nndeploy通过可视化工作流降低门槛,统一接口搞定多端推理,将AI落地时间从数周缩至几天。它为不同阶段工程师量身打造能力,如新手友好、专业进阶、高效实战。上手简单,5分钟可部署应用。采用三层分离架构,计算执行层是核心。该项目于2023年8月开源,获认可,在真实场景应用,助力AI落地。

[搜狐技术产品] AI 内省能力 Anthropic 研究实验
我们往Claude脑子里塞了一个词,然后它开始「自圆其说」了!Anthropic最新研究:AI拥有内省能力!
Anthropic最新研究表明AI开始拥有内省能力。研究团队通过注入概念表征证明大型语言模型有功能性内省意识。论文对“内省”提出严谨定义,需满足准确性、扎根性、内部性、元认知表征四个标准。还进行四个实验:一是验证模型能否意识到被注入概念;二是看其能否区分内在思维与外部输入;三是观察模型能否自发区分有意与无意输出;四是探讨模型能否主动控制内部状态。实验显示部分模型有一定内省能力,但不稳定,未来需新框架约束AI‘内部自由’。

[搜狐技术产品] Flutter vyuh_node_flow 节点编辑器 React Flow
Flutter 也有类 React Flow 的节点流程编辑器,快来了解下刚刚开源的 vyuh_node_flow
文章介绍了刚开源的 Flutter 节点编辑器 vyuh_node_flow。它基于 MIT 许可,功能类似 React Flow,可实现可视化编程、工作流编辑等。作为 Flutter SDK,支持全平台,有大量即用功能,如高性能渲染、响应式主题等。设计思路包含状态管理、分层渲染等。其 API 复杂,核心有 NodeFlowController 等。运行示例显示使用不难。实现原理围绕控制器、编辑器进行状态存储、渲染和交互处理。还采用 MobX、分层渲染等策略提升性能。虽缺复杂图形自动布局算法,但可用性成熟,适合可视化流程编辑场景。

[搜狐技术产品] MCP服务 AI工具 免费服务
2025 年最值得拥有的 5 款免费 MCP 服务
文章介绍2025年5款免费MCP服务。MCP协议可让Claude、Cursor等客户端连接外部工具。Bright Data能解决网页抓取难题,有多种特性和免费调用次数;Chrome DevTools让AI操控Chrome,实现端到端调试;MarkItDown可将多种文档转Markdown;Context7提供实时更新文档,解决代码运行问题;sequential Thinking服务为AI提供分步推理框架。文章还给出各服务的配置方法和使用示例。

[数据可视化 AntV] LLM可视化 GPT - Vis MCP AI应用开发
GPT-Vis + MCP 也许是 LLM 可视化的最佳实践
文章介绍了GPT - Vis + MCP这一LLM可视化最佳实践方案。先指出LLM可视化存在Prompt工程难、幻觉严重等困境,而GPT - Vis + MCP通过标准化协议和专业渲染引擎解决问题。接着解析核心架构,MCP Server Chart负责生成规范图表配置,GPT - Vis是专为LLM设计的Markdown可视化引擎。还给出快速上手步骤,包括在MCP - Sever - Chart项目体验和在AI项目使用的方法。与纯Prompt工程、Code Interpreter等方案对比,显示其零幻觉、类型安全等优势。最后总结该方案重新定义LLM可视化标准,适用于企业级应用。

[梯度不陡] NL2SQL Datalake Agent 计算成本削减 企业级应用
Agentic NL2SQL 削减七成计算成本
文章围绕Datalake Agent在NL2SQL任务中削减成本展开。企业级数据库NL2SQL任务中,传统直接提示法成本高、性能衰减,因令牌消耗随表数量线性增长且信息冗余。Datalake Agent通过三步推理框架,分层检索信息、迭代优化,按需获取信息。实验显示,其在319张表场景下,令牌消耗仅为直接求解器的12%,成本降87.5%,且保持稳定准确率和扩展性。该方案在企业级应用中展现成本和性能优势,但仍面临无限循环等问题,后续需优化多语言支持和循环终止机制。

[火山引擎开发者社区] Data+AI时代 对象存储 火山引擎TOS 全链路加速方案
Data+AI 时代,对象存储为 AI 应用注入全局动力
Data+AI 时代,海量数据给传统存储方案带来挑战,对象存储成主流,但面临 POSIX 协议转换性能不足、分布式训练数据协同困难、存储性能瓶颈等问题。火山引擎对象存储 TOS 推出全链路加速解决方案,包含 FSX for TOS、多区域接入点(MRAP)和 TOS 加速器。FSX for TOS 打破协议瓶颈,优化读写流程、提供分布式缓存、具备崩溃恢复与热升级能力;MRAP 实现全局数据智能流动,支持跨域回源和故障转移;TOS 加速器是全托管缓存服务,有低时延、高吞吐等优势。实际案例显示该方案能提升数据加载效率。

[百度地图] 百度地图 地理信息科技进步奖 室内外车位级智能导航 智能出行
百度地图荣获地理信息科技进步奖一等奖,开创室内外车位级智能导航新范式
2025年11月5 - 7日,“第二届中国测绘地理信息大会”在浙江德清举行,百度地图凭借“室内外一体化车位定位与智能导航关键技术及应用”项目获“地理信息科技进步奖一等奖”。百度地图打造“地图构建 - 高精度定位 - 驾车步行导航”一体化技术体系,攻克复杂空间制图与定位难题,构建室内外一体化无缝定位导航与车位推荐系统。其全国首个北斗系统室内外一体化车位级导航在重庆东站落地。今年初百度地图V21推出“智驾级·车位导航”,覆盖全国200万停车场,为智能辅助驾驶提供空间感知能力。未来还将融合新技术,携手产业伙伴推动智能出行体验升级。

[百度地图] 苏超 百度地图 体育出行 泰州旅游
2025苏超数据报告出炉:3.6亿公里的热爱,点亮江苏公路!
2025赛季苏超落幕,百度地图发起的“路上联赛”同样精彩。赛季中,苏超13城球队车标累计行驶3.6亿公里,622万球迷用车标出行。苏州队获“最具规模奖”,宿迁队是“逆袭黑马奖”,新科冠军泰州队热度持续攀升。百度地图成球迷出行智能助手,带动“体育+出行”热潮,美食和景区搜索体现球迷需求。泰州夺冠后,其在百度地图搜索量暴增,文旅推出免票福利,百度地图“小度想想2.0”可定制泰州游玩行程。

[程序人生] Serverless Coding Agent 开发范式革命 软件工程
当 Agent 遇见 Serverless:一场静悄悄的开发范式革命
文章以构建email网关为例,探讨了Serverless架构的优缺点及Coding Agent带来的变革。Serverless让开发者专注业务,但配置复杂、调试困难。Coding Agent能全局分析、即时反馈,提升开发效率。开发范式从“写代码”变为“规约先行”,开发者角色从执行者变为指挥家。软件工程在文档、测试、集成方面有新形态。这预示复杂性不再是障碍,Serverless和个人开发者迎来春天,但也有代码安全等挑战。

[群核科技质量技术] AI大模型 智能布局 算法测试
从布局项目谈大模型测试
本文结合AI大模型智能布局项目谈测试工作。当前AI大模型处于早期,效果受训练数据影响,需测试反馈优化。智能布局项目让模型学习家具摆放规律,输出布局方案,但存在家具悬浮等问题,需算法、工程、测试三方协同。测试方面,智能布局属效果类算法,常用用户满意度问卷等方法。验证流程分可视化和提效两层,“可视化+规则脚本”组合提升效率、缩短周期,可升级为验证平台,平台将测试流程串成流水线。算法测试要拆解“结果—指标—评价”三层,量化评价,反哺算法。

[腾讯云TVP] AI 产品经理 程序员 岗位淘汰 技术应用
架构火花|产品经理和程序员谁会先被AI淘汰?
在AI浪潮冲击下,互联网核心岗位产品经理和程序员面临挑战。腾讯云架构师合肥同盟讨论谁会先被淘汰,有观点认为产品经理危机大,未来岗位区分或消失,全栈人才留下;也有人觉得未来是产品经理的天下。部分产品经理被指缺乏产品思维、脱离市场。技术转产品有机会,但需了解工作内容与用户需求。AI时代产品经理工作逻辑需转变,有人认为5年后编码或不再核心,工作方式将改变,技术岗位可能消失;也有人觉得没那么极端。目前AI在公司应用广泛,但处理老项目代码有困难。

[腾讯云开发者] LLM应用架构 Agent Prompt Chain编排 Multi - Agent
彻底爆了!一文了解LLM应用架构:从Prompt到Multi-Agent
本文介绍LLM应用架构从Prompt到Multi - Agent的演进。自ChatGPT问世,LLM应用探索历经三阶段:Prompt阶段通过设计提示词激活智能;Chain编排阶段将LLM与工具结合,按固定流程处理任务;Agent阶段让LLM自行规划并调用工具完成目标。Agent可分单Agent和Multi - Agent,前者易陷入死循环,后者将单一agent拆分为多领域专家agent合作,提高稳定性和智能。文中用Go语言演示单Agent实现,介绍Multi - Agent交互形式和实现关键,指出当前LLM应用更自动化、通用化,但智能提升仍是主要问题,Multi - Agent提供新思路,未来Agent发展值得期待。

[腾讯云开发者] 架构 企业架构 4+1模式 C4模型 TOGAF - 4A架构 互联网模型
一篇文理解架构:企业架构、技术架构、C4模型、TOGAF、互联网模型
文章围绕架构展开,先阐述对架构的理解。介绍4+1模式,从不同视角描述软件;C4模型基于4+1,从宏观到微观描述系统;TOGAF - 4A架构含业务、应用、数据、技术架构;互联网模型以业务、技术、部署架构呈现。接着说明企业架构,它是为应对企业系统复杂性而生,指出人们常见的四个误解,如将其等同于技术架构等。强调企业架构是一种系统思考方式,优秀架构师需在战略、业务、技术层工作,要看到全局、理解关系、管理演化。

[腾讯云开发者] 大模型原理 神经网络 Transformer 机器学习
十分钟速通大模型原理!从函数到神经网络
文章速通大模型原理,从函数引入神经网络。先介绍从函数到神经网络的演变,线性关系升级为非线性需激活函数,多层变换构成前向传播。计算参数通过损失函数和梯度下降,反向传播调整参数。调教网络要避免过拟合,可简化模型、增加数据、早停、正则化、Dropout 等。矩阵运算让公式简洁,提升训练速度。文字预测需词嵌入,RNN 可关联前后数据但有缺陷。Transformer 用注意力机制,其解码器是 chat 大模型基础,能实现多种应用场景。

[腾讯技术工程] 代码安全审计 悟空Agent NVIDIA 多智能体架构 AI Infra安全
获NVIDIA致谢:悟空Agent的实践、复盘与迭代
本文以悟空Agent获NVIDIA致谢为切入点,探讨代码安全审计。传统人工和SAST工具难应对AI时代代码复杂度,悟空代码安全团队探索新方式。悟空Agent发现NVIDIA项目反序列化逻辑风险,推动其修复。其核心是迭代快,采用多智能体架构,包括Client、Remote等五个智能体协同。迭代中存在上下文断流、调度失衡问题,分别用上下文工程、强化学习调度机制解决。还有数据飞轮体系,从Bad Case到模型迭代。同时指出AI infra存在安全隐患,悟空Agent研究让安全融入业务,实现人机协同价值。

[腾讯技术工程] 图像质量评估 ICCV挑战赛 微信测试中心 IH - VQA团队 iDetex模型
微信测试中心刷新业界标准,斩获 ICCV 图像质量评估挑战赛冠军
微信测试中心IH - VQA团队在ICCV 2025 MIPI细节图像质量评估挑战赛夺冠。此赛事因传统IQA模型局限而设,用ViDA - UGC数据集,从多维度评估。IH - VQA团队的iDetex模型,通过视觉编码器和大语言模型,结合空间扰动、查询风格对齐等策略提升性能。与传统IQA模型相比,iDetex能精准识别、定位失真并分析影响,可应用于图文、电商等场景。团队在多项指标领先,相关方案成论文被接收,未来将深耕VQA与质量评估领域。

[腾讯研究院] 预测式AI AI失败原因 随机性 弱势群体
预测式AI为什么一败涂地?
文章探讨预测式AI失败原因。它被广泛用于学校、医疗、司法等领域决策,但存在诸多问题。一是预测未必决策得当,如肺炎预测模型未考虑因果关系,且部分研究依赖现有数据,忽视收集新数据重要性。二是人类策略性行为使AI预测与目标有偏差,招聘AI易被求职者策略应对,且不透明造成时间浪费。三是过度自动化,荷兰福利欺诈算法、多伦多海滩预测软件等案例显示,AI失误时开发者规避责任,人工监督常不充分。四是错识人群,不同地区或群体数据差异使AI预测不准,还会加剧既有不公,伤害弱势群体。最后指出对随机性的抗拒导致预测式AI虚假宣传,接纳随机性或带来更明智决策。

[腾讯研究院] AI 透明度 AI标识 模型规范
我们对AI认识远远不足,所以透明度才至关重要|腾研对话海外名家
文章指出因对AI认识不足,透明度至关重要。当下AI透明度政策通过“AI活动标识”,帮助用户识别伪造信息。但透明度价值不止于此,还能为研究、评估和应对AI风险提供数据,缓解各方不安。在AI治理中,“AI标识”是推进较快的机制,目前行业讨论转向“如何有效标识”,如“标识什么”等。“模型规范”用于界定模型行为边界等,保障用户知情权,但存在公众难验证的问题,“模型规范遵守”成讨论核心。总之,透明度是理解、信任、治理AI的关键,能建立可验证、可反馈、可改进的治理路径。

[腾讯研究院] AI 留守儿童 教育公平 AI适儿性测评
最危险的不平等,是理解的不平等|AI x 留守儿童测评发布
本文围绕AI x 留守儿童测评展开。测评显示,大模型在基础维度表现较好,是安全可靠的“工具型伙伴”,但在共情关怀等高阶维度表现不佳,尤其在懂心情、能做主、会交友方面平均分低于3分。国内外大模型适儿性差异不显著,在情感话题上表现最佳,但缺乏对真实世界的理解。不同话题中,AI在社交问题上赋能交友能力有提升。AI虽带来资源普惠,但掩盖了获取资源支持系统缺失的问题,造成理解的不平等。未来应从“工具普惠”转向“能力普惠”,构建人机共育生态,让AI助力孩子成长。

[腾讯研究院] AI社交 AI陪伴 商业模式 监管治理 人机关系
HER来了吗:AI社交的热潮与沉思
文章围绕AI社交陪伴展开分析。AI社交需求真实但成功艰难,虽热度高、市场规模预期大,但头部效应明显,竞争激烈,存在高投入、低转化等痛点。产品分六大类,定位清晰、体验深入者才能生存。长期记忆是灵魂,多模态赋予在场感,但AI推动情节能力不足。发展路径有内容驱动平台、垂直场景产品、AI操作系统与人格生态三类,商业模式跑通问题突出。同时,AI社交存在风险,全球监管与平台设计积极应对,未来AI社交演化将遵循表达、关系、结构三层递进,需在技术、商业与伦理间取得平衡。

[腾讯研究院] 克孜尔石窟 数字化保护 文化交流 丝绸之路 佛教文化
守护克孜尔
文章围绕克孜尔石窟展开,介绍其位于新疆阿克苏拜城县,是龟兹石窟群代表,有“中国石窟艺术起点”之称。它历经自然灾害、宗教更迭和人为盗运破坏,保护工作面临挑战。一代代保护者坚守,赵莉完成流散壁画原位考证和数字复原。如今数字化技术发挥关键作用,“探元计划2024”助力壁画修复。对话中,赵莉讲述受壁画吸引坚守克孜尔,段志强强调丝绸之路的创造性及佛教对中国影响大。还探讨了数字化保护、文旅结合等问题,期待克孜尔获更多关注和支持。

[腾讯设计族] 设计 科技 诺贝尔奖 Wolff Olins 谷歌开发者社区 OpenAI
[A's周刊] 无远弗届 探寻万物本源
这是A's周刊003期,介绍设计与科技趋势。涵盖2025诺贝尔奖视觉形象,用金色Logo与字体、金箔肖像画等展现经典;Wolff Olins工作室为纽约植物园和Benefit美妆重塑品牌,前者打造自然图形与动态标识系统,后者设计‘眨眼’Logo等;谷歌开发者社区将代码转化为视觉语言,有药丸、气泡、拼图等图形及四种色彩模式;OpenAI发布会公布AgentKit、Sora 2等产品,降低开发者构建AI应用门槛。

[腾讯设计族] 设计 科技 AI ChatGPT Notion Meta AI眼镜
[A's周刊] 设计即对话, 技术与美的交融
这是A's周刊002期,介绍设计与科技趋势。包含ChatGPT新功能Pulse,可主动推送信息,让用户掌控与AI互动;Notion 3.0升级,有品牌设计革新、AI功能增强、打通外部工具等亮点;Meta AI智能眼镜,有创新交互和多种实用功能;Nigel Cottier用字母重构视觉叙事;Craig & Karl以波普艺术改造布里斯班地标;Dunkin’ At Home的‘Ionic Home’极简广告活动强化品牌记忆。

[蚂蚁技术AntTech] 蚂蚁集团 人工智能 大模型 乌镇峰会 安全风控 医疗健康
2025乌镇峰会:蚂蚁已部署万卡规模国产算力群,应用于风控领域模型训推
2025年11月8日,在世界互联网大会·乌镇峰会前沿人工智能模型论坛上,蚂蚁集团平台技术事业群总裁骆骥分享蚂蚁大模型技术创新实践。当前AGI发展受算力资源与成本制约,蚂蚁通过优化“三大效率”撬动模型响应速度与知识规模。以蚂蚁百灵大模型为例,其构建了全尺寸、全模态、全面开源大模型体系,万亿思考大模型Ring - 1T表现出色,训练效率提升近一倍。蚂蚁在控制推理Token数量有突破,还部署万卡规模国产算力集群,应用于安全风控领域。此外,蚂蚁百灵大模型已落地多领域,如医疗健康应用AQ推动普惠医疗智能化,展现了中国企业在AGI研发领域的竞争力。

[蚂蚁技术AntTech] 蚂蚁集团 gPass技术 AI眼镜 乌镇峰会 数字伴游
蚂蚁联合Rokid乐奇推出AI眼镜数字伴游,乌镇峰会实现 “边走边问”新体验
2025年世界互联网大会上,蚂蚁联合Rokid乐奇推出AI眼镜数字伴游,让乌镇峰会参会者实现“边走边问”新体验。蚂蚁gPass技术与乌镇峰会智能体“桐小乌”融合,通过AI眼镜为参会者提供沉浸式服务,集多种功能于一体。“桐小乌”实现从手机端到AI眼镜的升级,完成从技术验证到商业落地。基于gPass技术,“桐小乌”实现从手持到解放双手、从单一功能到场景化智能陪伴的两大服务跃迁。该服务依托蚂蚁自研技术保障安全,体验流畅。gPass技术9月发布,此前已用于“看一下支付”,未来智能眼镜将提供个性化服务,有望在多领域规模化应用。

[蚂蚁技术AntTech] 蚂蚁集团 乌镇峰会 互联网之光大奖 AI技术 产业应用
蚂蚁集团乌镇峰会获四项互联网之光大奖,AI技术落地产业获权威认可
2025年世界互联网大会乌镇峰会为AI产业落地提供展示舞台,蚂蚁集团获四项大奖。获奖成果有“蚂蚁数科Agentar智能基座”“能源时序大模型Energy TS”“数字蚂力AI云客服”“蚂蚁消金新一代智能实时交互式风控系统”。如Agentar智能基座入选“互联网之光博览会十大首发成果”,可助力金融机构;Energy TS获“新光”产品奖,提升新能源行业效率;数字蚂力AI云客服获“新耀”场景奖,解决传统客服难题;蚂蚁消金风控系统获产品奖。峰会展示其完整技术体系,成果围绕产业需求,推动行业数字化。

[蚂蚁技术AntTech] SGLang - Jax 开源推理引擎 TPU推理 蚂蚁集团 inclusionAI
蚂蚁集团inclusionAI 贡献SGLang-Jax方案,打造业界领先的开源推理引擎
10月19日,SGLang团队推出全新开源推理引擎SGLang - Jax,蚂蚁集团inclusionAI团队参与建设。它基于Jax和XLA构建,有高效原生TPU推理能力。选择Jax后端是因其为TPU设计、受领先AI实验室依赖、技术栈经验证。架构上代码简洁依赖少,输入侧有高效缓存和调度器,模型侧用Flax实现模型。关键优化包括集成Ragged Paged Attention v3、减少调度开销、MoE内核优化、实现推测解码。性能与其他TPU推理方案相当或更优。文中还给出安装启动方法、使用TPU方式及发展路线图。

[货拉拉技术] 数据核对 SQL配置 架构设计 货拉拉技术
从代码到配置:如何用SQL配置实现数据核对
文章介绍货拉拉从代码到 SQL 配置实现数据核对的演进。传统代码式核对系统规则变更需发版,存在响应慢、成本高、风险大问题。于是用 SQL 配置规则,其表达能力强、学习和维护成本低。架构设计围绕事件触发、规则 SQL 化、线上隔离、数据共享与并行。核心技术包括 SQL 解析与血缘分析、在线调试与验证、数据指纹驱动的分组执行、内存快照隔离。成果显著,配置效率从 2 - 3 天缩至分钟级,节约成本,数据复用高效。未来将朝可视化、智能化方向发展。

[转转技术] MySQL 优化器 索引 全表扫描 执行成本
揭秘MySQL优化器:为何索引在手却选择全表扫描?
文章围绕MySQL优化器在有索引时选择全表扫描的问题展开。先以具体表结构和SQL为例,分析执行计划,发现优化器在查询成本相同下因排序选择主键索引。介绍查询流程,包括优化器四步工作、执行成本(CPU和I/O成本)及5.7版本默认成本常数。通过表统计信息分析执行成本,指出优化器假设数据均匀分布致全表扫描。最后提出优化思路,如用子查询引导使用高效索引,强调理解优化器原理对提升数据库性能的重要性。

[软件工程3.0时代] AI上下文工程 软件工程 批判性思维 大模型时代
我来彻底说说AI上下文工程(上)
本文围绕AI上下文工程展开,先说明作者本拟在峰会讲该议题,后决定文字阐述。指出AI助手表现差异源于上下文质量,强调上下文是AI研发助手生命线。从哲学溯源,说明上下文概念与苏格拉底诘问法、批判性思维相关。软件工程中上下文无处不在,且是动态变化的。大模型时代,上下文从背景信息变为核心生产资料。定义了上下文工程,即系统化实践,包括识别、提取等环节,还介绍其边界。最后阐述上下文工程的三个层次,分别是单次对话、会话级和项目级,上层依赖下层且价值更大。

[软件工程3.0时代] 智能体 软件研发 大厂实践 未来趋势
看国内大厂如何在软件研发中玩转智能体(agents)?
本文结合大厂实践与学术进展,介绍智能体在软件研发的应用。2025 年正从‘Copilot 时代’迈向‘Coding Agent 时代’。智能体在需求、开发、测试、运维、数据与知识管理各阶段发挥作用,还能多 Agent 协同。大厂应用已规模化落地,如阿里构建生态,腾讯深耕场景。不过,面临复杂业务理解、上下文窗口、可信度、成本等挑战。未来,智能体将成‘数字员工’,向专家化、伙伴化、行业化发展,从业者应与之协作。

[追问nextquestion] 脑科学 人工智能 前沿研究 科研成果
10月,最受关注的脑与AI前沿研究有哪些?|《追问洞察》10月刊
《追问洞察》10月刊聚焦脑科学与人工智能领域,整理259篇高质量论文。涵盖AI推动科学前沿,如自动化科研、预测模型构建、跨学科整合;提升人类健康与寿命,涉及个性化医疗、疾病预防、健康管理;缓解人类痛苦,关注心理健康与精神疾病、神经调控;意识实现无处不在,包含意识模拟、脑机接口、机器人进展;记忆与大模型研究突破,有记忆机制、意图与决策、大模型技术;大脑模型进展,含神经机制与脑功能解析、计算模型与人工智能模拟等多方面研究成果。

[追问nextquestion] 人工智能 意识 肉身主义 电化学过程 主流意识理论
距离觉醒意识,人工智能还差一具肉身?
文章围绕人工智能是否能觉醒意识展开探讨。哲学家Ned Block在论文中提出“肉身主义”,认为意识不仅依赖计算,还需具身的生物学过程,如神经元、突触等生物机制。电化学过程与AI算法有三大不同,包括模拟性与连续性、状态依赖体验、化学突触传递延迟,且生物界案例暗示电化学系统与意识演化相关。意识依赖特殊模式,如脑电波,麻醉剂影响意识也证明其扎根于电化学汤动态。当前主流意识理论多遵循计算功能主义,忽视“肉身”必要性,越来越多研究表明意识可能是生命过程的副产品,若肉身假说成立,人工生命或更接近造出“真意识”。

[阿里云开发者] DMS Airflow 数据工作流编排 Apache Airflow
DMS Airflow:企业级数据工作流编排平台的专业实践
本文围绕 DMS Airflow 这一企业级数据工作流编排平台展开。先介绍 Airflow 高级编排能力,如用 Python 代码定义 DAG、灵活管理任务依赖、多种调度与时间触发方式、完善的任务状态管理等。接着阐述 DMS 集成的特殊能力,包括与 DMS 系统深度集成实现统一认证授权和服务集成,具备企业级通知、智能资源管理、动态刷新 DAG 等功能。然后给出使用示例,涵盖 SQL、Spark、数据同步、Notebook 任务执行及通知器使用、完整 ETL 工作流。最后总结其核心优势,如无缝集成、功能丰富、智能管理等,适用于数据 ETL、分析报表、机器学习等场景。

[阿里云开发者] JVM内存优化 Long2ObjectOpenHashMap 数据结构重构
重构一个类,JVM竟省下2.9G内存?
文章介绍了重构一个类使 JVM 节省 2.9G 内存的案例。核心业务链路中,因复杂过滤逻辑将全量商品标签数据加载至内存,原“通用集合嵌套”设计成内存消耗大户。老结构中,HashMap<Long, HashSet<String>> 存在诸多问题,如 String 类型标签浪费内存。经分析标签分布,选择将 HashMap<Long, ?> 换为 Long2ObjectOpenHashMap<?>,HashSet<String> 换为排序后的 int[] 加二分查找。优化后内存占用直降 94%+,从 3.13G 降至 200M 量级。还详细介绍了 Long2ObjectOpenHashMap 的底层机制、优缺点及适用场景。

[阿里云开发者] 评估工程 Agent演进 AI系统 LLM - as - Judge 奖励模型 云监控2.0
评估工程正成为下一轮 Agent 演进的重点
文章指出评估工程成为下一轮 Agent 演进重点。传统软件工程测试方法难用于 AI 系统,因其结果不确定。评估工程贯穿 AI 生命周期,目标是量化 Agent 表现质量,正走向体系化、工程化和自动化。评估工程经历规则匹配、语义匹配、模型自动化评估三阶段,LLM - as - Judge 范式可将人类偏好转化为可执行评估函数。介绍奖励模型 RM - Gallery,它是一站式平台,助力奖励模型全流程落地。还基于阿里云云监控 2.0 分享实施过程,包括数据采集、预处理、实时评估、后处理,可搭建自动化评估系统,开启数据飞轮。

[阿里云开发者] AI时代 规则引擎 QLExpress4 重构 性能优化
AI时代,我们为何重写规则引擎?—— QLExpress4 重构之路
AI时代规则引擎需求旺盛,QLExpress4进行全面重构。QLExpress是轻量易用的Java嵌入式脚本引擎,因代码历史久、问题多而重写。QLExpress4在性能、体验上大幅优化,编译性能提升约10倍,执行性能提升约1倍,错误提示达token级,支持JSON语法和字符串处理,有表达式追踪特性。它有规则归因聚类、模型动态映射等特色场景,对AI友好,能助力大模型调试诊断。编译链路换用Antlr4,执行路径优化超时检测和指令集。项目重视单元测试覆盖,用adoc文档保证代码示例有效,解决文档保鲜问题。

[阿里云开发者] 容器可观测性 SysOM 业务抖动 内存申请延时 CPU延时
容器可观测新视角: SysOM延时监控助力定位业务抖动原因
云原生场景中,资源超卖和混合部署使宿主机与容器应用资源竞争加剧,内核级延迟会引发业务抖动,但缺乏可观测性数据致排查难。文章介绍了内存申请延时、CPU延时及常见抖动场景,如容器或宿主机内存紧张、就绪队列等待长等。阿里云推出SysOM监控功能,可在容器和节点维度查看相关大盘识别延时。内存申请延时可看Pod和节点维度的特定监控大盘;CPU延时可查看节点维度的相关大盘。还给出解决办法,如用调度抖动诊断分析根因。最后通过案例展示如何定位CPU延时导致的网络抖动并解决。

[阿里云开发者] Midscene.js UI自动化 AI工具 源码剖析 业务落地
Midscene.js 实战与源码剖析:如何重塑 UI 自动化
本文介绍基于AI的UI自动化工具Midscene.js,剖析其设计动机、架构、原理及源码。传统UI自动化工具存在元素选择器脆弱、维护成本高、调试体验差和跨平台支持不足等问题,Midscene.js应运而生。它提供chrome插件试用,有VL和LLM两种模型。源码解析方面,项目采用分层架构,分为公开发布、内部工具和应用程序包。工作原理包括页面上下文获取、第一次AI调用、元素验证、二次AI调用和自动化操作执行。使用中会遇到抓取信息丢失、长度截断、部分操作不生效等问题,可通过修改源码或切换模型解决。最后对业务落地提出新手引导、智能营销、智能发品和为AI code提供上下文等思考。

[阿里云设计中心] AI技术 古籍数字化 《牡丹亭·惊梦》 通义万相
AI重绘古籍经典之美《牡丹亭·惊梦》
本文介绍了阿里云中央媒体行业线与设计中心制作的《游园惊梦》视频,以明万历刻本《牡丹亭·惊梦》为蓝本,借助通义万相AI技术再现爱情传奇。设计师将古文场景化,先调研古籍、文本化资料、翻译编辑,再生成静帧画面和视频。创作中解析剧本,定义风格配色,设计场景和人物形象。还介绍了通义万相技术,克服人物场景一致性、图生视频可控性、画面过渡及氛围后期等难点。作品于2025年1月10日在多平台发布,期待未来有更多AI与古籍文化融合形式。

[阿里云设计中心] AI-Native Design 阿里云设计部创新中心 云栖大会 设计工具 设计课程
AI-Native Design 设计体系云栖发布实录
阿里云设计部创新中心汪晓鸣在云栖大会介绍AI-Native Design设计体系。该团队专注云计算与人工智能创新,参与多个重大项目。他将设计演进分为IT、DT、AI时代,AI时代技术隐形、体验自然,设计范式需进化。团队构建的AI-Native Design专业体系贯穿模型、平台、应用层。在此基础上发布AI-Native Design Suite,由设计系统、工具、课程构成。还推出开源设计系统SparkDesign、培训课程“Vision”,以及面向企业的MoovaMark和面向设计师的AIGC工作流工具,强调AI-Native Design探索永不止步。

[阿里巴巴] 阿里巴巴 世界互联网大会 通义千问 天猫双11 菜鸟物流
阿里事儿丨吴泳铭乌镇峰会开幕式致辞;通义千问大模型获世界互联网大会领先科技奖
2025年世界互联网大会乌镇峰会期间,阿里巴巴成果丰硕。吴泳铭致辞表示加大投入打造超级AI云,推动开源开放与技术普惠。通义千问大模型获领先科技奖,已开源300多个模型,下载量破6亿次。阿里展出全栈AI成果与智能硬件,公益宣布明年新建超400间少年云‘AI云教室’。商业合作上,中国银联、欧莱雅中国与阿里合作。电商方面,天猫双11新品牌爆发,302个新品牌夺冠,AI助力商家增长;飞猪双11机票次卡热销;淘宝闪购新客订单破亿。此外,菜鸟保障黑五大促,亚太供应链增长显著。

[饿了么设计] AI设计 商家开店 涌现式交互 体验设计
商家开店的背后:由AI驱动的任务体验设计新范式
文章围绕AI驱动的商家开店体验设计展开。先介绍Agentic AI使交互模式从界面驱动变为任务驱动,涌现式交互可根据实时情况生成任务路径,契合商家开店流程。接着阐述AI开店设计实践,现有列表驱动模式有痛点,通过确立对话式交互框架、优化对话设计(提升意图识别与信息反馈)和任务编排,打磨互动体验。最后指出设计AI产品切入点拓宽,要介入整个交互过程。实践表明,AI开店降低进线咨询量、提升建店转化率,还将探索在各经营环节的应用。

[黑夜路人技术] BMad Method AI 敏捷开发 人机协作 扩展包生态
AI 敏捷开发Agent - BMad Method 介绍
本文介绍了 BMad Method,一个通用 AI 代理框架,用于人机协作的敏捷开发。它跨领域、与工具无关,有双重部署模式。安装可通过 npx 或源码克隆,安装后有特定项目结构。其核心代理团队涵盖规划、开发和协调阶段。工作流程包括分析、规划、架构设计、开发和质量检查。还给出在 Claude Code 中构建任务管理系统的实战教程,介绍扩展包生态及创建自定义扩展包方法。该方法具有结构化、深度 IDE 集成、可扩展等优势。

[Android 开发者] Android Studio Narwhal 4 功能更新 智能体模式 Wear OS 表盘
Android Studio Narwhal 4 功能更新稳定版现已发布
2025 年 11 月 7 日,Android Studio Narwhal 4 功能更新稳定版发布,这是该版本最后一次功能更新。此版重点支持声明式 Wear OS 表盘开发,提供表盘 XML 格式编辑器支持,可在 IDE 中完成表盘开发全流程;能将项目视图设为默认。还修复 550 多个错误,智能体模式升级为稳定版。回顾 Narwhal 系列,有智能体模式、Android 合作伙伴设备实验室、测试应用备份和恢复、可调整窗口大小的 Compose 预览版、Google Play 政策洞见等核心功能。

[iOS新知] iOS 26.2 Beta 苹果系统更新 新功能介绍
iOS 26.2 beta 来了,终于支持提醒事项闹钟了,再也不用担心忘记重要事情
苹果推出 iOS 26.2 Beta 1,有不少实用新功能。锁屏液态玻璃可精细调节透明度,还能关闭用实心效果;睡眠评分标准调整,更符合实际;提醒事项支持设闹钟,且与普通闹钟区分;AirPods 实时翻译扩展到欧盟;AirDrop 可能支持 PIN 码配对;屏幕可闪烁提醒;密码 App 能管理不保存密码的网站。目前仅对开发者开放,正式版预计下月发布。

[iOS新知] Swift iOS开发 编译器优化 类型检查
这个 Swift 报错困扰了我多年,现在终于有救了
文章围绕 Swift 编译器“the compiler is unable to type - check this expression in reasonable time”报错展开。该报错与 Swift 类型推断机制有关,其采用约束求解法,最坏情况复杂度为指数级。编译器设操作计数器和内存限制判断“合理时间”,但此错误不明确代码对错。Swift 团队已做不少优化,如在 Swift 6.2 提供更好诊断信息、减少回溯、简化约束系统;正在进行并行和增量类型检查、优化启发式算法;未来有渐进式类型推断、灵活配置和编译器诊断模式等计划。最后给开发者建议,如拆分表达式、加类型标注等。

[iOS新知] iOS 26.1 Apple系统更新 iOS功能改进
iOS 26.1 来了,终于修复了这个恼人的问题,再也不会误触闹钟了
2025年11月4日苹果发布iOS 26.1,是iOS 26首个大版本更新。此次更新虽新功能不多但实用。包括闹钟改为滑动停止降低误触;新增设置选项可调节Liquid Glass透明度;允许关闭锁屏相机快捷方式;Apple Intelligence支持更多语言,AirPods实时翻译新增语言;Apple Music MiniPlayer支持滑动手势、AutoMix支持AirPlay播放且锁屏界面变好看;健身App可手动记录运动;还有FaceTime低带宽音频提升等小改进。更新支持iPhone 11系列等机型,方法简单。

[PaperAgent] LLM架构 Kimi MiniMax - M2 线性注意力 Qwen3 - Next
K2、M2之后LLM架构还会有哪些变化?
文章围绕K2、M2等模型探讨LLM架构变化。Kimi K2 Thinking架构与K2一致,仅提升上下文长度,Kimi 2采用DeepSeek V3架构并扩展。MiniMax - M2是最强开源权重模型,回归全注意力,与Qwen3相似。线性注意力机制曾有早期方案但掉点明显,今年下半年部分模型采用后又有反复,如MiniMax - M2弃用、Kimi Linear又采用。Kimi Linear与Qwen3 - Next采用3:1混合注意力策略。Qwen3 - Next减少总参数量、增加专家数量,用混合模块提升上下文长度,还采用多token预测提速。

[phodal] AutoDev 架构升级 多端编程 AI编程 跨平台架构
AutoDev 架构升级:多端编程 Agent(CLI/Desktop/Mobile),欢迎一起参与演进
作者介绍 AutoDev 架构升级,聚焦多端编程 Agent。半年前提出多端支持方向,国庆后推进演进,新重构方向成型。基于 KMP + Compose 重构,MPP - Core 是核心,构建 JS 和 JVM 版本接口与实现,能打造 CLI、TUI、IDEA、Desktop、Android、iOS 等多端应用。引入基于 TreeSitter 的 MPP - CodeGraph 节省成本,解决代码搜索问题。AutoDev IDEA 预期作为 MCP 服务端。AutoDev 开发 Android 和 iOS 版本,可远程操作。用 Compose 重塑界面交互更稳定。MPP - Core 剥离平台差异实现跨平台。最后邀请各界人士参与 AutoDev 多端编程世界建设。

国外
Server-Sent Events MSW sse API API mocking
本文介绍 MSW v2.12.0 对 Server - Sent Events 的支持。新的 sse() API 可标准安全地拦截和处理事件,适用于实现了 EventSource 类的环境。文中展示了 sse() 的使用示例,包括基本数据发送、周期性推送动态数据,且通过定义接口实现类型安全事件,还支持自定义事件。此外,可调用 server.connect() 建立与原 URL 连接并订阅真实服务器数据,将处理程序变成代理。最后推荐使用 npm i msw@latest 安装,可查看文档了解更多 SSE 功能,并对相关贡献者和支持者表示感谢。

TypeScript AI era Octoverse Anders Hejlsberg
TypeScript’s rise in the AI era: Insights from Lead Architect, Anders Hejlsberg
本文围绕TypeScript在AI时代的崛起展开。2012年Anders Hejlsberg开发它是为解决JavaScript在大型项目中扩展性差的问题。2025年它成为GitHub上最常用语言。TypeScript是JavaScript的开源、有类型超集,能在编译时检查类型错误等,广泛用于前后端等系统。为提升性能,其编译器用Go重写。它与JavaScript无缝融合,各大前端框架默认支持。在AI时代,其静态类型系统和数据熟悉度使其适合AI工作流,能让AI生成可靠代码。此外,大语言模型改变开发者工具概念,Typed语言为AI提供结构。Anders一直致力于构建让复杂软件更易理解的语言,TypeScript不断发展,助力开发者清晰表达意图。

Chrome DevTools Network Throttling Specific Requests Throttle
How To Throttle Specific Requests In Chrome DevTools
文章介绍了在 Chrome DevTools 中对特定请求进行节流的方法。以往 Chrome DevTools 的网络节流适用于所有请求,而现在 Chrome Canary 可对特定请求或域名节流。要启用特定请求节流,需安装 Chrome Canary 并在 chrome://flags 页面开启。对特定请求添加延迟,可在开发者工具网络面板中右键请求,选择节流选项。若想按固定毫秒数延迟请求,可编辑请求 URL 模式匹配资源,添加自定义节流配置,设置延迟时间,重新加载页面就能看到效果。

Semantic HTML Elements Accessibility Button Element DevTools
Explaining the Accessible Benefits of Using Semantic HTML Elements
文章以 <div> 模拟按钮与语义 <button> 元素对比,阐述使用语义 HTML 元素的可访问性优势。用 <div> 模拟按钮虽可通过添加角色暴露为按钮,但缺乏内置交互行为,需额外代码实现,如设置 tabindex、添加按键监听等,且处理禁用状态更复杂。而 <button> 自带交互状态、焦点指示器、键盘支持等,重置样式也仅需一行 CSS。作者原本只泛泛知晓语义元素有助于可访问性,学了 Sara Soueidan 的课程后,有了具体论据,并掌握用 DevTools 检查语义的方法。

JavaScript Source Maps TypeScript Developer Tools Symbolization
The Inner Workings of JavaScript Source Maps
文章深入介绍 JavaScript 源映射工作原理。源映射能将压缩后的 JavaScript 文件符号和位置映射回原始代码,如调试时可显示原代码。现代 JavaScript 构建分转译、打包、压缩三阶段,各阶段源映射都保留与原代码的联系。源映射文件为 JSON 格式,核心是 mappings 字段,采用 VLQ 编码压缩映射数据。映射字符串由逗号和分号分隔成段,段有 1、4、5 值三种情况,4 值最常见,分号代表换行。VLQ 编码分三步:编码符号位、拆成 5 位组、转 Base64。最后作者表示源映射支持将用于性能分析工作流。

JavaScript underrated features cross - platform routing
Mastering URLPattern for Cross-Platform Routing
文章介绍了 10 个常被低估的 JavaScript 特性,可减少样板代码。Set 能去重和防止事件重复绑定;Object.entries()与 Object.fromEntries()可过滤对象值和解析 URL 查询;??和??=提供更安全默认值;Intl 用于货币、数字和日期的国际化;IntersectionObserver 可实现图片懒加载和无限滚动;Promise.allSettled()处理批量请求不快速失败;Element.closest()用于可靠的 DOM 遍历;URL 和 URLSearchParams 简化 URL 操作;for…of 遍历可中断;Top - Level Await 实现无包装的异步模块。现代 JavaScript 原生 API 强大,使用这些特性可专注解决实际问题。

JavaScript Global Execution Context Temporal Dead Zone Hoisting
How Do Global Execution Context and Temporal Dead Zone Work in JavaScript?
本文深入剖析JavaScript全局执行上下文和暂时性死区(TDZ)的工作原理。运行代码时先创建全局执行上下文,分内存创建和代码执行两阶段。内存创建阶段,为变量和函数分配内存,var初始化为undefined,let和const未初始化,函数声明完整存入内存,此过程即提升。代码执行阶段,按行执行代码。TDZ指变量存在但未初始化的时期,防止使用未声明变量。函数声明可全量提升,函数表达式和箭头函数按变量规则提升。理解这些机制能预测代码行为、避免错误、编写更优代码。

Coding Agent AI Geoffrey Huntley Workshop
how to build a coding agent: free workshop
本文为构建编码代理的免费研讨会内容。演讲者Geoffrey Huntley指出,2025年学习构建编码代理对个人发展有益,能从AI消费者转变为生产者。构建编码代理并不难,只需300行代码配合大语言模型(LLM)循环运行。他介绍了构建要点,如选择高代理性模型(Claude Sonnet或Kimi K2),可将其他LLM作为工具接入;使用上下文窗口时一次只进行一项活动,避免过度分配。还讲解了编码代理的基本原语,包括读取、列表、bash、编辑和搜索工具,并通过示例展示构建过程。最后强调个人应投资自身,跟上技术变革,避免落后。

[Gartner公司] Gartner报告 AI技术 网络安全 中国市场
【Gartner报告精选】建设AI就绪型员工队伍;AI技术成熟度曲线;中国市场指南;网络安全
这是Gartner报告精选,涵盖多领域内容。在中国打造AI就绪型员工队伍很关键,CIO要打造AI赋能型团队。2025年AI投资关注点从生成式AI转向基础性创新。中国云服务提供商持续创新,为CIO等评估云服务提供商能力提供参考。零信任网络访问保障企业数字资产安全,助CIO选产品。中国AI网络安全治理有三大要务,跨国企业选网安工具有三个实践。还涉及应对2025 - 2026年威胁态势、选AI智能体架构、构建AI软件工程技能、让I&O团队准备好采用生成式AI等内容。

[Gartner公司] CIO 运营转型 AI创新 价值兑现 IT管理
CIO未来行动手册:引领运营转型、AI创新与价值兑现
在数字化转型和AI驱动时代,CIO面临技术升级与业务价值兑现挑战。此电子书解析CIO如何重塑IT运营模式支撑增长、评估数据AI就绪性及应用现代化路径,以优化IT管理。还指出从战略到执行,CIO要关注五个重点,包括重塑IT运营模式、验证数据AI就绪性、实施应用组合现代化、提升成本优化至战略高度、持续兑现技术投资价值。

[Gartner公司] Smart City AI Sustainable Development Gartner
智慧城市新篇章:以人为本,AI赋能,可持续发展
Gartner发布《2025中国智慧城市和可持续发展技术成熟度曲线》报告,揭示智慧城市建设动态与趋势。其建设有四大支柱,包括关键城市基础设施与服务、数字赋能的可持续性等。发展呈现以人为本、AI赋能、可持续发展三大趋势。以人为本要从被动管理转向主动服务,构建包容性社区,依赖数据驱动机制;AI赋能可构建数字孪生模型、提升决策支持,但要避免重复建设等;城市可持续发展从降低破坏到应对变化,由数字化技术驱动,需生态协同与长效运营。建设是长期复杂过程,需多方共同努力。

[Unity官方平台] Unity 动画系统 AnimGraph RigGraph IK & Retarget
AnimGraph & RigGraph & IK Retarget:实现可视化动画编辑
Unity引擎1.7.0_preview版本起更新动画系统,引入AnimGraph、RigGraph、IK & Retarget三大核心功能。AnimGraph采用节点图编程范式,基于Playable系统,有灵活的状态机控制,还有多种动画功能节点;RigGraph基于图编程范式,有新绑定系统、人型角色模板及CodeGenerator系统;IK & Retarget可跨角色迁移动作,新增多个API。文章还给出快速上手步骤、注意事项,展望未来将往“模块化”“智能化”发展。

[Unity官方平台] VR 180互动短剧 实战工坊 Unity Coffee&XR
VR 180 互动短剧全流程实战工坊 来啦
2025年11月6日消息,Unity中国团结引擎与Coffee&XR联合推出「VR 180互动短剧全流程实战工坊」。继《新桃花源记》后,Coffee&XR工作室新作《我的盲盒女友》VR互动短剧年底将上线。工坊为期2天共10课时,进行高密度集训,能让人从0到1掌握VR互动短剧完整链路,涵盖拍摄实操、后期处理、交互开发、眼镜适配及作品上架等全环节干货。诚邀影视创作转型者、XR/Unity开发者、行业创业者及高校相关专业师生报名,下滑可锁定名额并解锁专享好礼。

[Unity官方平台] 团结超分方案TJSR Unity URP渲染管线 图像增强
团结超分方案 TJSR 上线,画质与性能双升级!
2025年11月5日18:30,Unity官方平台上线团结超分方案TJSR,面向URP渲染管线。它基于时域信息融合与抗锯齿重建,适用于移动端或小游戏等项目。使用TJSR可大幅降低GPU压力、提升图像质量、灵活适配不同设备。使用时,在URP项目中按步骤启用设置即可。还可通过调节Render Scale和选择质量等级优化画质与性能。Advanced Upscaling Filter配置有优先级,若配置了高级选项,TJSR可能不生效。TJSR支持多种调试视图,如Rendering Debugger和Frame Debugger。需注意,当前版本仅支持URP渲染管线,禁用MSAA,建议在Play Mode或启用Frame Debugger验证。

[Unity官方平台] Unity Accelerator Cache Server 新功能 团队协作
团结 Accelerator (Cache Server)新功能上线,让团队协作更高效
2025年11月3日,Unity官方平台宣布团结Accelerator(Cache Server)新功能上线。Accelerator作为资产缓存加速器,可共享分发资产缓存,避免团队成员重复导入资产。此前Cache Server架构存在按需下载、上传解耦、缓存清理、传输管理等问题。团结引擎新增Cache Server APIs和Lazy Download特性。Lazy Download实现按需下载,测试显示可大幅减少首次打开项目的必要资产缓存,提升打开速度。同时还更新了缓存上传、延迟上传、服务器缓存清理等接口。未来规划包括完善前端页面、推出资产免构建一体化服务、结合团结Asset Manager实现项目资产在线管理。

[Unity官方平台] Unity EasyAR Mega 城市级AR AR开发
Unity × EasyAR Mega:走进城市级 AR 新体验
文章介绍了Unity与EasyAR Mega结合实现城市级AR新体验。在AR开发里,Unity是可靠创作平台,随着高价值物理空间数字化需求增加,EasyAR Mega应运而生,它是大空间视觉定位和空间计算平台。传统AR适合室内或单点,而大空间AR在文旅导览、目的地导航、娱乐互动等方面有需求。二者结合有建图与编辑、实时定位与渲染、验证与测试、多端部署四大核心点,还有文旅导览、目的地导航、展览展示等应用案例。开发者选择它是因其定位精准、上手简单、商业价值清晰,未来将成大空间AR开发最佳实践。

[谷歌开发者] Chrome 开发者工具 AI 辅助功能 Web 开发
Web 开发指向标 | Chrome 开发者工具学习资源 (六)
文章介绍 Chrome 开发者工具的 AI 辅助功能。该工具内置于 Google Chrome 浏览器,AI 辅助面板处实验阶段,可在 Chrome Canary 131 及更高版本用。借助此面板能与 Gemini 聊天,对话含网页技术信息,可了解样式、网络请求、来源、效果等内容。使用需满足年满 18、用最新版 Chrome、登录 Google 账号、设置语言为英语 (美国)、启用 AI 创新等要求。同时说明了数据使用方式、试用要点、已知问题,如可能生成不准确信息、受提示注入影响等。还提及控制功能适用范围及停用方法,鼓励关注系列文章获取更多技巧。

[微软亚洲研究院] Phi - Ground模型 GUI Grounding 智能体 微软亚洲研究院
Phi-Ground模型:让AI学会“看屏幕”
随着多模态和推理模型发展,能操作计算机界面的智能体CUA渐成现实,图形界面定位(GUI Grounding)是核心环节,但现有模型准确率低。微软亚洲研究院发布技术报告,提出Phi - Ground系列模型,在五个主流基准上表现最佳。该团队构建了可复现、可扩展的GUI Grounding方案:数据层面,构建并均衡采样大规模训练集;任务结构上,将任务拆分为规划和定位两层;训练策略上,探索多种技巧。Phi - Ground在多项评测中表现出色,达到效率/效果权衡。其核心技术已集成到Windows Copilot产品,未来随着关键能力突破,智能助手或不再遥远。
