
设计的商业价值终于可以被清晰统计,设计环境正在改变!
阿里国际设计中心与AliExpress用增团队推出《爆款应用是如何炼成的——ASO进阶方法论》,以新视角解读设计趋势。以往设计因‘体验’难统计,在商业中话语权弱。如今大数据影响设计,数据化思维成新能力。用增设计采用高度数据驱动范式,以数据为媒介理解用户,将业务目标转化为设计假设并验证迭代。数据不仅衡量效果,还揭示用户真实需求,辅助完善用户画像。用增量化设计构建‘假设 - 实验 - 迭代’闭环,让设计成为可测量的增长引擎,设计师结合数据与品味,能让设计成为商业发展的精准引擎。

最高补贴3000万!菜鸟智谷“跨境新势 AI领航”大会召开,2025品牌出海生态再升级
2025年10月21日,“跨境新势 AI领航——2025年度品牌出海生态大会”在菜鸟总部园区举办。政企代表共议品牌出海新未来,杭州商务局武长虹等指出跨境电商发展趋势及菜鸟智谷重要性。大会完成三项重磅发布,速卖通“浙企出海”项目助力浙企拓展全球市场;阿里国际人工智能人才孵化中心启幕,AIGC体验中心入驻菜鸟智谷,推动AI与跨境融合;浙江省海外综合服务余杭站菜鸟智谷分站授牌,提供全生命周期服务。二期客户集中签约,丰富园区生态。“货通全球扶持计划”发布,最高补贴3000万。平台实战分享提供运营等指引,菜鸟智谷以AI为引擎构建创业创新热土。

Androidify 全新升级,用 AI 瞬间生成专属 Android 机器人
本文介绍 Androidify 全新升级,用户可通过自拍和 AI 构建专属 Android 机器人,有网页端和 Google Play 应用版本。其关键技术集成包括:借助 Firebase AI Logic SDK 访问 Gemini 和 Imagen 模型,实现图像验证、描述添加和机器人形象生成;有“帮我写”功能。界面用 Jetpack Compose 构建,结合 CameraX 与 ML Kit 姿态检测 API 实现相机功能。最新版本添加强大功能,如用 Gemini 图像编辑功能生成背景氛围,使用 ML Kit 主体分割技术实现贴纸模式。用户可在 androidify.com 体验或在 Google Play 下载应用。

达摩院MICCAI'25|不是每张CT都 equally important!AI学会抓取淋巴结恶性“关键帧”
文章围绕基于CT图像的食管癌淋巴结转移预测展开。指出深度学习方法虽提升了淋巴结鉴别性能,但存在问题,如更关注CT切片平均特征,缺乏关键特征提取融合,且未显式提取临床相关特征。为此,将3D淋巴结转移预测化为多实例学习问题,提出Prototype指导的双流MIL框架,有效捕捉局部和全局特征,还引入多尺度多模态融合模块,融合临床与深度学习特征。实验显示,该方法在多个指标表现良好,消融实验验证了形态特征重要性及合适的slice数量。未来可构建大规模数据集,扩展到N分期预测任务。

第一台 Andriod XR 设备发布,Jetpack Compose XR 有什么不同?对原生开发有何影响?
近日三星推出首款基于 Android XR 的 Galaxy XR 设备,Android XR 基于开放标准构建,支持多工具,可实现沉浸式交互。官方提供 Jetpack XR SDK,基于此的 Jetpack Compose 让开发者用 Kotlin + Compose 开发,降低适配成本。应用有主空间和全空间两种运行模式,需适配不同场景切换。Jetpack XR SDK 提供新 Compose API 用于空间化 UI 构建,支持自动降级到 2D 表示,还具备 XR 模式管理等功能。目前 XR 开发跨平台支持微弱,多为原生开发,智能眼镜独立 app 赛道也基本是原生开发。

Swift 周刊 #07 | 每周精选 GitHub 神器
本文为Swift周刊第7期,分享7个GitHub上的iOS开发项目,含4个开发库与3个工具。开发库有网络请求老牌库Alamofire,支持多系统,链式调用方便;图表绘制神器Charts,功能全且使用简单;单元测试必备OCMock,适合OC老项目;数据分析SDK Amplitude-iOS,可追踪用户行为等。工具类有推送调试神器Bark,支持自定义;重签名利器iOS App Signer,GUI界面操作方便;SwiftUI实战范例Element X iOS,代码质量高,采用混合开发模式。

SPM 系列二、搞懂 SPM 这 3 个命令,依赖再也不出错
文章围绕SPM的Resolve、Reset和Update三个常用命令展开。先介绍了Package.resolved文件,它记录实际下载版本和commit,确保团队用相同版本。Resolve用于重新解析依赖,不改该文件,适用于刚克隆项目无此文件或删除它的情况;Reset用于清除缓存和构建目录,在下载中断、包损坏等时使用;Update将依赖更新到最新版,会改变该文件,在修改版本要求或想更新时用。还给出了实际使用场景,如克隆新项目、下载中断、升级依赖等情况的操作。最后强调要提交Package.resolved到Git,升级依赖需测试,一般Xcode会自动处理,有问题再手动操作。

iOS 26.1 这几个功能,早该加了!
文章介绍 iOS 26.1 第四个测试版的新功能。一是 Liquid Glass 能调透明度,在“设置>显示与亮度”中可在“清晰”和“着色”效果间切换;二是可关闭锁屏相机滑动,在“设置>相机”中操作,关后仍可通过其他方式打开相机;三是能关闭电话震动反馈,在“设置>电话”里设置。按惯例,iOS 26.1 预计 10 月底或 11 月初正式推送,建议等正式版更新。若用 iOS 26,正式版出来后建议升级,测试版用户升级到 Beta 4 稳定性尚可。

AipexBase,中国首个AI原生后端基础设施正式开源!
2025年10月22日,北京跨赴科技自主研发的中国首个AI原生后端即服务平台AipexBase正式开源。当前AI Coding浪潮下前端已智能化,但后端开发仍门槛高、效率低,且多依赖海外平台。AipexBase愿景是让开发者‘不写后端,也能拥有完整后端’,自动封装后端能力,实现AI Coding从前端到后端的智能闭环。它是AI时代后端架构演进版本,原生兼容MCP,支持多AI产品接入。同时深度适配中国开发生态,跨赴科技希望与全球开发者共建AI时代后端标准,推动国产开源项目持续进化。

OpenBMB Meetup 回顾|大模型长文本高效计算,我们聊透了这些硬核议题
10月23日晚,OpenBMB开源社区在北京举办「大模型长文本高效计算」专场Meetup。活动开场介绍社区愿景是让大模型飞入千家万户,已涌现众多开源项目。肖朝军分享稀疏注意力研究进展,介绍InfLLM - V2优势及团队新研究。王硕介绍长序列模型研究应用,涉及数据工程、位置编码等方向及应用探索。开放麦环节探讨视觉压缩、RAG与长文本处理技术发展等多个问题,展现社区从原理到落地、单人到群体碰撞的特色,社区长期开放合作。

一份最新具身智能中的世界模型&安全综述
这是一篇具身智能世界模型与安全挑战的综述。先介绍世界模型是智能体“脑内小宇宙”,能统一感知、预测和决策链路。用三维坐标轴分类文献,功能分决策耦合和通用,时间分顺序和全局,空间有不同表示方式。还展示不同领域代表方法坐标。性能方面,对比像素生成、场景理解和控制任务表现。此外,指出具身智能发展凸显对先进一体化模型需求,关注自动驾驶和机器人领域世界模型安全隐患,开展实证分析,识别并量化常见故障。

被DeepSeek带火的OCR,最新8个开源模型盘点~
DeepSeek - OCR发布使OCR大热,PaperAgent梳理盘点8个热门开源OCR模型。DeepSeek - OCR用‘上下文光学压缩’技术,实现10 - 20倍压缩率,突破文本token瓶颈;Nanonets - OCR2 - 3B以零样本视觉链式思维为核心,支持多场景;百度PaddleOCR - VL统一多任务,支持多场景,零样本高精识别;清华Glyph实现上下文窗口缩放;MinerU2.5在文档解析评测中领先;odots.ocr功能强大且性能佳;OCRFlux将文档转换为Markdown文本;GOT - OCR2适用于多种OCR任务。

Identity-GRPO:阿里开源多人物定制化视频生成的后训练优化算法
本文介绍阿里开源的多人物定制化视频生成后训练优化算法Identity - GRPO。多人物身份保持视频生成(MH - IPV)任务中,现有模型面临身份一致性难题。为此,阿里团队提出Identity - GRPO算法。其亮点包括构建含约15000个标注样本的大规模偏好数据集;基于Qwen2.5VL设计专用奖励模型;在GRPO基础上,通过初始噪声差异化、更大批次视频采样和提示词细化改进训练。实验显示,该算法在多个模型上提升身份一致性奖励值,相比基准方法,在身份一致性指标上最高提升18.9%,奖励模型准确率达0.890,优于传统方法。此研究还提供了高质量数据集,为相关领域提供新思路。

最新创新思路,Graph+AI Agents!!
文章围绕Graph+AI Agents创新思路展开。AI Agent在规划等核心功能处理复杂关系遇瓶颈,Graph凭借关联分析能力结合其自主决策特性,可支撑复杂关系推理与动态决策,但该方向在多模态扩展等三方面有研究空白。为助把握研究方向,文中精选18篇相关论文,如提出基于图神经网络和深度强化学习的任务分配方法,实现高效任务分配;基于图的RAG方法用于私有文本语料库问答;MemGraph方法增强大模型专利匹配能力;A - MEM新型动态记忆系统提升LLM代理性能。

两招为GraphRAG图谱“提纯”,DEG-RAG效果有点炸~
文章围绕Graph - based RAG图谱提纯展开。传统RAG忽略文档块间关系,Graph - based RAG虽用LLM抽取知识图谱检索,但图谱噪音大,冗余节点和边影响性能。作者提出Deg - Rag方案,分两步走:一是实体消歧,将传统KG清洗流程用于LLM场景,发现类型感知Blocking、传统ComplEx嵌入及直接合并节点效果好;二是关系反思,用LLM - as - Judge给三元组打分过滤低可信度边。实验表明,在4个UltraDomain数据集和4类Graph - based RAG上,去噪后图谱平均砍掉约40%实体、30 - 60%关系,QA胜率超50%,最高达70% + ,极端情况实体削减70%仍不掉点,证实‘Less is More’在Graph - based RAG里成立。

北大深研院上线「AI4S LAB」:构建「AI驱动、干湿闭环」的全球首个一站式数智化生命科学研究平台
北大深研院上线全球首个一站式数智化生命科学研究平台 AI4S LAB。其核心目标是整合「算力—模型—数据—实验」要素,构建「AI 驱动、干湿闭环、全链数智」的云端科研生态。运行核心是自主研发的 BIOMA 多智能体系统,四位智能体分工构成科研链路。平台有全栈数智化支撑生态,具备用户友好设计,如便捷订单创建、丰富模板等。还推出「零代码智能体搭建」模块,降低 AI 原生应用开发门槛。10 月 14 日体验版 2.0 已上线,邀全球科研者体验。

1024 预告|TRAE Builders' Festival
文章是TRAE Builders' Festival的1024预告,提及TRAE.ai,活动时间为2025年10月23日20:39,相关内容修改于2025年10月24日。

快速上手|从版本选择到项目实战
作者分享使用TRAE.ai的体验。先对比国内版和国际版,国内版支持DoubBao等模型且免费,响应快、中文理解有优势;国际版支持Claude等模型,网络不佳时有延迟。实战中,作者想开发TODO - list应用,TRAE主界面示例与之巧合,用其生成基础版本,虽功能全但界面朴素。经多轮优化,最终版本效果好。代码结构合理、风格规范。作者认为AI编程工具是辅助提效,适合快速原型开发等场景,还总结与AI协作技巧,如需求具体、分步骤进行等。

最年轻获奖者!12 岁县城少年用 TRAE 搭建「智能商城」平台
本文讲述12岁湖南岳阳平江少年游小鹏成为TRAE SOLO Hackathon深圳场最年轻获奖者的故事。他三年级对编程产生兴趣,母亲为其找资源,今年3月跟文韬老师系统学AI编程成“技术总监”。8月他带“智能商城”项目参赛,该平台为创作者解决交易难题。他的项目产品思维成熟,考虑用户体验和支付问题。他借助TRAE,从想法到产品加速,还开发体感跑酷游戏。他用AI学习多知识,其学习方式是“干中学”。TRAE降低编程门槛,实现教育平权,游小鹏未来想成程序员或老板。

Unity 中国携手腾讯广告,让中小开发者告别“碰运气”
2025年10月23日,Unity在上海举办开发者大会,其中国发行业务迎一周年,成绩亮眼。会上与腾讯广告联合发布“青云”计划,为成长型开发者提供全链路支持。立项研发时匹配需求降险增效;买量增长降低试错成本;商业化调试打通流量盈利循环;多生态共赢助力开发者升级。Unity中国还构建技术工具链,解决开发者技术、商务难题,降低买量成本。过去一年与多款游戏合作,调优适配取得成果,还推出“千帆计划”扶持中小开发者,未来将推动更多AI能力落地。

Unite 十年,我们帮助开发者把创意变成现实
2025年程序员节日,Unite Shanghai 2025圆满收官。十年来,Unite与中国开发者同行,见证Unity成长及中国游戏产业蜕变。如今团结引擎下载量破50万,构建数字创作生态。未来,团结引擎将继续助力开发者。大会上,Unity中国CEO做出三大承诺。还发布团结引擎1.7.3版本,有技术突破并推出AI智能创作平台。汽车生态专场展示智能座舱成果,与车企合作并签约。游戏方面,展示全链路成果,腾讯与Unity中国合作推出‘青云计划’,构建游戏生态。最后,Unity中国将携手本土伙伴开启共创实时3D内容新征程。

Unite Shanghai 2025 现场发布!团结引擎三大战略重磅升级,渲染效能极致提升
2025年10月23日,Unite Shanghai 2025开幕,Unity中国发布团结引擎1.7.3版本。该版本在三大战略方向升级,推出全局动态实时光照解决方案TuanjieGI,突破预烘焙限制,呈现端游级光影。其动画系统提升调试效率,特效渲染管线强化。跨端部署能力升级,有虚拟几何体、TJSR超分辨率技术等,支持多平台。还推出AI Graph,与腾讯混元合作,提升生产效率、降低成本。上线近一年,团结引擎下载量突破50万,Unity中国推出资源商店,构建开发者生态,助力中国游戏产业发展。

团结 AI 全新升级|AI Graph & AI Assistant:为开发者提供一站式 AIGC 解决方案和疑难解答
2025年10月23日团结AI全新升级。推出团结AI Graph,是图形化、节点式AI工作流系统,与第三方大模型合作,集成其能力。有引擎内多入口导入、模版化工作流、节点可视化编辑等特性,支持腾讯混元等大模型。团结AI Graph以包形式发布,通过Package Manager安装。同时,原Muse Chat AI模块升级为团结AI Assistant,优化界面、新增功能、更新后端模型,支持自定义Agent工具。未来团结AI Assistant将支持多智能体,围绕深度融合引擎生态、智能化任务理解与规划、开放与生态建设三个方向优化。

详解ROMA中复杂图表的渲染实现
文章围绕ROMA中复杂图表渲染实现展开。ROMA负责京东金融APP关键位置复杂图表渲染,近期APP频繁重启时首页图表偶现渲染失败。经分析,京东金融App图表使用场景多、特点突出,引入Apache ECharts库。重构分析包括原理、缓存设计和渲染流程,原理上打通三端数据通讯;缓存设计用可重复利用且自动扩容的WebView缓存容器,加入失败重试逻辑;渲染流程涵盖多场景处理。效果验证显示渲染流畅,重构后提升了渲染速度和成功率,还能自动恢复异常数据渲染。

大模型时代的广告营销变革与实践
文章围绕大模型时代广告营销变革与实践展开。指出通用大模型需向垂类转型,京东广告推出自主研发的广告营销商业化场景大模型。介绍广告投放智能体,一句话驱动操作,解放广告主。召排一体的GRAM模型实现端到端需求推理,精准匹配用户与商品。广告创意优化通过CTR建模平衡美观与商业价值。还提到广告算力协同优化,实现超低延迟推理,基于ARM国产芯片优化实现算力自主可控。旨在让大模型服务广告营销价值,让广告主省心、消费者开心。

代码筑梦,优雅永存 | B站2025程序员节高能回顾:一场献给技术人的硬核浪漫
2025年10月24日,B站以《Hello,World!:邂逅新次元》为主题的1024程序员节活动圆满落幕。活动包括技术分享大会,展示了IndexTTS让机器合成声音有情感温度、AniSora提升动画生成效果;年度技术颁奖典礼,表彰了开源、发文、讲师、专利等方面的优秀团队和个人;抽奖环节福利丰厚;技术游园会设有策略攻防、核心蹦迪、元气充电三个区域,让程序员放松身心。此次活动是对技术人的致敬,激励他们继续前行。

一次AI驱动的淘宝客户端需求开发实战
本文介绍AI Coding在淘宝客户端研发落地的方法论。先发起实践活动收集问题,发现多因AI对项目了解不足或任务描述不当。以穿搭动态框架需求为例,阐述AI Coding实践,包括多信息流服务、多Tab容器组件、数据绑定协议等开发,AI Coding加人工检查用时1人日,较原排期效率提升300%。还探讨相关问题,如确定需求接入阶段、拆分需求、写Prompt、构建知识库,介绍业务开发范式,适用于新功能开发,可提升效率、降低双端不一致问题。

转转商品中心微前端升级之路
转转商品管理中心因 iframe 方案难以实现部分功能,决定升级为微前端架构。技术选型时,团队先考虑同属 umi 框架的 qiankun,但接入后遇到诸多问题,如样式隔离难、sentry 实例销毁问题、多实例场景异常等,最终选用 micro - app。使用 micro - app 改造时,需完成前期配置,实现动态路由与 MyMiCroApp 组件,选择合适的 router - mode,改造子应用跳转,支持泛域名。后续还可进行预加载、使用 umd 模式、将经验复制到其他系统等优化。

ChatGPT AI 浏览器 Atlas
2025年10月22日OpenAI发布首款AI浏览器ChatGPT Atlas,对标Google Chrome。Atlas名字有象征意义,体现OpenAI野心。它基于Chromium内核,具备Chrome的功能,还有诸多独特优势。核心差异在于Chrome是“有AI功能的浏览器”,Atlas是“围绕AI构建的浏览器”。其功能包括对话式搜索、ChatGPT深度集成、内置网页编辑器、浏览器长期记忆、Agent模式。随着Atlas发布,浏览器市场迎来挑战者,2025年将成“AI浏览器元年”。

让 Sora2 AI视频更真实的10 条建议
Sora2推出后流行,但生成视频有时仍有“假感”,因AI生成内容与真实视频包含物理规律、摄影语言和人的意图有别。文章给出10条让Sora2 AI视频更真实的建议,包括统一光影逻辑、加入手持镜头痕迹、设置景深与对焦、添加光学瑕疵、增加微动作、体现材质真实感、营造环境动力、遵循摄影机逻辑、设计微剧情和保留瑕疵,强调追求不完美的逻辑性,关注细节让AI视频有温度。

Seed3D 1.0 发布,一张图生成高精度 3D 模型,纹理生成能力 SOTA
2025年10月23日,字节跳动Seed团队推出3D生成大模型Seed3D 1.0,可从单张图像端到端生成高质量仿真级3D模型。它基于创新架构,经大规模数据训练,构建三阶段数据处理管线。在几何、纹理、PBR材质生成模块有创新设计。测评显示,其参数少但几何生成效果优,纹理材质生成保持性领先。该模型能集成至仿真环境供机器人训练,还可拓展生成完整3D场景。不过,搭建世界模型仍面临挑战,未来团队将引入MLLM提升性能并推动其大规模应用。

ByteKMP Compose ArkUI 原生渲染解决方案
本文介绍ByteKMP Compose ArkUI原生渲染解决方案。原基于Skia的渲染链路有Graph内存增量、易触发OOM、包增量大等问题。团队自25Q1起适配ArkUI的Native Drawing,近期完成。介绍整体架构,包括Compose、Harko、OHRender职责。阐述项目结构变化,涉及Compose和基础库。详述渲染流程,含内容绑定、帧回调、绘制过程及对应时序图。脏区管理方面,Compose原用PictureRecorder,因Native Drawing不支持嵌套调用,改为嵌套RenderNode,会带来额外耗时和内存增量。切换后解决Skia痛点,但存在ArkTS堆内存和FPS劣化问题,预计系统升级补齐CAPI后解决。

火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight
近日,火山引擎多媒体实验室和北京大学合作的论文 Q - Insight 入选 NeurIPS 2025 Spotlight。以往画质理解方法存在不足,评分型缺乏解释性,描述型依赖标注数据。研究人员提出 Q - Insight,运用“群组相对策略优化”(GRPO)算法,挖掘模型推理潜力,多任务联合训练提高各任务表现。实验表明其在图像质量评分、退化检测和零样本推理任务表现卓越。在此基础上拓展出 VQ - Insight 用于视频评估。未来将深度耦合强化学习与多模态推理,让 Q - Insight 和 VQ - Insight 应用于更多任务。

1024程序员节日特辑|从Hello World到守护亿万热爱
这是一篇1024程序员节特辑文章。世界与程序员的对话始于“Hello, World!”,在节日里,得物邀请四位不同司龄、岗位的技术伙伴分享经历。鹏博被计算机“高端感”吸引,从事iOS开发,让成果被用户直接使用;守仁参与搭建交易主航道,从通用到垂直领域深耕;十玥辗转专业后锁定编程,负责社区搜索算法,认为编程是艺术;南极熊从装饰QQ空间开始,做出业内首创AR贺卡。最后文章鼓励大家分享“第一行代码”故事并设置抽奖。

从一次启动失败深入剖析:Spring循环依赖的真相|得物技术
文章围绕Spring循环依赖展开。先介绍背景,预发环境后台服务启动失败,错误源于循环依赖遇上AOP代理。接着讲解相关知识,循环依赖分多种情况,Spring用三级缓存和提前曝光机制解决,但无法解决构造器注入和prototype field属性注入的循环依赖。然后进行案例分析,通过代码和问题分析,发现启动失败是因循环依赖、bean多次获取、代理增强及加载顺序等因素触发异常,还对比了启动成功和失败的情况。最后给出解决方案,短期可移除注解或用@lazy解耦,长期要遵循DDD规范并梳理依赖环,强调应从源头规避循环依赖。

可灵团队论文ReCamMaster入选ICCV 2025 Best Paper Finalist
可灵团队提出的视频生成模型ReCamMaster发表于ICCV 2025并入选Best Paper Finalist。用户可上传视频指定新相机轨迹实现重运镜,该工作还开源了MultiCamVideo - Dataset及代码。ReCamMaster有视频重运镜、4D场景重建等能力,生成视频能保持场景和动态且泛化性好。其核心创新点包括体现视频生成模型在空间智能等方向潜力、无需显式3D建模、验证in - context conditioning范式有效性。该任务挑战在于注入条件信号和获取高质量数据,通过输入2D视频帧和引入in - context conditioning范式解决。实验显示其性能优于基线方法,推动了空间智能和世界模型发展。

快手 KAT-Coder 系列模型家族正式亮相,Air版永久免费!
2025年10月23日18:00,快手KAT - Coder系列模型家族亮相,Air版永久免费。此前KAT - Coder和KAT - Dev已受关注,现KAT - Coder - Pro V1与KAT - Coder - Air V1上线StreamLake。对KAT - Coder - Pro V1多项测试显示其性能强,在网页版操作系统、水果忍者游戏生成、Kilo Code评测中表现出色,性价比高。KAT - Coder系列有三款模型,Pro版适合复杂场景,性价比高;Air版轻量普惠;Exp - 72B用于前沿探索。为推广,Pro版新用户赠2000万Tokens,Air版API永久免费。此外,快手StreamLake推出AI编程产品矩阵,进军AI Coding领域。

国产OCR双雄对决?PaddleOCR-VL与DeepSeek-OCR全面解析
2024 年下半年 OCR 领域爆发,PaddleOCR - VL 与 DeepSeek - OCR 引领国产 OCR 走向成熟。OCR 因 RAG 应用、产业流程自动化和大模型能力进化而重要。PaddleOCR - VL 是 0.9B 超轻量全能文档解析器,结合 NaViT 视觉编码器与 ERNIE - 4.5 - 0.3B 语言模型,有紧凑强大、全能解析、多语言覆盖等优势,安装调用简单,性能达 SOTA。对比 DeepSeek - OCR,PaddleOCR - VL 更轻量、架构清晰、功能全面、语言覆盖广、生态完善、调用方式多样。实际评测中,PaddleOCR - VL 在复杂场景表现更优。PaddleOCR - VL 适合企业级应用,DeepSeek - OCR 适合二次开发和学术研究。

从编译爆炸到编译防火墙:狐友 iOS 架构升级中的轻量化治理实践
随着狐友App业务发展,iOS工程增量编译慢问题凸显,平均耗时120秒,制约开发效率。为此提出轻量化治理方案,用Swift Package Manager(SPM)替代CocoaPods,自研接口 - 实现 - 服务三层隔离架构。SPM在依赖解析、模块隔离、编译缓存等方面优势明显;三层架构阻止编译影响传递。经测试,三层接口隔离架构使增量编译耗时减少约600毫秒,优化幅度达35%。方案落地后,增量编译时间均值降至50秒,每日节省3.1小时,9个月回收投入成本,为大型移动应用编译优化提供借鉴。

原力灵机开源Dexbotic:一个代码库,加速具身智能VLA研究!
全球研究聚焦具身智能,关键在于视觉 - 语言 - 动作模型(VLA),但面临环境配置碎片化、模型更新不便、数据格式难统一三大工程化难题。Dexmal 原力灵机推出开源的 Dexbotic 代码库解决这些问题。它有三大核心创新:采用「实验为中心」开发框架,含数据、模型、实验三层架构,内置诊断工具;打造积木式架构与统一数据格式,解耦 VLA 策略,定义 Dexdata 格式;有自有的高性能基础模型 DexboticVLM,实战性能提升显著。此外还推出开源硬件 DOS - W1。Dexbotic 能让研究者专注创新,其联合推出的评测平台可检验 VLA 算法能力。

vivo HDFS EC 大规模落地实践
本文介绍vivo HDFS EC大规模落地实践。EC是一种纠删码,在Hadoop3.0引入,可节约存储但降低读取性能,适合冷数据。vivo HDFS集群规模大,推进EC编码降本。文中阐述EC码原理,如RS码编码与恢复过程;说明存储布局改变,对比三副本与EC策略优缺点。应用实践方面,服务端先搭冷备集群,后全面升级;客户端推动用户升级。采用异步转换,让用户自主决定。distcp校验改COMPOSITE CRC。解决文件损坏问题,打补丁、校验补块、定制工具扫描、改造客户端修复。还利用机器异构和存储策略降成本。目前EC存储收益大,但仍需解决读取性能等问题。

让AI成为你的编程助手:如何高效使用Cursor
文章围绕如何高效使用Cursor展开。随着AI技术普及,Cursor是公司团队常用的编程辅助工具,但使用效果不稳定。要高效使用它,首先要学会与之高效沟通,编写高质量提示词,遵循具体、简洁、结构清晰等原则,还可通过上下文引导和多轮对话提升输出质量。其次,制定Cursor Rules解决AI大模型无记忆和上下文长度限制问题,规则分User、Project、Memories三种类型,配置时要遵循最小化、结构化、精准引用和一致性原则。最后总结指出沟通质量决定输出,用好Rules形成长期记忆,且AI辅助编程需迭代优化,建议从小模块尝试、建立规则库并人工审核代码。

Ant Design 6.0 开发中的一些 CSS 琐事
Ant Design 6.0 将在 SEE Conf 2025 发布,开发中因无需考虑 IE 兼容,部分组件用 CSS 变量改造,获更小 CSS 体积与更好性能。文章介绍相关 CSS 琐事:变体方面,v5 组件变体与颜色组合有重复样式,转 CSS 变量后可通过控制色板量产样式;样式覆盖上,用 CSS 变量覆盖更简单;条件兼容时,因组件 token 异步生成,用 @container 实现 CSS 条件判断,不过 Firefox 未支持,仅作兼容兜底;@scope 可解决 CSS 命名空间嵌套问题,但 Firefox 不支持,或在下个大版本应用。

SEE Conf 2025:开启体验科技的新十年
文章围绕SEE Conf 2025展开。回顾往届大会观点,如2019年强调产品体验助力业务增长等。提到2025年前端行业变化,不少工程师投身AI相关领域。介绍多位嘉宾从不同方向转变,将在大会分享。大会以「探索AI时代的用户体验与工程实践」为主题,11月22日在杭州举办,设主会场、乐队演出、5大专场及技术展台,早鸟票10月24日截止,还介绍了各专场聚焦内容。

支付宝 MYKMP 原生跨平台解决方案
本文介绍支付宝 MYKMP 原生跨平台解决方案。MYKMP 基于社区 KMP 与 CMP 研发,实现三端一码,减少代码编写和维护成本。研发原因是鸿蒙诞生后三端业务迭代和一致性挑战,Kotlin 是合适选择。对 CMP 和 KMP 做了多项差异化优化。构建了复杂应用的工程结构和接入层,多个 APP 已有 KMP 业务上线。详细阐述鸿蒙版本架构,包括选型、框架设计、渲染上屏、跨语言交互、产物集成和 GC 性能优化。目前应用范围扩大,研发成本降低,未来将分享更多专题。

这样几招,让 X6 性能从垫底到 TOP
本文聚焦 AntV X6 2.x 版本性能优化。针对批量拖拽节点和多节点渲染性能瓶颈,从三方面着手:一是批量拖拽节点优化,分析出频繁 DOM 重建、缺乏更新频率控制、重复边界框计算等问题,采用事件帧合并、构建拖拽缓存、GPU 加速、选择框更新节流等方案,优化后与 React Flow、JointJS 对比,X6 批量拖拽性能显著提升;二是多节点渲染优化,指出原虚拟渲染策略缺陷,提出仅渲染可视区域元素、增加缓冲边距的方案,对比显示优化后 X6 接近 React Flow 水平;最后表明 X6 经优化能提供更流畅高效体验,性能达领先水平,优化可在 X6@2.19.0 - beta.1 体验。

1024,AI Coding 点燃技术热情
2025年10月24日1024程序员节,火山引擎开发者社区在QCon上海站举办“火山引擎AI Coding技术实践”技术专场。展位互动方面,能生成AI卡通照片的屏幕装置吸引开发者体验,其基于字节跳动自研图像生成模型;智能编程助手TRAE等几款AI Coding工具的demo也受关注。前沿探讨环节,围绕火山引擎AI Coding技术实践有多场分享,如《TRAE的思考:AI时代程序员的认知进化》探讨AI Coding演进趋势等,《火山引擎veCLI - 命令行超级智能体的最佳实践》介绍veCLI发展历程等,为大家带来技术盛宴与AI视觉体验。

打造可信 AI Agent:如何让智能体不跑偏、不越界,安全又靠谱
文章围绕构建可信AI Agent展开。先指出AI Agent存在意图误解、约束失守问题,如电商助手超预算、代码工具违规操作等,揭示构建可信AI Agent的系统性挑战。根因是意图误解与约束失守贯穿全生命周期,涉及输入、推理、行动三阶段。提出双重建模视角,包括基于自动驾驶范式的全生命周期纵向建模和基于零信任理念的t时刻横向验证建模。介绍AgentArmor创新方案,有目标对齐和安全保障机制。通过行为劫持识别、约束违背发现案例展示其实践成效,其具实时、精确、可解释、兼容等优势。最后强调可信AI Agent愿景、路径,是长期工程,团队愿与开发者共建安全生态。

百度地图小度想想上线26款岚图梦想家鲲鹏版
2025年10月21日19:57,百度地图小度想想上线26款岚图梦想家鲲鹏版。

这个需求很简单,你看一下
2025年10月24日1024程序员节,美团发文祝程序员节日快乐。文中介绍美团技术团队今年多款机器人落地和AI大模型开源成果,包括VitaBench、LongCat等一大波模型。还列举各模型发布开源时间及对应主页、GitHub、Hugging Face等地址。最后邀请码农评论证明身份,截至10月27日15:00抽取点赞TOP10送露营周边礼包。

与AI共生还是被取代?别让系统“纸面容灾”!架构师技术沙龙在京沪湘皖四城同时探讨破局之路
2025年10月24日消息,腾讯云架构师技术同盟本周末(10月25 - 26日)将在北京、上海、长沙、合肥发起4场线下深度交流活动。北京站探讨架构师如何与AI共生,涵盖AI赋能管理、放大个人价值及产品落地等内容,还有开放辩论环节;上海站聚焦容灾保障最佳实践,有案例复盘、经验分享及AI + SRE前沿探索;长沙站谈AI时代架构师修炼之道,在露营地边玩边交流;合肥站分享架构师数字游牧经验与远程协作心得,还可参与同盟共创讨论。

刚刚,全国程序员群体普查结果正式发布!
2025年10月24日全国程序员群体普查结果发布,腾讯云开发者采访不同阶段程序员。IEG刘德恩、CSIG董汉德等多位程序员分享入行经历、工作技术栈、应对危机办法、推荐AI工具等。如刘德恩工作9年,擅长Go和Rust,关注AI方向;董汉德工作3年多,做代码大模型训练。他们也给出程序员“墓志铭”想法,如“数字世界的创造者,人类社会的造福者”等。最后文章鼓励读者留言分享1024所思所想,有抽奖活动。

DeepSeek鬼才创举,OCR是啥?腾讯是怎么做的?
文章从DeepSeek发布3B规模视觉压缩OCR模型入手介绍OCR。先总结该模型信息,包括架构含DeepEncoder和DeepSeek3B - MoE,有视觉 - 文本压缩能力等,其在行业有长文档处理、提供训练数据等价值。接着讲腾讯OCR技术演进,从多阶段定制到端到端再到多模态大模型。还提到领域进展,指GPT类模型用于OCR有精度低等问题。技术要点涉及优图演进路线、内容感知视觉过滤、文档场景细粒度感知。最后推出文档智能OCR新能力,具备多模态融合等优势,实测在不同场景表现良好。

架构师的周末充电指南,北京/上海/长沙3场不容错过的线下深度交流
本周末(10月25日 - 26日),腾讯云架构师技术同盟将在北京、上海、长沙发起3场线下深度交流活动。北京站聚焦架构师与AI共生,涵盖AI赋能管理、放大个人价值及产品落地等内容,还有开放辩论环节;上海站围绕容灾保障最佳实践,有真实案例复盘、避免‘纸上预案’经验分享及AI + SRE前沿探索,采用‘世界咖啡汇谈’深入交流;长沙站关注AI时代架构师修炼之道,在露营地边烧烤边交流,可吐槽‘技术内卷’、探讨新技术。活动欢迎架构师伙伴报名参与。

腾讯新闻PUSH架构升级之路
本文围绕腾讯新闻PUSH架构升级展开。先介绍PUSH平台,分触发和下发两部分,业务要求保证精品资讯触达及时性和推送用户体验。老架构存在模块链路过长、依赖服务有瓶颈、链路稳定性差等问题。为此采取优化方案,如自建消息通道、统一技术栈、整合链路、自建号码包服务、离线预处理、批量聚合IO操作、构建优先级、增加故障恢复能力和自动化测试能力。升级后效果显著,运营成本降70%,链路吞吐量升3.5倍,热点突发PUSH耗时降90%,点击效果提升,稳定性良好。

糟了...敲上头了
文章简单表述‘敲上头了’,还提到‘捶得够快,就有惊喜’,未提供更多详细信息。

前端真的比后端简单吗?
文章围绕‘前端真的比后端简单吗’展开讨论。多位鹅厂同事分享观点,grey指出优秀前端需有可观技术广度,涵盖多领域知识;chuan提到过去前端轻、后端复杂,如今现代浏览器发展使前端变重,排版问题复杂度不逊后端;polly认为AI复杂与否和前后端无关,取决于业务场景;var表示前端上手易进阶难;arnu表示对前端望而生畏;nico称后端认为前端简单是偏见,现代前端已高度工程化;kid则觉得是分工和接触程度造成认知差异。

当AI遇见青春期:AI的青少年“性教育”大考,它及格了吗?
本文是腾讯研究院《当AI遇到青春期:AI与青少年性教育测评研究》报告,探讨AI用于青少年性教育的情况。研究团队设计“AI适儿化大考”,构建五层金字塔评估模型,从安全可靠、理解与成长等五层面十个维度评估主流大模型。测评发现大模型整体对青少年性教育支持不错,但高阶要求表现不足。在不同领域,大模型表现有差异,如国内模型在青少年基础性教育和月经应急处理上有优势,国外模型在月经生理健康和残障儿童两性社交、身体认知方面较好。不过,大模型在身体认知、卫生用品、残障群体特殊需求等方面存在不足。未来AI应走向个性化支持、双向对话和社会共创,成为温暖的成长伙伴。

腾讯研究院AI速递 20251024
本文是腾讯研究院2025年10月24日的AI速递,涵盖多领域进展。谷歌上线含超3000门课程的AI学习平台Google Skills,打通招聘通道;Sora2公布升级线路图;快手发布AI编程产品矩阵。学术上,港科大贾佳亚团队开源DreamOmni2,字节推出3D生成大模型Seed3D 1.0。行业方面,Meta AI大规模裁员;科勒推带AI摄像头马桶。前沿科技里,谷歌量子计算有突破。报告观点提到Kimi K2智能体准确率超GPT - 5 50%,a16z认为视频模型将专业化发展。

复旦大学肖仰华:AI的尽头是人文
复旦大学肖仰华认为AI发展尽头是人文。AI带来升智与降智,降智表现为滥用依赖致心智倒退,升智能提升生产力。能力外包有‘反噬’风险,应是专家才可外包。社会要安置闲置劳动力,重视AI自由后的伦理人文问题。短期AI难具高阶心智,人类意识生成需身体、群体和进化环境。人文学科对AI至关重要,应发展新文科。教育要培养智慧、高阶认知等能力。应对AI时代,要识别人机边界,以人文为锚,开辟未知疆域,注重教育成长,处理好委托代理关系。

腾讯研究院AI速递 20251023
这是腾讯研究院2025年10月23日的AI速递。涵盖多方面进展,生成式AI领域,OpenAI推ChatGPT Atlas浏览器,Claude发布桌面版,谷歌AI Studio更新,腾讯混元世界模型1.1开源,百川智能发布医疗大模型Baichuan - M2 Plus,华为发布HarmonyOS 6。前沿科技方面,Dexmal开源代码库,松延动力推消费级人形机器人,三星发布XR头显。报告观点中,前Manus研究员复盘AI开发,强调Agent认知流程重要性。

硅谷996背后是AI的锅吗?丨硅谷AI转型录NO.2
《硅谷AI转型录NO.2》聚焦硅谷创业公司996现象。美国法律下,多数专业人士属豁免员工,996合法。公司文化与创始人心态相关,如今AI竞争“拼速度”,更多创始人公开提倡996。AI带来效率革命,也让创始人焦虑,因不知如何落地且需亲力亲为重构业务流程,老板发现“最大的瓶颈竟是自己”。为应对焦虑,企业探索创新孵化路径,如“周末项目”。AI重塑创业,“一人公司”模式浮现。对于人才,企业看重有自驱力、协作性和持续学习能力的人,招聘更重过往经历和能动性。中层管理者应回归商业本质、主动求变、保持良好心态。

腾讯研究院AI速递 20251022
这是腾讯研究院2025年10月22日的AI速递,涵盖多项前沿进展。包括Anthropic上线网页版Claude Code及生命科学版;清华、智谱推出Glyph框架;马斯克宣布X平台将用Grok取代推荐算法;Adobe推AI Foundry助企业建模型;搜狗输入法和腾讯视频推出混元AI分身;麦肯锡成OpenAI Tokens消耗大客户;DeepSeek开源OCR模型;OpenAI前研究员提出2025年AI进展关键思路。

CodeFuse开源SWE-CARE:一种关注全面性的代码审核评估基准
自动化代码审核发展受制于“现实鸿沟”,现有基准测试无法反映现实代码审核特性。为此推出SWE-CARE,它是首个仓库级代码审核评估综合性基准,含70个Python项目601个高质量实例,提供多维度丰富上下文。还提出创新评估框架,结合规则与模型评估。研究对前沿LLM大规模评估,发现无单一LLM占绝对优势,Gemini 2.5 Pro综合性能最高,不同LLM对冗余上下文鲁棒性有差异,为开发实用CR助手提供洞见。本次开源基准数据集及构建代码,支持不同CR工具评测。

隐语·数据要素流通技术MOOC第三期重磅上线!产学研多方联合一站式打造“技能全景图”
我国将数据要素发展提升至国家战略高度,对数据流通关键技术人才需求迫切。隐语自2022年开源隐私保护计算核心技术,后构建融合技术生态。此前已推出两期隐私保护计算技术线上MOOC,反响热烈。2025年,在CCF指导下,联合40多位权威专家打造‘数据要素流通技术MOOC第三期’。课程特邀多领域顶尖机构专家,分政策与合规等八大模块、48个课时。学员能系统掌握技术与政策,精准识别痛点,设计流通方案,把握市场机遇。课程为在线形式,有专属学习社群。扫码加‘隐语小助手’可入学习群获取资源。

Dragonfly 论文入选 IEEE TON:AI 领域海量镜像与大模型分发的解决方案
随着AIGC等技术发展,海量镜像与大模型分发成AI领域关键挑战。蚂蚁集团与大连理工大学合作设计动态、高效、可扩展的大规模镜像与模型文件分发系统,相关论文被IEEE TON录用。该论文构建高效可扩展的P2P模型分发系统,是对CNCF孵化项目Dragonfly的增强,解决传统P2P文件分发系统在AI大模型分发时的问题。方案引入轻量级网络测量机制、可扩展调度框架、Trainer模块异步模型训练与推理方法。性能评估显示,系统总加载完成时间至少缩减10%,节点平均带宽利用率提升约20%,降低资源开销,满足高并发、低延迟需求。

混合渲染场景下的 “no surface” 崩溃分析
本文围绕混合渲染场景下的“no surface”崩溃问题展开。在支付宝Android端小程序同层渲染中,因画布同步异常出现闪退,典型Abort Message为“drawRenderNode called on a context with no surface!”。经分析,“no surface”本质是EGLSurface创建失败,直接原因是其底层ANativeWindow对应的消费者(SurfaceTexture)已被销毁,根源是跨进程同步问题。在极端情况下,App进程未及时处理销毁事件,而GPU进程提前完成纹理销毁,导致绘制时触发错误。通过确保跨进程纹理生命周期同步,问题得到显著改善,日均“no surface”类issue数量下降20,000次,端稳定性提升。

活动资讯|2025全国高校消保宣教AI创意大赛-赛事回顾
2025全国高校消保宣教AI创意大赛由蚂蚁集团等牵头,多所高校参与。5月9日在清华青岛艺术与科学创新研究院启幕,以“AI赋能消保,创意引领未来”为主题。赛事消保宣教走进多所高校,课程触达15所高校700多名学生。9月16日在清华大学美术学院结赛颁奖,超176个高校团队报名,23件作品入围展示。闭幕式有专题演讲。大赛还公布了包括特等奖《百变骗君》在内的多个奖项作品。主办方未来将推动获奖作品传播,助力构建安全金融环境。

大规模 Kafka 消费集群调度方案
货拉拉增长中台部为保障资金安全构建实时对账平台“算盘”,以 Kafka 为消息中间件。随着业务扩张,初期消费调度方案无法支撑数据规模,出现消息积压等问题。团队设计动态可扩展的 Kafka 消费集群调度方案,解决原有系统资源利用率低、负载不均和扩展性差等问题。新方案细化管理单元至 Partition,支持多集群消费、加权负载均衡和自动化扩缩容。实施效果显示,系统计算、消息接入和消费吞吐能力强,能动态管理集群,保障对账任务实时性和 SLA。

LLM在转转主搜向量召回的应用
文章围绕LLM在转转主搜向量召回的应用展开。多品类发展使N品类搜索增多,但ES文本硬匹配技术导致少无结果query。为此,采用‘中小型领域模型+极小任务模型’路线,注入转转私域交易数据,实现超越字面的语义理解。设计‘离线训练 - 在线推理’双阶段架构,离线用大模型打磨能力再迁移到轻量级模型,在线实时生成query语义向量召回商品。还通过知识注入让模型懂‘转转黑话’,领域任务微调解决术语混淆问题,知识蒸馏将大模型能力迁移到小模型。项目提升了主搜对用户意图的理解,验证了方法论的正确性。

浅谈上下文工程|从 Claude Code 、Manus 和 Kiro 看提示工程到上下文工程的转变
文章围绕上下文工程展开,先介绍其概念,它是构建动态系统为大语言模型提供信息和工具,由指令、用户提示词等七部分组成,与提示工程有区别。上下文工程能降低AI失败率、保证一致性等。接着介绍业界实践,如LangChain、Claude Code、Manus各有特色,同时指出长上下文存在Context - Rot问题及解决办法。Claude Code有三层记忆架构等实践,Manus在KV缓存等方面有优化。还提到从提示词到规范驱动的转变及Kiro的实现方式。最后展望未来,认为环境工程是终极目标,AI将从被动接受上下文走向主动感知和塑造环境。

《AI大模型时代老板必修课》
阿里云蒋林泉与钛媒体刘湘明在云栖大会围绕《AI大模型时代老板必修课》展开对谈。涉及CIO角色进化,从‘Information’到‘Intelligence’,能力、协同范围和管理老板预期等方面挑战增大;界定AI业务价值需了解业务与技术边界,从‘语言’和重复场景切入;制定AI战略要定义正确问题,用真实做事方式度量;分享官网加Chatbot实践,指出AI落地供给端和使用端有门槛;落地最大阻力是认知问题;选择模型需有度量能力;促成业务和技术对齐要科普和全员认证;建议企业全面启动AI战略,躬身入局,统一认知,选好核心场景并行动。

AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
文章围绕AI Agent任务规划该由人主导还是AI自主展开探讨,以阿里云RDS AI助手实践为例。实测发现大模型自主拆任务效果不佳,存在幻觉问题。企业部署AI Agent更看重可靠性,人工规划能满足企业对稳定、重复流程AI化的需求,可通过提示词工程让AI按预设步骤执行,且用案例库代替规则库可避免规则爆炸。采用多Agent混合架构,泛化场景以大模型自主规划为主、人类规则兜底,垂直场景以人工SOP驱动为主、大模型执行推理,还通过关键词匹配和大模型意图识别进行规则切换。最后指出AI Agent规划应基于场景权衡,人类是最终决策者,人与AI应各司其职。

从0到1:天猫AI测试用例生成的实践与突破
文章介绍天猫技术团队在AI赋能测试领域的实践。背景上,业界多基于prompt+RAG拓展能力,未微调模型。天猫电商业务迭代快、产品质量要求高,测试团队面临版本节奏快、传统模式有瓶颈、用例编写有痛点、业务特性差异大等挑战。实施策略为“需求规范化 + Prompt工程 + 知识库RAG + 平台化集成”,辅以Agent能力建设。应用效果方面,C端采纳率较好,B端一般,部分领域提效明显。目前实践存在PRD质量不高、需求解析有局限等问题,后续计划深入AI能力,实现全流程自动化,让QA聚焦更具挑战性工作。

当篮球拥抱AI:NBA中国X阿里云的超级符号与设计创造力
2025年10月9日,NBA中国与阿里云达成合作,阿里云成其官方云计算与人工智能合作伙伴。阿里云设计中心从多方面为合作注入“智能感”。构建了「篮球智能体」视觉体系,应用于全场景;创作AIGC概念片,展现AI赋能体育可能;推出“我的NBA AI手办”,重塑球迷体验;助力落地子弹时间系列新技术,攻克“实时渲染”难题。此次合作是“AI+体育”深度实践,开启智慧体育新时代。

阿里事儿丨夸克上线对话助手;天猫双11开卖首小时80个品牌成交破亿
本文介绍了阿里巴巴近期多项业务动态。2025 天猫双 11 开卖首小时 80 个品牌成交破亿,30516 个品牌成交翻倍;飞猪双 11 开卖 24 小时近 300 个商家成交额翻倍,出境游表现亮眼。10 月 23 日夸克上线对话助手,采用 Qwen 最新闭源模型。IDC 报告显示阿里云在中国 AI 基础设施服务市场占比第一。地球观测组织等与阿里云共建全球高温韧性服务平台。阿里国际 Marco 获 WMT 机器翻译大赛六项冠军。淘宝闪购双 11 服务升级,盒马启动火锅季,菜鸟双 11 配送和寄件服务优化,阿里公益联合飞猪上架公益旅游线路。

Claude Code + Claude-4.5 快速安装使用指南
本文是Claude Code + Claude - 4.5快速安装使用指南。因Claude官方API易因中国IP等封账号,推荐用中间代理大模型服务中转。安装步骤:先装Node.js 22.x+ LTS版,再用npx zcf装ZCF;配置CCR分两种情况,未安装选1初始化,已安装选R配置。安装报错一般是api_key设置有误或科学上网问题。安装完成后,终端执行ccr code启动Claude Code,可交互、列工具等。还介绍了使用Agent和MCP的方法,以及在VSCode中使用Claude Code的技巧,修改settings.json即可。

How to Fix Any Bug
作者在开发小应用时遇到滚动问题,让Claude修复无果。文章分享修复bug流程:先需找到可靠重现步骤,像作者以点击按钮后滚动异常为重现方式,但Claude因无法感知需更换;接着缩小重现范围,用测量滚动位置替代观察抖动,不过要确认新重现能有积极结果;再逐步移除代码,确保每步都有bug存在,避免陷入无关问题;最后找到根本原因,作者发现是旧版React Router的ScrollRestoration在重新验证时触发导致滚动抖动。

Importing vs fetching JSON
文章对比了在 JavaScript 中导入(import)和获取(fetch)JSON 的差异。导入 JSON 今年在各浏览器引擎实现,但作者认为除小演示外,浏览器环境中使用受限。在错误处理方面,静态导入失败会使整个模块图崩溃,import() 可提供回退逻辑,而 fetch() 失败时能进行更多内省。缓存和垃圾回收上,导入模块会在环境生命周期内缓存,可能导致内存泄漏,fetch() 返回对象可在无引用时被回收。文章指出,本地静态 JSON 资源且需大部分数据时适合用 JSON 模块导入,服务器代码可导入 package.json 取版本号,但前端不建议,该功能使用要谨慎,不能完全替代 fetch()。

From Garage to Browser: Forged.build and the WebGPU Revolution
本文介绍了Forged.build如何借助WebGPU将工作室网站转变为可探索的数字世界。从车库概念出发,将汽车与科技融合,构建多个房间展示故事。在制作上,先以AI构思,用Blender建模并烘焙光照,再导入WebGPU引擎处理。采用“fake tracing”混合照明,结合烘焙光照与动态高光,让场景更真实。滚动操作被视为语言,各场景单轴移动,过渡如电影剪辑。还通过后处理和环境技巧增强氛围,性能调优兼顾不同设备。WebGPU带来性能提升,让网站体验更流畅,为后续项目奠定基础。

Vitest 4.0 is out!
文章宣布 Vitest 4.0 发布。此次更新有诸多改进,如浏览器模式稳定,移除 experimental 标签,需安装单独包定义提供者,@vitest/browser 包可从依赖移除;新增视觉回归测试,支持 toMatchScreenshot 断言和 toBeInViewport 匹配器;支持生成 Playwright Traces;定位器功能改进,frameLocator 可找 iframe 元素,定位器有 length 属性;调试功能增强,VSCode 扩展支持“Debug Test”按钮;还有类型感知钩子、新断言方法、报告更新、新 API 方法等。同时提醒有一些重大变更,建议查看迁移指南。

A Few Useful Web Development Bookmarklets
文章介绍了几个实用的网页开发书签脚本。作者在处理15年历史的代码库时创建了这些书签脚本,用于解决标准浏览器开发者工具不易完成的前端检查任务。包括在JavaScript和非JavaScript状态间切换、查找内联CSS、识别内联样式元素、检测第三方资源、高亮设计系统组件使用情况等。这些脚本可辅助理解和记录遗留前端代码,在多开发者贡献的网站审计中发挥作用,且能为特定前端调查提供快速见解,还介绍了组件检查器的定制方法,最后有个有趣的书签脚本调侃新设计。

Should You Go All-In on Vite? A Risk vs. Reward Analysis
文章围绕是否全力投入使用 Vite 展开风险与回报分析。Vite 凭借快速启动、热更新及与多框架集成等优势,成为众多现代框架的支柱。全力采用 Vite 可提升开发速度、简化新成员入职、借助生态优势并保障生产质量。但也存在风险,如依赖单一工具、成熟度不足、大型项目性能瓶颈及开发者习惯差异等。同时,Turbopack、esbuild 等竞争对手也在争夺开发者关注。对于中小团队,Vite 当下值得尝试;企业级团队则需权衡风险并关注竞品。

Optimizing Your Codebase for AI Coding Agents
作者使用GitHub Copilot辅助软件开发,发现多数问题并非代码问题,而是组织和文档问题。优化AI代理主要是消除歧义、让隐性知识显性化。作者总结出几个模式:一是文档分散降低效率,应建立单一真相源;二是代理不会自我优化,要编写快速专注的验证脚本;三是歧义会造成混乱,要明确边缘情况处理方式。实施改进后,预计处理时间减少约40%、令牌使用量减少约75%、混乱和循环推理减少超80%。优化不仅利于AI,也方便所有人,关键是做好文档和工具。

Introducing TanStack Start Middleware
文章介绍了 TanStack Start 框架的 Middleware 功能。TanStack Start 结合 TanStack Router 实现服务端支持,Middleware 可让代码在服务端操作时于客户端和服务端前后执行,并能在两者间传递数据。文中先解释 SSR 优势,介绍服务端函数,以 Jira 克隆应用为例开启实践。展示首个服务端函数和 Middleware 代码,运行后分析客户端与服务端日志。构建带观测性的日志 Middleware 时遇 TypeScript 错误,通过拆分解决。还利用 Node 的 asyncLocalStorage 使服务端函数调用时共享 traceId,让观测系统更真实。最后表示后续将探索 Middleware 实现单飞行突变。

1024,不止程序员节!创意黑客松 Nano Banana 出海专场回顾
10月24日是程序员节,“1024”对开发者意义特殊。由小红书科技主办、Google谷歌支持的创意黑客松Nano Banana出海专场,展现了谷歌Nano Banana模型在出海方向的无限可能。活动全程线上进行,Google Cloud提供云代金券,邀请三位GDE担任评审给予专业指导。赛制简洁透明,开发者在小红书展示项目。从创意Demo到实际作品,开发者用AI展示了无限潜力。这场黑客松是开发者的全球化探索实践,创造力不会熄灭。

Google 最新 Nano Banana 模型空降北京 DevFest
2025年DevFest北京场活动信息公布,Google最新Nano Banana模型空降。活动始于2012年,今年集结官方及专家团队分享经验。现场可尝试新开发工具,与全球开发者交流。Nano Banana工作坊零代码出图,适合多类人群。介绍了讲师嘉宾,如王玉成、凝淇等。还公布了主题演讲、各分会场及AI代码实验室的安排,包括时间、主题和主讲人。活动于11月9日在北京新世纪日航会议厅3楼举行,9:30签到,免费报名,停车有收费标准,参与有好礼。

DevFest 2025 杭州站: 完整日程抢先看
DevFest 2025 全球社区技术盛会在杭州启幕,主题为‘Building Safe, Secure and Scalable Solutions with AI and Cloud’,聚焦 AI 与 Google Cloud 技术融合。活动亮点包括多元场实践、深度工作坊、实际案例体验和社区交流。介绍了主题演讲、AI 实验室、Web AI 分会场、Google Cloud 出海分会场等各场次的时间、主题和主讲人,AI 市集全天开放。活动时间为 2025 年 11 月 1 日 09:00 - 18:00,地点在阿里巴巴数字生态创新园,还提供了停车、地铁信息及报名方式。

MCP 赋能 AI 编码助理 | Chrome 开发者工具学习资源 (三)
谷歌推出新版 Chrome 开发者工具模型上下文协议 (MCP) 服务器公开预览版,将 Chrome 开发者工具功能引入 AI 编码助理。当前编码智能体无法看到代码在浏览器中运行效果,MCP 服务器改变这一现状,让 AI 编码助理可在 Chrome 中调试网页,提高识别和修复问题的准确性。MCP 是开放标准,能连接大语言模型到外部工具和数据源,如 performance_start_trace 工具可帮助分析网站性能。文章给出在 AI 助理中试用的示例提示,如实时验证代码变更、诊断错误等,还介绍了开始使用的配置和检查方法,最后呼吁社区反馈以完善该工具。

在不确定性中寻找平衡:Gartner发布中国ICT成熟度曲线
在全球经济增长放缓、地缘政治波动、市场需求多变背景下,Gartner发布2025年《中国通信与信息技术成熟度曲线》。今年报告提出‘三重平衡’与‘四大支柱’,构建CIO决策框架,实现技术投入、业务价值和组织稳健的动态均衡。报告中多项技术成熟度曲线位置变化,重点关注低代码应用平台等技术,移除数据中台等技术,优先关注行业云平台等。CIO正从技术管家转向业务伙伴,反映中国企业对数字化投资的理性态度。中国在全球AI竞争中有规模与场景优势,此曲线为CIO提供认知框架,标志中国企业数字化转型进入‘价值落地’阶段。

解锁Gartner 2026年IT领导者实战规划工具包
在AI加速变革时代,企业领导者面临挑战与机遇。Gartner调研显示68%的CEO制定人机协同战略,增长是核心目标。在此背景下,IT领导者需实用规划工具将企业战略转化为部门行动。Gartner IT领导者实战规划工具包可明确战略方向,确保部门目标与高层战略对齐;评估执行能力,识别差距并制定补强计划;优化预算决策,科学管理预算;量化战略进展,清晰展示执行成果;构建行动蓝图,助力战略落地。

VL Norm:让强化学习更稳、更快的关键一步
随着大语言模型推理能力提升,强化学习中保持稳定优化效率与可验证性成重要方向。可验证奖励强化学习(RLVR)虽有潜力,但模型输出长度变化大,导致梯度方差波动,使训练不稳定、收敛慢。微软亚洲研究院与清华团队提出 VL Norm 方法,理论上无偏差且方差最小。研究分析现有归一化方法存在偏差或高方差问题,而 VL Norm 不管 α 取值始终无偏,α = 1 时方差最小。实验表明,在不同任务、模型大小和最大回复长度上,VL Norm 显著优于多种基线方法,能让训练更稳定、收敛更快,为 RLVR 带来稳健优化路径。
