225

人工智能 × 交互设计 & iOS 26 体验报告

国内

[京东技术] 京东 3D信息流 电商

京东率先开启“3D信息流时代” 让购物更有趣
2025年京东618,京东XR创新团队率先开启“3D信息流时代”。其推出“京东立影 - 裸眼3D广告”,无需设备让商品立体展示,与多品牌合作效果好;“立影 - 妙搭”AIGC创作工具降低3D广告制作成本;“立影 - 美家”解决家居家电展示问题;自研3D引擎优化电商场景;“立影 - 3D直播”让用户自由查看商品细节。3D技术助品牌连接用户,京东将持续探索其无限可能。

[滴滴技术] 滴滴 Dimina 小程序框架

滴滴开源新项目Dimina星河,打造灵活轻量的小程序框架
滴滴开源核心小程序框架Dimina星河。市面上缺乏成熟开源小程序方案,Dimina是自研轻量级跨端框架,可让一套代码在多平台运行。它结合Vue3与小程序语法,通过DMCC编译器转换语法。有25 +常用组件、60 + API,提供接入流程图。已对齐微信小程序主要功能,未来会提升能力,项目地址https://github.com/didi/dimina

[哔哩哔哩技术] KMP技术 跨平台开发 B站

B站在KMP跨平台的业务实践之路
本文是KMP技术系列第三篇,介绍B站KMP跨平台业务实践。先讲工程结构,选Bazel构建,实现多语言混编、依赖注入与分模块导出。业务落地选私信会话列表页,满足重逻辑轻UI等特点。技术选型采用单向数据流、函数式编程,用FlowRedux实现状态机。项目组织上,不同平台有不同集成方式;交互范式遵循Coroutine First和Keep internal as possible准则。KMP在私信模块成功落地,后续将分享更多应用情况。

[阿里云开发者] Agent实现 browser-use MCP集成

从browser-use 出发,品 Agent 实现
本文从作者学习路径出发,以browser - use项目为例介绍agent实现。先阐述个人对LLM理解的三阶段,引出browser - use。接着说明agent要素,含记忆、规划、工具等,还进行纯对话演示。之后解析browser - use源码,包括提示词、记忆模块、结构化输出等。又探讨集成MCP,对比两种方式。还介绍coze space使用模式。最后总结展望,提出理想agent特征,表达不同角色期待,还提及应用缓存提速方案。

[阿里云开发者] AI应用架构 LLM技术 架构演进

聊聊AI应用架构演进
文章借AI应用架构演进路线,梳理各阶段架构内容与相关技术。从简易架构起步,历经上下文增强、输入输出防护、意图路由、模型网关、缓存设计等阶段,最终到Agent模式。还提及监控日志、推理性能优化方式,如批处理、并行处理、分集群部署等。指出LLM发展促使AI应用架构不断演进,开发者可按需选框架构建应用并深入优化。

[阿里云开发者] Agent开发 OneAgent + MCPs 强化学习

如何像 Manus 交付业务需求-- OneAgent + MCPs 范式
文章介绍向 Manus 交付业务需求的 OneAgent + MCPs 范式。先回顾 Agent 发展,从单一 LLM 调用到 OneAgent + MCPs。该范式使 LLM 自主行动,结合企业 MCP Server 完成业务需求。文中阐述 OneAgent + MCPs 系统组件、执行流程等实现细节,也指出当前在 to-do 质量、MCP 管理等方面不足,并给出构建标准化生态、提升鲁棒性等发展方向,还介绍强化学习应用。

[得物技术] 得物技术 前端自动化测试 研发自测

得物研发自测 & 前端自动化测试体系建设
文章围绕得物前端自动化测试体系建设展开。当前前端自测率低,缺乏自动化质量保障技术。为此从技术、推广、运营三方面提出方案,包括前端代码覆盖率检测、E2E自动化测试等。现阶段已取得基础能力建设、应用接入、覆盖率提升、研发自测率提高等成果。未来规划构建质量保障矩阵、精细化运营覆盖率数据、常态化运营,以提升研发效能与产品质量。

[得物技术] 得物技术 社区活动 组件化

得物社区活动:组件化的演进与实践
文章围绕得物社区活动组件化展开。先阐述活动业务重要性,分析其效果与效率的矛盾及现存问题,引出组件化思路。接着介绍从 OOP 到实践的组件化过程,包括系统与业务、事件驱动等。还提及新陈更迭要兼顾业务与技术,确保系统稳定过渡。最后构建全链路协同能力推动业务向系统化跃迁,展望借助前沿技术实现智能自优化,构建潮流生态闭环。

[前端圈] 前端 Vitest 版本发布

Vitest 3.2 版本正式发布!
2025年6月15日 Vitest 3.2 版本正式发布,专注于浏览器模式和 TypeScript 支持改进。弃用 workspace 配置,推荐用 projects 简化配置。新增注解 API 可添加自定义消息和附件;作用域限定的 Fixture 能指定作用域;支持自定义项目名称颜色、自定义浏览器定位器 API 等。还有显式资源管理、Test signal API、覆盖率 V8 AST 感知重映射等特性,以及 watchTriggerPatterns 选项、新的多用途 Matchers 类型、sequence.groupOrder 选项。

[PaperAgent] AI技术栈 AI Agents 2025 AI技术

10张图全面理解AI Agents、Agentic、RAG、MCP技术栈。
文章分享AI Agents、Agentic、RAG、MCP等AI技术栈图解。介绍AI Agents工作原理、用途、关键概念、能力、工具框架及实际应用,也提及挑战风险;讲解Agentic AI架构技术栈,区分MCP、A2A和函数调用;阐述RAG重要性、工作方式和最佳工具;解读6种AI模型;还给出2025 AI技术栈成功路线图。

[PaperAgent] 强化预训练,LLMs,RPT

微软RPT:强化学习的风又吹到了预训练!
微软研究院、北大、清华联合提出强化预训练(RPT)新范式用于LLMs预训练,将Next - Token预测任务转为强化学习推理任务,以预测正确性获奖励更新模型。用OmniMATH数据集预训练,以Deepseek - R1 - Distill - Qwen - 14B为基础模型、GRPO算法训练。RPT - 14B在Next - Token预测准确性、零样本性能等方面表现优,还能利用大量未标注文本数据提升性能。

[云中江树] Gemini Diffusion 谷歌 AI模型

挑战 Transformer 架构的谷歌最新扩散模型 Gemini Diffusion 系统提示词
Google DeepMind发布的Gemini Diffusion是突破性文本扩散模型,改变AI文字生成方式,生成速度达1479 tokens/秒,在多项测试表现出色。它已开放内测,文中给出体验网址。还详细介绍系统提示词,包括核心原则、HTML网页和游戏生成指令等。其提示词设计在技术约束、安全伦理等多层面有考量,注重实用性和可执行性。

多智能体系统 Mass框架 Prompt设计

Google研究发现:Multi-Agent的核心竟然是Prompt设计!
Google与剑桥大学研究发现多智能体系统(MAS)设计中,Prompt设计是核心。MAS设计面临提示和拓扑结构设计挑战,研究发现提示设计影响大,有效拓扑结构占比小。基于此提出Mass框架,分块级提示优化、工作流拓扑优化、工作流级提示优化三阶段。实验用Gemini 1.5 Pro和Flash模型与多种方法对比,Mass在多任务上表现优,性能提升约10%以上,且有成本效益。

[前端充电宝] 滴滴 跨端小程序框架 Vue 3

重磅!滴滴开源全新跨端小程序框架,基于 Vue 3!
2025年6月14日消息,滴滴开源全新轻量级跨端小程序框架星河(Dimina),支持用微信小程序语法开发,通过DMCC编译器转译代码,可在多平台运行。其特性包括一套代码多端运行、完善开发生态、卓越性能表现。技术架构以Vue 3为核心引擎,DMCC编译器打通语法壁垒。开发仅需五步,涵盖创建项目、页面开发等流程。

[极客公园] Agent 创业机会 AI

聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?
本文围绕 Agent 展开深度对谈。2025 年 Agent 成新风口,但跑通价值闭环项目少。从业者从多维度拆解真问题与机会,指出通用 Agent 大模型公司占优,创业公司可聚焦垂直领域;做 Agent 可从 Copilot 做起;Coding 或成 AGI 关键,有巨大价值;还探讨了商业模式、人机协作、杀手级应用等,也提及模型技术发展与 Agent 基础设施的变化和机会。

[InfoQ] Agentic AI 数据仓库 Agentic Data Stack

被骂“在乱讲”的专家,这次可能说对了:传统数据仓库正在被 Agentic AI 吞噬
文章指出 Agentic AI 正深刻影响企业大数据架构,传统数据仓库或被吞噬。回顾了 1970 - 2024 数据仓库架构演进,从 Bill Inmon 提出概念到 Snowflake 兴起。随着 Agent 爆发,数据消费者变为 Agent,为人设计的决策支持系统 DSS 架构不再适用。提出 Agentic Data Stack 概念,其含 Contextual Data Unit,可缩短建设周期,降低成本,虽有技术问题待解决,但将带来深刻变革。

[深思圈] AI Laurel 时间管理

海外这么小众的AI赛道,竟然能融1个亿美金
文章介绍海外AI公司Laurel获1亿美元C轮融资。它构建AI时间平台,解决知识型行业时间管理痛点。其发展历经波折,后借技术成熟、市场教育和商业紧迫性实现爆发式增长。客户使用后利润增长4 - 11%,能深入洞察工作模式。公司有三阶段愿景,带来知识工作供应链革命,对社会和行业意义深远,是知识工作数字化转型先锋。

[十字路口Crossing] AI云原生 Agent开发 火山引擎

我们正在目睹「一千个垂直领域 Agent 」的诞生|当像搭积木一样简单时,创新将遍地开花
文章以火山引擎 Force 原动力大会为切入点,介绍 AI 云原生理念下 Agent 开发的转变。从野蛮生长到系统化工程,火山引擎深入 Agent 开发各环节,推出配套产品服务。以机票预订 Agent 为例,展示其开发流程简单高效。AI 云原生带来三方面机会:催生千个垂直领域 Agent、推动 Agent 大规模商用、实现 Agent Ready。它降低技术门槛,释放创新力,让创意突破技术限制,迎来百花齐放时代。

[货拉拉技术] 货拉拉 星图平台 性能优化

API灵活定义+极速驱动:货拉拉星图平台技术架构与优化实践
文章围绕货拉拉星图平台展开,它为实现业务对接配置化而生,具备接口管理、流程编排、接口调用等核心功能。运行初期面临数据库压力大、CPU居高不下等难题。为此,平台从数据存储、缓存策略、并发模型、代码、JVM等方面优化,性能显著提升,服务机器数减半,整体RT降约2/3。目前已接入超100个业务方服务,保障业务连续性,助力业务发展、降本增效。

[大淘宝技术] AI应用架构 LLM 技术演进

聊聊AI应用架构演进
文章借AI应用架构演进路线,介绍各阶段架构及相关技术。从简易架构起,经上下文增强、输入输出防护、意图路由等演进至Agent模式。还提及监控日志、推理性能优化等方面,如通过批处理、并行处理等提升推理性能。最后指出LLM发展促使AI应用架构不断演进,可依诉求选开发框架构建应用。

[GSYTech] Flutter iOS 26 液态玻璃

Flutter 小技巧之:实现 iOS 26 的 “液态玻璃”
文章围绕 Flutter 实现 iOS 26“液态玻璃”效果展开。iOS 26 的“液态玻璃”热度高,其效果非简单毛玻璃,需自定义着色器。文中介绍 shadertoy 相关实现,核心的 LiquidGlass 函数实现磨砂玻璃模糊效果,入口代码处理边缘液体感,通过创建扭曲坐标产生折射效果,结合背景图片混合。还给出修改思路,如调整扭曲方式,实现从中间放大扭曲、水滴扭曲等,但这些复刻粗糙,苹果在系统 UI 用此风格,对能耗和渲染成本控制应很自信,文末提供 Demo 链接。

[阿里云开发者] AI Coding 软件开发 核心技能

技术思辨|AI Coding:经验壁垒正在失效,工具进化重塑编程
文章探讨AI Coding对传统研发模式的冲击,指出专业性转移升级,开发者需关注‘做什么’与‘为什么做’;能实现高质量专注,提高效率。可复用性原则更重要,架构设计仍是核心。开发者向全栈发展,但领域专家经验仍关键。研发左移带来新挑战与责任划分问题。还强调人类应掌握长程规划、决策、创造等核心技能,‘老师傅’经验也不可忽视。

国外

Visual Studio Code 软件更新 开发工具

May 2025 (version 1.101)
这是 Visual Studio Code 2025 年 5 月版本(1.101)的更新介绍。涵盖 MCP 功能增强,如支持提示、资源、采样、认证和开发模式;聊天功能改进,包括工具集管理、UX 优化;编辑体验提升,有查找即输入、代码编辑优化;还有笔记本、源代码控制、任务、终端等多方面更新。此外,涉及扩展创作、工程方面的改进,以及众多贡献者的信息。

前端开发 编程语言 Elixir

Elixir: An Alternative to JavaScript-Based Web Development
文章指出一些 JavaScript 开发者因扩展难题转向 Elixir 及其 Phoenix 框架。DockYard 创始人 Brian Cardarella 称 JavaScript 难以合理扩展,而 Elixir 是函数式语言,内存管理和垃圾回收更优,可提高开发效率、降低成本。如 Bleacher Report 采用 Phoenix 后团队规模大幅缩减、服务器数量减少。不过 Elixir 语法与 JavaScript 差异大,但其 Phoenix LiveView 等工具具有优势,只是因多种原因未广泛应用。

Web Development Google Web UI

Google’s “What’s New in Web UI” Talk: Less Custom Component JavaScript, More Web Standards
本文介绍 Google “What’s New in Web UI” 演讲内容,Chrome 团队支持的 Web UI 新进展。一些需大量 JavaScript 的常见 UI 模式,未来可用 HTML 和 CSS 声明式实现,减少自定义 JavaScript 并自带无障碍功能。演讲聚焦可定制选择菜单、轮播图和悬停卡片三种 UI 模式,如可定制选择菜单借助 Popover API 和 Anchor Positioning 实现,还展示了改进的 select 元素样式代码,且 CSS 新特性可实现纯 CSS 滚动动画。

Oxlint 代码检查工具 ESLint

Announcing Oxlint 1.0
Oxlint 1.0 正式发布,这是一款用 Rust 编写的 JavaScript 和 TypeScript 代码检查工具。它比 ESLint 快 50 - 100 倍,支持超 500 条 ESLint 规则,已被 Shopify、Airbnb 等公司采用,能降低 CI 成本。使用零配置,也可通过 .oxlintrc.json 配置。后续计划支持自定义规则、性能优化等,其成功离不开超 200 位贡献者。

pnpm 包管理 版本更新

pnpm 10.12 Introduces Global Virtual Store and Expanded Version Catalogs
本周 pnpm 发布 10.12.1 版本,为 JavaScript 包管理带来重大改变。一是引入实验性全局虚拟存储,在缓存预热机器上可实现快速安装,多项目能复用依赖实例,减少安装时间,且会在 CI 环境自动禁用;二是改进版本目录系统,pnpm update 支持更新 catalog: 协议依赖,新增 catalogMode 设置和 CLI 选项。此外还有一些小更新,pnpm 近年来采用率增长显著。

Node.js TypeScript Amaro 1.0

Node.js Moves Toward Stable TypeScript Support with Amaro 1.0
Node.js发布Amaro 1.0,为稳定支持TypeScript奠定基础。Amaro是官方的.ts文件类型剥离加载器,能将TypeScript支持从“实验性”提升到“稳定”。它主要进行类型剥离,借助SWC处理,可处理两种模式,还能处理node_modules内的文件。开发者对此很期待,但广泛采用仍有障碍,部分开发者有顾虑,社区还在讨论库维护者采用及向LTS版本回溯等问题,官方致力于消除实验警告。

React 开源社区 技术发展

The State of React and the Community in 2025
本文分析了2025年React及其社区的发展状况。作者回顾了React发展历程,如从内部项目开源,架构和API不断演变。当前React开发由Meta和Vercel支持,团队推荐使用框架,因框架具备数据获取、路由和服务器渲染等功能,可提升性能。但这一推荐引发社区担忧,如认为Vercel主导开发、React可能弃用客户端功能等。作者认为团队本意良好,但沟通和文档工作不足,应改进。

产品/设计

[信息与交互设计研究所] 人工智能 交互设计 案例

人工智能 × 交互设计:从工具到体验的变革进行时
在人工智能浪潮下,交互设计正深刻变革。文章精选四个案例:妙多AI 2.0是界面设计智能助手,提升设计效率与创意;View设备整合3D全息与虚拟助手,带来人性化交互;Stokke PlayPad革新儿童游戏体验,是成长伴侣型产品;NVIDIA×COACH的AI数字人“imma”开启实体零售沉浸式交互新范式,未来“虚拟导购”应用场景将拓展。

[信息与交互设计研究所] 用户体验设计 玩具设计 情感共鸣

用户体验设计:从玩乐到共情的玩具系列
在数字化与教育理念驱动下,玩具职能突破娱乐边界。文章借用户体验设计案例,解析以‘人本思维’重构玩具与用户关系,实现从功能交互到情感共鸣。介绍了多款玩具:Pixsee Play & Friends 让父母安心;uhoo 减轻儿童治疗焦虑;Choo Choo 助孩子开发大脑、成人减压;PLAB 培养孩子创造力。

[58UXD] 下沉设计 用户思维 本土化美学

解锁下沉设计新密码:当「用户思维」碰撞「本土化美学」
消费市场进入精细化竞争时代,下沉市场是蓝海。下沉设计核心是将商业逻辑转化为用户可感知价值。包括高性价比导向,如拼多多;功能极简实用,像快手、58本地版;渠道深度渗透,如OPPO、支付宝;内容本土化适配,如抖音;情感共鸣设计,如鸿星尔克。还需拒绝‘土味标签’,平衡‘本土偏好’与‘美学升级’,实现设计普惠,满足下沉用户需求。

[TripDesign] AI营销 海外本地化 营销活动KV

如何用AI打造海外本地化人物,提升营销活动KV点击率?
文章探讨用AI打造海外本地化人物提升营销活动KV点击率。先介绍‘3B原则’及传统人物素材使用的局限,引出AI生成式人物。接着阐述打造本地化AI人物的三招,即从面部特征、妆发造型、动作视角入手。还提到用品牌元素加持KV,建立方法论流程。明确应用场景,制定规范确保合规。实践显示平均CTR提升40%,未来将探索其在更多业务场景的应用。

[好机友] 苹果新品 iOS 26 体验报告

用了苹果昨天发布的新品后,我只希望国产手机千万别抄
作者分享使用苹果新品iOS 26的体验。外观上,系统界面采用液体玻璃效果,图标透明,是实时3D渲染特效,控制中心也变玻璃效果。系统底层和交互逻辑重制,搜索栏下移,底部栏有新交互和彩蛋。功能上,锁屏时间可变长,支持2D转3D照片预览,充电有时间提示,新增自适应电源模式,右滑返回范围扩大。不过系统费眼,预览版有性能问题,不建议非开发者升级。

[海外独角兽] Mercor 数据标注 AI招聘

从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?
文章探讨 Mercor 能否成为下一个 Scale AI。Mercor 从 AI 招聘平台转型为数据标注服务竞争者,利用市场空白为小预算高难度项目服务。其核心资产是超 30 万专家人才网络,提供灵活工作流与质量激励机制。虽数据质量低于行业领先者,但 2025 年初 ARR 达 7500 万美元,获 1 亿美元 B 轮融资。不过,它面临人才、佣金、质量和 AI 替代等风险。

[Trae-Real AI Engineer] TRAE AI开发 开发者工具

TRAE:从代码生成到软件生成的跨越
6月12日,字节跳动开发工具TRAE负责人在大会演讲,介绍TRAE致力于用AI提升开发者效能。它将产品、工程、模型能力结合,有代码补全、自然语言开发等功能,用户可在“AI主导”和“AI辅助”间切换。自今年1月上线,月活超百万。还分享字节内非技术背景产品经理用AI独立完成App开发案例,未来TRAE将集成更多工具,重构开发流程。

[字节跳动技术团队] AI Coding TRAE

字节跳动技术副总裁洪定坤:TRAE 想做 AI Development
字节跳动技术副总裁洪定坤在火山引擎大会分享AI Coding产品TRAE。做AI Coding一是为技术普惠,让人人成开发者;二是提升研发效率,超80%字节工程师用TRAE;三是追求智能上限。他用3天开发英语学习应用,85%代码靠自然语言对话生成。TRAE不仅提升Coding效率,未来还想实现AI Development统筹软件开发各环节,且强调编程离不开人的协作。

行业

[探索AGI] AI Anthropic 产品开发

Anthropic CPO:AI写9成代码后,我们迎来了新噩梦!
文章分享对Anthropic CPO Mike Krieger的播客访谈。AI约90%代码由Claude编写,开发瓶颈转至战略决策、团队对齐和代码审查合并。产品经理要制定战略、提升易用性等。Anthropic服务开发者和构建者。Artifact因移动端广告、缺乏传播性和远程办公难转型而关闭。Mike建议创业者深耕垂直行业、有独特策略和交互模式,还强调培养孩子好奇心与独立思考能力。

[有新Newin] AI OpenAI 企业应用

Sam Altman:人机协作发生根本性变化,人类分发任务,整合并反馈 Agent 产生的结果,AGI 仅是新一轮起点
在 Snowflake Summit 2025 上,OpenAI CEO Sam Altman 等指出 AI 已越过企业采用“可信门槛”。企业不应等待,要在波动中行动,快速试错。ChatGPT 等工具已进入主流生产系统,企业大量部署。预计未来 AI 会直接解决关键问题。Altman 认为代码 agent Codex 接近 AGI,AGI 是新一轮人机协作起点,未来模型能力将大幅提升。

[海外独角兽] AGI 形式化数学 DeepSeek - Prover

对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
本文是对 DeepSeek - Prover 核心作者辛华剑的访谈。探讨了 AGI 与 Agent 的关系,指出 AGI 可视为 Agent 的 AGI。介绍形式化数学,其能让当代数学工程化,解决复杂问题。还谈及 DeepSeek Prover 三部曲进展,强调形式化数学与 Multi - Agent 契合。指出当前模型开辟新数学领域能力不足,需改进评估基准。提出 Certified AI 概念,认为下一个重大跨越是实现自主 Agent。

[追问nextquestion] 脑科学 人工智能 自我进化

万字追问:人类需要AI,还是更需要自身AI化?
本文探讨人类与大脑、AI相关话题。大脑可塑性强,能理解人工植入体信号,还可实现感官替代,如用舌头“看”。未来人类可自行设计感官门户。大脑灵活性还能用于控制机械手臂等扩展身体。虽绘制大脑连接体、模拟人类意识困难重重,但理论上可行。创造有感知的机器也面临挑战,如iCub无真正思想。上传自己进入“超人类”时代有技术障碍,但也带来新可能。