预见 2049 & 目前AI最重要的影响

国内

火山引擎存储 AI 体验走查用户体验

AI 体验走查 - 火山引擎存储的 AI UX 探索之路
火山引擎存储技术团队借助 AI 开展用户体验走查与可用性测试。传统人工走查有低效、覆盖有限等问题，团队基于 Midscene.js 和 Doubao - 1.5 - thinking - vision - pro 打造全自动交互体验走查系统，实现自主执行和专业评价，维护成本低。系统已落地多个产品线，节省人力、提高问题发现率。未来计划实现自动生成用例、减少辅助步骤、用户分层和探索边界场景等。

[ByteDance Web Infra] Rspack Web 开发字节跳动

Rspack 1.4 发布:支持在浏览器中运行
Rspack 1.4 正式发布，带来诸多新特性。新功能包括支持在浏览器运行、更快的 SWC、更小构建产物、默认启用增量构建、新增 CssChunkingPlugin 等。Rstack 方面，Rsbuild 1.4、Rslib 0.10 发布，Rspress 2.0 处于 beta 版，Rsdoctor 推出 MCP，Rstest 发布。生态系统中 next - rspack 稳定性提升，Kmi 带来性能提升。升级指南涉及 SWC 插件和 lazy compilation 中间件的升级。

数据库 VIDEX 字节跳动

字节跳动 ByteBrain 开源 MySQL 虚拟索引 VIDEX:让 AI+DB 也能大规模落地
文章介绍字节跳动 ByteBrain 开源的 MySQL 虚拟索引项目 VIDEX。虚拟索引可模拟索引方案效果，助用户确定最优方案，但 MySQL 此前缺乏该能力。VIDEX 可无缝集成 MySQL 生态，弥补其虚拟索引空白，能高精度拟合 MySQL，支持多形态部署，有可拓展实验平台。还介绍其多种形态应用、接入算法方法、使用步骤及效果，展示其架构并给出作者团队联系方式。

[火山引擎] 豆包火山引擎 RTC

豆包视频通话背后:RTC打造AI交互体验护城河
豆包 APP 全新「视频通话」功能实现「拍问即答」，标志 AI 交互进入「视听协同」时代，其核心技术是火山引擎 RTC。RTC 能破解多模态传输难题，通过多种抗拥塞能力及端到端传输优化，提升视频传输稳定性与抗弱网能力。实测显示，RTC 在弱网环境下稳定性远超 WebSocket。此外，火山引擎推出对话式 AI 一站式解决方案，具备低延时、智能语义判停和声纹降噪等能力，可实现自然打断体验。

[货拉拉技术] JS SDK 测试方案 AI代码生成

JS SDK一体化测试方案的快速实践
文章介绍货拉拉JS SDK一体化测试方案。因SDK测试场景复杂、接口多、代码编写负担重，搭建了测试平台。从框架搭建统一测试版本、部署等；功能测试整理对象与方法，拆分页面和用例；接口自动化选Jasmine框架；性能测试设计场景、采集数据；智能测试代码用DeepSeek V3生成。该方案提升测试效率与质量，未来将在平台、测试和智能化方面优化。

[腾讯技术工程] Android APK优化 UE项目

极致优化Android平台APK的大小
文章围绕优化Android平台APK大小展开。先分析APK内游戏相关空间占比大的部分，提出压缩NativeLibs、优化代码体积、优化数据、重定位表压缩、资源裁剪等策略。如压缩NativeLibs可控制so压缩，代码体积优化针对libUE4.so等；重定位表压缩分SDK 28和23版本处理；资源裁剪涉及第三方组件和游戏内资源。经优化，so大小和运行时内存显著降低，APK从1.23G降至130M。

[阿里云开发者] Cursor编程 AutoGPT Claude4.0

深入解析|Cursor编程实践经验分享
本文是近两个月Cursor编程实践总结。介绍了Cursor使用方法，如标准Prompt、好用Rules、合理开发流程和有帮助的mcp，还给出不同任务的Prompt示例。分享了多种Rules，像项目梳理、技术方案设计、中间件调用等。提到MCP可提升工作流畅度。指出Cursor在大需求上效果不稳定，引入DeepResearch，介绍AutoGPT原理、终止机制和内置Prompt，最后介绍Claude4.0新功能。

[阿里云开发者] AI workflow MAS 多智能体协作

workflow is all you need?探讨乐高式流程编排能否实现任意Multi-Agent模式
文章探讨AI workflow产品能否支持任意MAS设计模式。以Dify为例，介绍用核心组件实现单Agent及路由、顺序、主从等多种多智能体协作模式，还提及嵌套模式可实现乐高式组合。但目前主流AI workflow产品存在局限，如无法支持完全异步群聊、动态智能体添加和并行化MOA仿神经网络模式，期待未来有更优的多智能体研发产品。

[阿里云开发者] 数据分析评估体系 DataV - Note

如何让AI写出高质量的数据分析报告?DataV-Note的评估体系揭秘
文章围绕DataV - Note智能分析创作平台的评估体系建设展开。先指出当前智能工具缺乏统一评估标准和准确性争议问题。接着阐述评估模型，包括目标确立如产品验证等，初步设计涉及选用Qwen模型及关键细节，还建立纵向和横向评估标准。最后给出未来规划，如接入自动化和利用评估模型提高准确度，强调大模型在数据分析精准把控上有挑战。

淘宝直播数字人 TTS语音合成

淘宝直播数字人:TTS语音合成技术
文章是淘宝直播数字人TTS语音合成技术实践总结。先介绍TTS在数字人直播场景的关键作用，接着围绕直播数据语料构建、模型优化等探索。语料构建搭建数据处理管线，经语音信号处理、语音理解、说话人聚类提高训练数据质量；模型优化从前端正则化、多音字处理，后端架构、发音、韵律情感等多方面迭代，还探索CosyVoice架构融合，最后提及未来展望和团队情况。

[大淘宝技术] 淘宝直播数字人弹幕互动

淘宝直播数字人:LLM弹幕互动技术
文章是淘宝直播数字人 LLM 弹幕互动技术实践总结。介绍数字人链路含 CV、TTS、LLM 模块，阐述弹幕互动两种形式。详述互动架构各模块，如预置库匹配、意图识别等。多轮意图识别模型表现优异，实体解析模块解决复杂场景问题。还介绍回复生成模块及训练数据，最后提出后续规划，包括千人千面、多模态融合等，团队已搭建 AI 技术矩阵服务商家。

支付系统架构设计腾讯云

如何设计一个支付系统丨架构师系列文集
本文是腾讯云架构师系列文集首篇，分享支付系统经典设计。先介绍支付系统在电商交易平台的重要作用，阐述其与核心交易系统架构特点，包括各模块功能及设计要点。接着说明交易系统链路优化，涵盖业务校验、接单等功能。还讲述对账系统设计，涉及概述、需求分析，如数据关系、对账维度和结果输出模式。最后强调支付系统监控重要性，架构设计是动态过程。

小红书奖励模型大语言模型

万字干货:小红书 hi lab 团队关于奖励模型的一些探索
本文是小红书hi lab团队关于奖励模型的探索。团队针对奖励模型评估、多模态RM泛化、中文奖励模型数据缺乏、大模型推理及幻觉缓解等问题展开研究。如提出新评估方法、构建捷径感知MM - RM、创建CheemsBench和CheemsPreference、设计Critic - CoT和CodePMP方法、提出RLFH框架等，还给出实验结果并总结各研究意义，最后介绍团队成员、岗位等信息。

[得物技术] 大模型开发 Java Spring - AI

给Javaer看的大模型开发指南|得物技术
文章为Java开发者提供大模型开发指南。介绍大模型特点，如无状态、可结构化输出、支持函数调用。阐述大模型接口输入输出及常见供应商API。提到RAG架构解决私域信息问题，MCP协议促进大模型与传统系统交互。重点讲解Spring - AI的模型抽象、聊天会话、RAG拓展等，还给出代码示例。最后以“DJob智能助手”为例开发智能体，助开发者理解大模型工程化。

[得物技术] AI协作规范得物技术代码生成

Cursor Rules优化实战:构建高效稳定的AI代码生成规范体系|得物技术
文章围绕Cursor Rules优化实践，阐述构建AI代码生成规范体系。先指出旧版Rules存在规则冗余、提示词冲突、维护困难等痛点。接着介绍新版设计理念为分层架构、职责分离、按需调用，采用三层结构。详细剖析各层设计，基础层拆分文件，模块层按架构分层，流程层针对业务场景。还给出最佳实践，包括快速开始步骤和分阶段实施计划。最终总结该体系优势，可推广到其他AI协作工具。

[DAMO开发者矩阵] 医疗科技多模态大模型达摩院

探索医疗科技的未来:达摩院在多模态大模型领域的创新尝试
本文围绕达摩院医疗多模态大模型展开。当前多模态大模型在医疗领域面临知识局限、幻觉频现、推理匮乏、评测标准不统一等挑战。达摩院从数据构造、模型训练、评测框架三方面探索，构建高质量数据，采用多阶段训练范式，开发MedEvalKit评测框架。模型在多项测试中成绩领先，超越主流模型。未来将在数据构建、基准完善、能力扩展、训练策略优化和评估指标引入等方向突破。

[InfoQ] FreeWheel ChatBI 视频广告数据分析

从0到1拆解FreeWheel ChatBI:大模型如何重塑视频广告智能数据分析新生态
本文结合 FreeWheel 实践，介绍 ChatBI 系统核心功能与技术。功能有数据查询可视化、交互式分析、仪表盘导航、知识问答和多轮对话。技术上，用 Prompt + RAG 让 LLM 理解业务，智能选表和 Text2SQL 实现数据查询，涵盖 300 余张表，选表和 SQL 生成准确率高。智能分析构建算法服务，融合 Workflow 和 Agent。系统基于 LangGraph 搭建，引入用户反馈闭环。上线后获好评，后续将持续优化提升。

[黑夜路人技术] AI编程助手 Roo Code Cursor

Roo Code 与 Cursor 体验对比
随着AI技术发展，AI编程助手成开发者常用工具。文章介绍Roo Code 3.19改进，如智能上下文管理。其提示词系统分层配置，有多种模式。还对比Roo Code与Cursor，Roo Code在API控制有透明度优势，代码定位精准但Diff View不直观；Cursor内联对话便捷但Apply功能处理长代码欠佳。Roo Code免费且可自定义API，两者各有优劣，开发者可按需选择。

[InfoQ] React Vercel 框架推荐

React 被指“沦为 Vercel 打工仔”，力推框架只为圈钱?核心成员亲自下场回应却遭群嘲
近日，Mark Erikson 分析 React 及社区现状。虽 React 及其相关框架是构建应用主流方案，但生态复杂破碎，社区不满多。外界质疑 Vercel 主导 React 发展以盈利，Erikson 认为是 React 团队‘接管’Next.js。RSC 因架构复杂，需与框架集成。Next 非唯一适用框架，其他框架也在努力。React 团队推荐用框架，有合理性但未尊重使用方式多样性，社区对此有不同看法。

[机器学习AI算法工程] 机器学习 AI算法 RAG与MCP集成

如何实现RAG与MCP集成
文章围绕RAG与MCP集成展开。先介绍RAG优势及传统架构瓶颈，引出Agentic RAG，其智能代理实现多方面突破。MCP为AI工具集成提供标准，有记忆增强等功能。二者结合的系统架构含四大组件，运行时代理调度资源。集成需多步骤，还阐述查询扩展、数据更新存储等内容，最后给出代码示例。

[机器之心] LLM领域重要论文 Transformer

盘一盘，2017年Transformer之后，LLM领域的重要论文
本文盘点2017年Transformer之后LLM领域重要论文。先介绍奠基理论，如Transformer架构、GPT - 3能力、RLHF方法等；再提及里程碑突破，像GPT - 4多模态能力、LLaMA推动开源；还阐述核心架构与方法，如Mamba、QLoRA等；最后列出重要优化与应用、前沿探索与新趋势相关论文，展现LLM领域发展脉络。

[快手技术] 快手 Kwai Keye-VL 多模态大模型

快手开源多模态大模型Kwai Keye-VL，引领视频理解新纪元
2025年6月26日，快手开源多模态大模型Kwai Keye-VL，采用VisionEncoder - Projector - LLM架构。该模型以Qwen3 - 8B为基础，能融合处理多模态信息，逻辑推理和视觉理解能力强，高考数学卷获140分。其训练分预训练、后训练，有架构优化策略。评估显示它在多方面领先，应用表现出色，未来在视频理解有独特优势，快手还发布招聘信息。

[奇舞精选] 开悟AI 应用开发严肃编程

严肃编程时代已来!智领·开悟 AI Team，一键生成高水准专业应用!
文章介绍「开悟AI」这一自然语言生成应用平台，它倡导「严肃编程」，与「氛围编程」划清界限。开悟AI能解决开发应用门槛高、现有产品不实用等问题，通过SOP标准化流程、AI Team协作等机制，可按需生成专业应用。其功能丰富，还集成主流工具构建生态。未来，开悟AI将在Agent生态、代码安全等方面持续进化，助力用户高效开发。

[Thoughtworks洞见] 软件工程 AI辅助研发软件危机

先理解软件工程，再谈AI辅助研发 | 警惕AI浪潮下的新“软件危机”
文章指出在AI辅助研发热潮下，需先理解软件工程。软件工程诞生是为解决“软件危机”，强调管理复杂性和全生命周期健康。若开发者缺乏软件工程思维用AI，会有输入垃圾、架构混乱等问题。企业应分四步将AI融入工程体系，即建立研发规范、打造DevOps平台、精准引入AI、推广演进研发模式，同时重塑人才体系，避免新“软件危机”。

[前端生存指南] Cline 代码索引 RAG

为什么 Cline 不会索引你的代码库
文章探讨 Cline 不索引代码库的原因及优势。指出传统 RAG 用于代码库有问题，如代码无法块状理解、索引随代码演变失效、存在安全隐患。Cline 则像资深工程师一样对待代码库，通过探索建立上下文，能生成高质量上下文，提供契合架构的建议。虽简单关键词匹配可能慢，但能让 AI 真正理解代码，且当下强大语言模型使此方法可行。

[前端充电宝] JavaScript 开源项目奖项

2025 年度最佳 JS 开源项目揭晓，竟然是它?
2025年6月12日JS Nation盛会落幕，揭晓多个JavaScript开源项目重要奖项。年度突破奖得主是Rolldown，表彰推动生态前进的新概念项目；最具技术想象力奖为TanStack Form，奖励拓展表达力的项目；开发效率提升奖是Zod，表彰提升开发者体验与效率的工具。各奖项均有提名项目。

国外

PNG 图像格式规范更新

PNG is back!
PNG新规范发布，重焕光彩。新技术发展促使其复活，W3C等多方参与。新特性包括支持HDR，仅用4字节；认可APNG动画；支持Exif数据；修正错误、明确规范等。常用程序如Chrome、Safari等已支持。后续会改进HDR与SDR互操作性，研究压缩更新。

空间网络 HTML模型元素 USDZ文件

A step into the spatial web:
文章介绍了 visionOS 26 对空间网络重要构建块 HTML 元素的重大更新。元素默认启用，有新 API。它能让网站轻松展示 3D 模型，用户可旋转查看。文章还介绍了其相关特性，如 ready Promise、orbit 模式、entityTransform 属性、环境光照管理、动画控制等。此外，提到了使用 USDZ 文件的方法，以及该功能的状态和反馈渠道。

网络机器人检测技术验证码

A short history of web bots and bot detection techniques
文章介绍网络机器人及其检测技术演变。简单机器人仅用HTTP客户端发请求，易被检测。检测方法包括查IP声誉、代理，进行TCP和TLS指纹识别等。机器人开发者用代理、修改用户代理应对。JavaScript能收集信息辅助检测。无头浏览器曾易被识别，新无头模式更难察觉。此外还有验证码、工作量证明、行为分析等检测手段，先进的还会用AI分析行为。

Vite7 前端工具发布

Vite 7.0 is out!
Vite 7.0发布，距首个提交已5年，每周下载3100万次。今年ViteConf将线下举办，VoidZero推进Rolldown以升级Vite核心，还与NuxtLabs合作开发Vite DevTools。Vite 7要求Node.js 20.19+或22.12+，默认浏览器目标变更，Vitest 3.2支持Vite 7。新增buildApp钩子，移除部分弃用特性。官方鼓励测试新API并反馈。

JavaScript TC39提案 Deno

What's coming to JavaScript
Deno公司致力于推动JavaScript发展，参与TC39标准委员会。TC39第108次会议推进9项提案，涉及4个阶段。阶段4有显式资源管理、Array.fromAsync、Error.isError；阶段3为不可变ArrayBuffer；阶段2是Random.Seeded和Number.prototype.clamp；阶段1包括保留尾随零、比较和随机函数。这些提案将使JavaScript资源管理更安全、异步操作更简单、数值处理更方便等，下次TC39会议9月下旬举行。

Swift Android 跨平台

Swift 官方正式支持 Android，iOS 的跨平台春天要来了吗?
近日 Swift 官方宣布成立 Android 工作组，将 Android 列为官方支持平台。其通过 LLVM 适配，借助 Android NDK 实现跨平台编译。目前核心标准库已能在 Android 编译，Foundation 和 Dispatch 等正在移植，但 UI 部分官方暂未提供支持。交互上需自行实现桥接绑定，Swift on Android 目前较毛坯，在交互和 UI 方面欠缺，iOS 的跨平台春天还需等待。

[iOS新知] iOS开发 Swift Android

iOS 开发者要失业了?Swift 进军 Android 背后的真相
6月26日Swift官方成立Android工作组。Swift发展快，苹果想让其“全平台通吃”。工作组工作包括让Swift在安卓原生支持、改造核心包等。此事影响大，优点是生态强大、找工作选择多、有望一套代码打天下；压力是iOS开发独特性降低、要学安卓知识、竞争更激烈。工作组成员来头大，官方称6.2和6.3版本会支持安卓，开发者应迎接挑战。

[AndroidPub] Google AI开发技术栈学习路径

Google 的 AI 开发技术栈学习路径
本文介绍了 Google 的 AI 开发技术栈学习路径。涵盖基础模型如 Gemini、Gemma 家族；开发工具与平台有 Google AI Studio、Gemini API；开发框架包括 Keras、JAX、Tunix；基础设施有 XLA、LLM - d 项目；边缘计算方面是 Google AI Edge。还展望未来，提及 AlphaEvolve、AI co - scientist、Gemini 机器人模型等创新方向，展现了 Google 在 AI 领域的领先实力，助开发者构建创新应用。

[深思圈] AI coding Amp 编程工具

继Cursor、Devin和Claude Code之后，又一匹AI coding黑马正在快速崛起
文章介绍AI coding黑马Amp。它由Sourcegraph推出，与Claude code同列S级。Amp开发过程独特，以播客开源。其有颠覆性产品哲学，如少即是多；对模型深度理解，与之共舞；构建反馈循环；引入子代理。还探索背景代理，重新定义编程时空。未来编程工作流将从工具到伙伴。Amp成功源于技术驱动、深度聚焦等底层逻辑，预示编程新时代到来。

[谷歌开发者] AI 智能体 Langbase Gemini 模型

强强联合 | 借助 Langbase 和 Gemini API 构建可扩展的 AI 智能体
文章介绍借助 Langbase 和 Gemini API 构建可扩展 AI 智能体。AI 智能体发展迅速，为开发者带来新可能。Langbase 可助力构建、部署和扩展智能体，其与 Gemini 模型无缝集成。使用 Gemini 模型构建智能体有性能卓越、效率提升、成本低、吞吐量高的优势。Langbase 简化开发者工作，二者结合能让开发者构建新智能应用，可查看相关研究深入了解。

[InfoQ] 谷歌 Gemini CLI AI编程

一天 15k 星，代码生成碾压 Claude，连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
谷歌发布 Gemini CLI，其免费使用配额慷慨，支持多平台，开源且获 15.1k 星。与 Claude Code 等对比，它功能丰富，可与编辑器搭配。其接入 Gemini 2.5 Pro 通用模型，产品和研究负责人认为通用模型更适合多数开发任务。开发者反馈其代码生成和理解能力提升显著，在大项目中表现优于 Claude Code，谷歌在代码能力上或实现赶超。

[CSDN] Google Gemini CLI AI编码工具

Google重磅出招!Gemini搬进终端，发布开源神器Gemini CLI:免费、百万上下文、每天千次调用
2025年6月26日，Google将旗舰AI模型Gemini带进终端，发布开源工具Gemini CLI。它免费，用Gemini 2.5 Pro模型，百万上下文长度，每天可调用千次。其功能丰富，能在终端多方面提供帮助，还可与Code Assist集成。该工具完全开源，获不少关注。不过，围绕它存在争议，有人认为提效，有人质疑弊端，还有实测显示它易被‘越狱’且主动升级攻击。

[独立开发] Claudia AI编程 GUI工具

告别命令行! Claude Code终于有图形化界面了(附稳定解决方案)
文章介绍Claude Code有了图形化界面。Claude Code命令行操作对非工程师不友好，YC支持的开源项目Claudia解决了此痛点。Claudia是为Claude Code设计的GUI应用及工具包，由Asterisk开发，理念是“隐私优先，本地优先”。它有交互界面、积分使用面板、Agent管理等功能，为开发者提供便捷高效且注重隐私的AI交互环境，还降低了AI技术应用门槛。作者创建交流群并提供稳定方案咨询。

产品/设计

58同城 icon设计视觉升级

“大方无隅”-58改版设计icon篇
2024年58同城完成产品视觉升级，确定设计理念。此次icon设计从“大方无隅”获灵感，从五维度展开：形态上融合方圆；与业务专属符号结合；用弧线曲线；表意选普遍认知形象、注重细节和情感共鸣；色彩拓展体系并关联业务；搭建视觉层级、适配不同场景；还制定规范并科学验证。图标虽小却能量大，未来将继续创新带来优质体验。

[信息与交互设计研究所] 计算机视觉信息交互设计应用案例

计算机视觉|赋予感知与认知能力
计算机视觉是让计算机从图像或视频中获取、处理信息，赋予机器感知与认知能力的技术。其应用广泛，变革众多行业。文中介绍了相关应用案例，如Virtual Realms:wall利用计算机视觉捕捉动作、记录活动；Agro拖拉机借助雷达、传感器和摄像头完成任务；NOVA太空酒店机器人能收获食材、运送食物；BéKKU可让家人互动、防护家庭安全、检查身体等。

[体验进阶] 淘宝AI官网生意管家 AI作图工具

淘宝AI官网换掉老土的科技蓝后，高级多了
文章介绍淘宝AI官网升级。生意管家是淘宝官方商家AI工具，但使用门槛高。此次围绕官网首页和AI作图工具展开优化。官网首页重构框架、拓展内容承载空间，用微动效与鼠标交互反馈展示AI能力。AI作图工具升级采用操作路径清晰、节点衔接连贯、交互自然友好、视觉工整简约、框架体验一致的策略，降低上手难度，满足商家需求，将复杂技术转译为易上手工具。

[信息与交互设计研究所] AI设计设计产品创意变革

AI生成设计:揭秘未来设计的无限可能
文章指出设计行业正处技术革命浪潮，AI生成设计产品从实验室走向大众，挑战人类创意垄断，重新书写设计本质。接着介绍多款AI设计产品，如Tablin老年护理机器人、Keepy家庭运营机器人、Legit助行器、WAGGY WITH ME车载项目，它们分别在老年护理、家居运营、医疗康复、人车宠物关系等领域发挥作用，利用AI技术带来新变革。

[58UXD] 58 同城设计项目交通媒体

拆解 2025 爆款设计!特殊交通媒体如何让品牌 “成” 风破浪
本文介绍 2025 春战换刊项目，春节期间品牌营销竞争激烈，58 同城突出新口号“事事可成 58 同城”。项目以“扫码”为核心，“码”为创意内核。地铁通道设计对“码”深度雕琢诠释品牌理念；武汉轻轨设计考虑空间与体验，强化品牌理念。设计还注重本地化表达。提案阶段创意丰富，完稿严谨。通过模块化设计实现复用延展，兼顾效率与传播效果，是团队协作的成功实践。

行业/思考

[腾讯研究院] 智能+，腾讯研究院，产业升级

万字解读“智能+”:加什么，怎么加?
文章指出“智能+”是给千行百业植入新时代基因，中国智能经济处于爆发前夜。需厘清“加什么”和“怎么加”。“加什么”包括新认知、新数据、新技术；“怎么加”涵盖拓展云上智能、重建数字信任、培育π型人才、全员AI Native、确立新机制。最后提到将形成智力即服务新形态，智能+如同竹子生长，待条件成熟将迎来产业升级奇点。

[腾讯研究院] 凯文·凯利 2049年预言科技趋势

关于2049年，凯文·凯利的85个预言
《连线》杂志创始主编凯文·凯利在《2049》中提出未来5大核心概念。到2049年，多数智能手机将被智能眼镜取代，形成镜像世界。人机互动方式改变，AI助理将普及。职场方面，“人+机器”模式凸显，中层管理受冲击大。AI催生商机，如太空经济等。内容井喷，创作者需做好自己并找粉丝。教育、医疗等领域也有变革，科技在机器人、太空等五大领域将大爆发。

[追问nextquestion] AI 动物语言跨物种交流

AI听懂的，究竟是动物的语言，还是人类的想象?
文章围绕AI解析动物语言展开。目前利用AI解析动物语言尚处起步阶段，虽取得一定成果，如发现抹香鲸语音字母表、大象用名字称呼彼此，但破译难度大，要理解交流背景和细微差别。AI赋能体现在处理数据、揭示模式、推动跨物种理解。不过，存在内容生成偏向人类、训练数据不足等问题。未来或可通过多模态模型等实现“人 - 动物对话”，但这不仅是技术问题，还涉及认知、伦理与文化挑战。

[十字路口Crossing] AI 创业产品

2025过去一半了， AI带给我的9个Aha Moments
这是 Koji 在年中分享的 AI 领域 9 个 Aha Moments。2025 年 AI 行业迅速进化，如 DeepSeek 从默默无闻到开源带来公平竞赛机会。文中还提及 Manus 快速迭代的成功、对“汤姆猫”类产品的思考、AI Agent 的潜力等。此外，作者强调不要盲目追风口，要回归用户需求，还指出设计、情绪价值在 AI 时代的重要性，呼吁在科技与人文的十字路口寻找伟大产品。

[新智元] OpenAI 微软 AGI

独家揭秘OpenAI核心文件:AGI五级突破实锤!微软130亿投资或打水漂
文章围绕OpenAI与微软在AGI问题上的争议展开。Ilya Sutskever曾预言AI潜力大但失控后果严重，OpenAI创立初衷是让AGI造福人类。微软投资超130亿美元，合同规定OpenAI宣布实现AGI，微软技术授权或受限。《通用人工智能能力的五个等级》论文将AGI实现视为渐进光谱，划分AI能力为五级。OpenAI发展快，微软焦虑，双方陷入AGI定义权之战，论文未公开，谈判艰难。

[新智元] GPT - 5 OpenAI AI风险

OpenAI员工爆料:已抢先体验GPT-5!7月上线，疑似完全多模态
文章围绕GPT - 5展开，多位人士爆料提前体验，网友也有灰度测试经历。奥特曼确定今年夏天发布，称其可能完全多模态。此外还提及GPT - 4.5预训练相关知识，OpenAI华人科学家谈AGI之路。最后，听证会上专家预测AI时间表与风险，主张政府建评估机构、采取“三P战略”应对。

[InfoQ] 00后创业者 AI产品 Cluely

十周前才写下第一行代码，如今颠覆 9 个行业?员工人均 10 万粉，00 后创业者狂言:我们将超越 OpenAI
本文围绕 00 后 AI 创业者 Roy Lee 及其产品 Cluely 展开。Roy 从普通大学生逆袭，Cluely 获高额融资、估值达 1.2 亿美元且已盈利，但也引发争议。对话中，Roy 讲述成长经历、创业缘由，称掌握算法玩转平台实现病毒式传播，以内容吸引用户决定产品方向。他认为分发比传统营销有效，相信 Cluely 分发机制能超越 OpenAI，还强调真实是成功关键。

[Fun AI Everyday] Product Hunt AI应用 2025趋势

深度解读 | Product Hunt 2025 最佳 AI 应用
本文深度解读Product Hunt 2025最佳AI应用。该平台是新产品发现平台，聚集多方用户。截至6月关注度TOP10的AI产品覆盖多场景。介绍了Tana、Chronicle等6款核心AI应用特点。还指出2025 AI应用趋势，如融入核心生产力场景、任务自动化等。这些应用正从新奇走向务实高效，重塑工作方式，展示了AI作为“生产力新基建”的潜力。

[硅星人Pro] Kimi Researcher AI Agent 端到端强化学习

Kimi Researcher团队自述:Agent不是缝合怪，它就是模型(附内测名额)
文章介绍Kimi Researcher，它是月之暗面首个AI Agent，开启内测，可生成带引用的深度研究报告。其采用端到端强化学习，区别于主流“工作流”模式，虽面临环境不稳定等挑战，但通过技术创新提升训练效率。该模型在Humanity's Last Exam中成绩优异，还呈现智能“涌现”现象。此外，文章列举其在尽调搜索、知识梳理等多场景的应用，产品后续会更新开源。

[PaperAgent] 大语言模型集成北航综述

告别单一大模型依赖!北航等机构发布综述:大语言模型集成(LLM Ensemble)
北航等机构发布综述介绍大语言模型集成（LLM Ensemble）。因单一LLM有性能问题且不同模型擅长领域等有差异，LLM Ensemble综合多模型优势。文章将其方法分推理前、推理时、推理后三大范式共七大类，对各类方法研究工作深入分析。还从集成策略、粒度和目标总结分析，提出更具原则性片段级、精细化无监督非级联、通用级联式推理后集成等未来研究方向。

[海外独角兽] FutureHouse AI for Science 科研自动化

FutureHouse 联合创始人:AI Scientist 不是“全自动化科研”
本文是对 FutureHouse 联合创始人 Andrew White 的专访。他介绍自己从化学工程进入 AI for Science 领域的经历。FutureHouse 聚焦科研自动化，开发多个 AI 科研 agent，构建科研 API。他认为生物比化学更具平台化潜力，科研自动化不会 100% 替代人类，AI 可辅助科研。还探讨了 AI 在生物科学研究中的应用，如计算预测、多组学数据学习等，对部分方向持保留态度，也提及 FutureHouse 后续计划。

[微软亚洲研究院] AI 医疗健康医学研究

对话 | 比尔·盖茨、Peter Lee与OpenAI研究负责人:AI将如何重塑医疗健康及医学研究的未来
本文是微软研究院播客节目对话节选，比尔·盖茨、Peter Lee与OpenAI研究负责人探讨AI对医疗健康及医学研究的影响。认为AI可协助记录、处理文书、提建议，改善就诊体验，在回访中也价值大。虽有进步，但仍面临幻觉、缺乏基准测试等问题。还讨论了模型训练、专业化、替代情况等，预测未来两年有大规模试点，AI辅助作用将增强。

[Founder Park] AI Coding TRAE AI IDE

TRAE 如何思考 AI Coding :未来的 AI IDE，是构建真正的「AI 工程师」
文章围绕TRAE对AI Coding的思考展开。先介绍编程语言发展是不断抽象求简的过程，AI Coding正酝酿飞跃。接着指出好的AI IDE需模型、产品、工程能力结合，TRAE旨在构建AI工程师。还介绍TRAE核心功能，如代码补全、自然语言写代码，其月活已超百万。最后通过案例说明AI虽助力开发，但仍需用户手动操作，为此TRAE推出Solo模式，期望实现AI做开发与流程重构。

周刊

国内

火山引擎存储 AI 体验走查 用户体验

[ByteDance Web Infra] Rspack Web 开发 字节跳动

数据库 VIDEX 字节跳动

[火山引擎] 豆包 火山引擎 RTC

[货拉拉技术] JS SDK 测试方案 AI代码生成

[腾讯技术工程] Android APK优化 UE项目

[阿里云开发者] Cursor编程 AutoGPT Claude4.0

[阿里云开发者] AI workflow MAS 多智能体协作

[阿里云开发者] 数据分析 评估体系 DataV - Note

淘宝直播 数字人 TTS语音合成

[大淘宝技术] 淘宝直播 数字人 弹幕互动

支付系统 架构设计 腾讯云

小红书 奖励模型 大语言模型