227

预见 2049 & 目前AI最重要的影响

国内

火山引擎存储 AI 体验走查 用户体验

AI 体验走查 - 火山引擎存储的 AI UX 探索之路
火山引擎存储技术团队借助 AI 开展用户体验走查与可用性测试。传统人工走查有低效、覆盖有限等问题,团队基于 Midscene.js 和 Doubao - 1.5 - thinking - vision - pro 打造全自动交互体验走查系统,实现自主执行和专业评价,维护成本低。系统已落地多个产品线,节省人力、提高问题发现率。未来计划实现自动生成用例、减少辅助步骤、用户分层和探索边界场景等。

[ByteDance Web Infra] Rspack Web 开发 字节跳动

Rspack 1.4 发布:支持在浏览器中运行
Rspack 1.4 正式发布,带来诸多新特性。新功能包括支持在浏览器运行、更快的 SWC、更小构建产物、默认启用增量构建、新增 CssChunkingPlugin 等。Rstack 方面,Rsbuild 1.4、Rslib 0.10 发布,Rspress 2.0 处于 beta 版,Rsdoctor 推出 MCP,Rstest 发布。生态系统中 next - rspack 稳定性提升,Kmi 带来性能提升。升级指南涉及 SWC 插件和 lazy compilation 中间件的升级。

数据库 VIDEX 字节跳动

字节跳动 ByteBrain 开源 MySQL 虚拟索引 VIDEX:让 AI+DB 也能大规模落地
文章介绍字节跳动 ByteBrain 开源的 MySQL 虚拟索引项目 VIDEX。虚拟索引可模拟索引方案效果,助用户确定最优方案,但 MySQL 此前缺乏该能力。VIDEX 可无缝集成 MySQL 生态,弥补其虚拟索引空白,能高精度拟合 MySQL,支持多形态部署,有可拓展实验平台。还介绍其多种形态应用、接入算法方法、使用步骤及效果,展示其架构并给出作者团队联系方式。

[火山引擎] 豆包 火山引擎 RTC

豆包视频通话背后:RTC打造AI交互体验护城河
豆包 APP 全新「视频通话」功能实现「拍问即答」,标志 AI 交互进入「视听协同」时代,其核心技术是火山引擎 RTC。RTC 能破解多模态传输难题,通过多种抗拥塞能力及端到端传输优化,提升视频传输稳定性与抗弱网能力。实测显示,RTC 在弱网环境下稳定性远超 WebSocket。此外,火山引擎推出对话式 AI 一站式解决方案,具备低延时、智能语义判停和声纹降噪等能力,可实现自然打断体验。

[货拉拉技术] JS SDK 测试方案 AI代码生成

JS SDK一体化测试方案的快速实践
文章介绍货拉拉JS SDK一体化测试方案。因SDK测试场景复杂、接口多、代码编写负担重,搭建了测试平台。从框架搭建统一测试版本、部署等;功能测试整理对象与方法,拆分页面和用例;接口自动化选Jasmine框架;性能测试设计场景、采集数据;智能测试代码用DeepSeek V3生成。该方案提升测试效率与质量,未来将在平台、测试和智能化方面优化。

[腾讯技术工程] Android APK优化 UE项目

极致优化Android平台APK的大小
文章围绕优化Android平台APK大小展开。先分析APK内游戏相关空间占比大的部分,提出压缩NativeLibs、优化代码体积、优化数据、重定位表压缩、资源裁剪等策略。如压缩NativeLibs可控制so压缩,代码体积优化针对libUE4.so等;重定位表压缩分SDK 28和23版本处理;资源裁剪涉及第三方组件和游戏内资源。经优化,so大小和运行时内存显著降低,APK从1.23G降至130M。

[阿里云开发者] Cursor编程 AutoGPT Claude4.0

深入解析|Cursor编程实践经验分享
本文是近两个月Cursor编程实践总结。介绍了Cursor使用方法,如标准Prompt、好用Rules、合理开发流程和有帮助的mcp,还给出不同任务的Prompt示例。分享了多种Rules,像项目梳理、技术方案设计、中间件调用等。提到MCP可提升工作流畅度。指出Cursor在大需求上效果不稳定,引入DeepResearch,介绍AutoGPT原理、终止机制和内置Prompt,最后介绍Claude4.0新功能。

[阿里云开发者] AI workflow MAS 多智能体协作

workflow is all you need?探讨乐高式流程编排能否实现任意Multi-Agent模式
文章探讨AI workflow产品能否支持任意MAS设计模式。以Dify为例,介绍用核心组件实现单Agent及路由、顺序、主从等多种多智能体协作模式,还提及嵌套模式可实现乐高式组合。但目前主流AI workflow产品存在局限,如无法支持完全异步群聊、动态智能体添加和并行化MOA仿神经网络模式,期待未来有更优的多智能体研发产品。

[阿里云开发者] 数据分析 评估体系 DataV - Note

如何让AI写出高质量的数据分析报告?DataV-Note的评估体系揭秘
文章围绕DataV - Note智能分析创作平台的评估体系建设展开。先指出当前智能工具缺乏统一评估标准和准确性争议问题。接着阐述评估模型,包括目标确立如产品验证等,初步设计涉及选用Qwen模型及关键细节,还建立纵向和横向评估标准。最后给出未来规划,如接入自动化和利用评估模型提高准确度,强调大模型在数据分析精准把控上有挑战。

淘宝直播 数字人 TTS语音合成

淘宝直播数字人:TTS语音合成技术
文章是淘宝直播数字人TTS语音合成技术实践总结。先介绍TTS在数字人直播场景的关键作用,接着围绕直播数据语料构建、模型优化等探索。语料构建搭建数据处理管线,经语音信号处理、语音理解、说话人聚类提高训练数据质量;模型优化从前端正则化、多音字处理,后端架构、发音、韵律情感等多方面迭代,还探索CosyVoice架构融合,最后提及未来展望和团队情况。

[大淘宝技术] 淘宝直播 数字人 弹幕互动

淘宝直播数字人:LLM弹幕互动技术
文章是淘宝直播数字人 LLM 弹幕互动技术实践总结。介绍数字人链路含 CV、TTS、LLM 模块,阐述弹幕互动两种形式。详述互动架构各模块,如预置库匹配、意图识别等。多轮意图识别模型表现优异,实体解析模块解决复杂场景问题。还介绍回复生成模块及训练数据,最后提出后续规划,包括千人千面、多模态融合等,团队已搭建 AI 技术矩阵服务商家。

支付系统 架构设计 腾讯云

如何设计一个支付系统丨架构师系列文集
本文是腾讯云架构师系列文集首篇,分享支付系统经典设计。先介绍支付系统在电商交易平台的重要作用,阐述其与核心交易系统架构特点,包括各模块功能及设计要点。接着说明交易系统链路优化,涵盖业务校验、接单等功能。还讲述对账系统设计,涉及概述、需求分析,如数据关系、对账维度和结果输出模式。最后强调支付系统监控重要性,架构设计是动态过程。

小红书 奖励模型 大语言模型

万字干货:小红书 hi lab 团队关于奖励模型的一些探索
本文是小红书hi lab团队关于奖励模型的探索。团队针对奖励模型评估、多模态RM泛化、中文奖励模型数据缺乏、大模型推理及幻觉缓解等问题展开研究。如提出新评估方法、构建捷径感知MM - RM、创建CheemsBench和CheemsPreference、设计Critic - CoT和CodePMP方法、提出RLFH框架等,还给出实验结果并总结各研究意义,最后介绍团队成员、岗位等信息。

[得物技术] 大模型开发 Java Spring - AI

给Javaer看的大模型开发指南|得物技术
文章为Java开发者提供大模型开发指南。介绍大模型特点,如无状态、可结构化输出、支持函数调用。阐述大模型接口输入输出及常见供应商API。提到RAG架构解决私域信息问题,MCP协议促进大模型与传统系统交互。重点讲解Spring - AI的模型抽象、聊天会话、RAG拓展等,还给出代码示例。最后以“DJob智能助手”为例开发智能体,助开发者理解大模型工程化。

[得物技术] AI协作规范 得物技术 代码生成

Cursor Rules优化实战:构建高效稳定的AI代码生成规范体系|得物技术
文章围绕Cursor Rules优化实践,阐述构建AI代码生成规范体系。先指出旧版Rules存在规则冗余、提示词冲突、维护困难等痛点。接着介绍新版设计理念为分层架构、职责分离、按需调用,采用三层结构。详细剖析各层设计,基础层拆分文件,模块层按架构分层,流程层针对业务场景。还给出最佳实践,包括快速开始步骤和分阶段实施计划。最终总结该体系优势,可推广到其他AI协作工具。

[DAMO开发者矩阵] 医疗科技 多模态大模型 达摩院

探索医疗科技的未来:达摩院在多模态大模型领域的创新尝试
本文围绕达摩院医疗多模态大模型展开。当前多模态大模型在医疗领域面临知识局限、幻觉频现、推理匮乏、评测标准不统一等挑战。达摩院从数据构造、模型训练、评测框架三方面探索,构建高质量数据,采用多阶段训练范式,开发MedEvalKit评测框架。模型在多项测试中成绩领先,超越主流模型。未来将在数据构建、基准完善、能力扩展、训练策略优化和评估指标引入等方向突破。

[InfoQ] FreeWheel ChatBI 视频广告数据分析

从0到1拆解FreeWheel ChatBI:大模型如何重塑视频广告智能数据分析新生态
本文结合 FreeWheel 实践,介绍 ChatBI 系统核心功能与技术。功能有数据查询可视化、交互式分析、仪表盘导航、知识问答和多轮对话。技术上,用 Prompt + RAG 让 LLM 理解业务,智能选表和 Text2SQL 实现数据查询,涵盖 300 余张表,选表和 SQL 生成准确率高。智能分析构建算法服务,融合 Workflow 和 Agent。系统基于 LangGraph 搭建,引入用户反馈闭环。上线后获好评,后续将持续优化提升。

[黑夜路人技术] AI编程助手 Roo Code Cursor

Roo Code 与 Cursor 体验对比
随着AI技术发展,AI编程助手成开发者常用工具。文章介绍Roo Code 3.19改进,如智能上下文管理。其提示词系统分层配置,有多种模式。还对比Roo Code与Cursor,Roo Code在API控制有透明度优势,代码定位精准但Diff View不直观;Cursor内联对话便捷但Apply功能处理长代码欠佳。Roo Code免费且可自定义API,两者各有优劣,开发者可按需选择。

[InfoQ] React Vercel 框架推荐

React 被指“沦为 Vercel 打工仔”,力推框架只为圈钱?核心成员亲自下场回应却遭群嘲
近日,Mark Erikson 分析 React 及社区现状。虽 React 及其相关框架是构建应用主流方案,但生态复杂破碎,社区不满多。外界质疑 Vercel 主导 React 发展以盈利,Erikson 认为是 React 团队‘接管’Next.js。RSC 因架构复杂,需与框架集成。Next 非唯一适用框架,其他框架也在努力。React 团队推荐用框架,有合理性但未尊重使用方式多样性,社区对此有不同看法。

[机器学习AI算法工程] 机器学习 AI算法 RAG与MCP集成

如何实现RAG与MCP集成
文章围绕RAG与MCP集成展开。先介绍RAG优势及传统架构瓶颈,引出Agentic RAG,其智能代理实现多方面突破。MCP为AI工具集成提供标准,有记忆增强等功能。二者结合的系统架构含四大组件,运行时代理调度资源。集成需多步骤,还阐述查询扩展、数据更新存储等内容,最后给出代码示例。

[机器之心] LLM领域 重要论文 Transformer

盘一盘,2017年Transformer之后,LLM领域的重要论文
本文盘点2017年Transformer之后LLM领域重要论文。先介绍奠基理论,如Transformer架构、GPT - 3能力、RLHF方法等;再提及里程碑突破,像GPT - 4多模态能力、LLaMA推动开源;还阐述核心架构与方法,如Mamba、QLoRA等;最后列出重要优化与应用、前沿探索与新趋势相关论文,展现LLM领域发展脉络。

[快手技术] 快手 Kwai Keye-VL 多模态大模型

快手开源多模态大模型Kwai Keye-VL,引领视频理解新纪元
2025年6月26日,快手开源多模态大模型Kwai Keye-VL,采用VisionEncoder - Projector - LLM架构。该模型以Qwen3 - 8B为基础,能融合处理多模态信息,逻辑推理和视觉理解能力强,高考数学卷获140分。其训练分预训练、后训练,有架构优化策略。评估显示它在多方面领先,应用表现出色,未来在视频理解有独特优势,快手还发布招聘信息。

[奇舞精选] 开悟AI 应用开发 严肃编程

严肃编程时代已来!智领·开悟 AI Team,一键生成高水准专业应用!
文章介绍「开悟AI」这一自然语言生成应用平台,它倡导「严肃编程」,与「氛围编程」划清界限。开悟AI能解决开发应用门槛高、现有产品不实用等问题,通过SOP标准化流程、AI Team协作等机制,可按需生成专业应用。其功能丰富,还集成主流工具构建生态。未来,开悟AI将在Agent生态、代码安全等方面持续进化,助力用户高效开发。

[Thoughtworks洞见] 软件工程 AI辅助研发 软件危机

先理解软件工程,再谈AI辅助研发 | 警惕AI浪潮下的新“软件危机”
文章指出在AI辅助研发热潮下,需先理解软件工程。软件工程诞生是为解决“软件危机”,强调管理复杂性和全生命周期健康。若开发者缺乏软件工程思维用AI,会有输入垃圾、架构混乱等问题。企业应分四步将AI融入工程体系,即建立研发规范、打造DevOps平台、精准引入AI、推广演进研发模式,同时重塑人才体系,避免新“软件危机”。

[前端生存指南] Cline 代码索引 RAG

为什么 Cline 不会索引你的代码库
文章探讨 Cline 不索引代码库的原因及优势。指出传统 RAG 用于代码库有问题,如代码无法块状理解、索引随代码演变失效、存在安全隐患。Cline 则像资深工程师一样对待代码库,通过探索建立上下文,能生成高质量上下文,提供契合架构的建议。虽简单关键词匹配可能慢,但能让 AI 真正理解代码,且当下强大语言模型使此方法可行。

[前端充电宝] JavaScript 开源项目 奖项

2025 年度最佳 JS 开源项目揭晓,竟然是它?
2025年6月12日JS Nation盛会落幕,揭晓多个JavaScript开源项目重要奖项。年度突破奖得主是Rolldown,表彰推动生态前进的新概念项目;最具技术想象力奖为TanStack Form,奖励拓展表达力的项目;开发效率提升奖是Zod,表彰提升开发者体验与效率的工具。各奖项均有提名项目。

国外

PNG 图像格式 规范更新

PNG is back!
PNG新规范发布,重焕光彩。新技术发展促使其复活,W3C等多方参与。新特性包括支持HDR,仅用4字节;认可APNG动画;支持Exif数据;修正错误、明确规范等。常用程序如Chrome、Safari等已支持。后续会改进HDR与SDR互操作性,研究压缩更新。

空间网络 HTML模型元素 USDZ文件

A step into the spatial web:
文章介绍了 visionOS 26 对空间网络重要构建块 HTML 元素的重大更新。 元素默认启用,有新 API。它能让网站轻松展示 3D 模型,用户可旋转查看。文章还介绍了其相关特性,如 ready Promise、orbit 模式、entityTransform 属性、环境光照管理、动画控制等。此外,提到了使用 USDZ 文件的方法,以及该功能的状态和反馈渠道。

网络机器人 检测技术 验证码

A short history of web bots and bot detection techniques
文章介绍网络机器人及其检测技术演变。简单机器人仅用HTTP客户端发请求,易被检测。检测方法包括查IP声誉、代理,进行TCP和TLS指纹识别等。机器人开发者用代理、修改用户代理应对。JavaScript能收集信息辅助检测。无头浏览器曾易被识别,新无头模式更难察觉。此外还有验证码、工作量证明、行为分析等检测手段,先进的还会用AI分析行为。

Vite7 前端工具 发布

Vite 7.0 is out!
Vite 7.0发布,距首个提交已5年,每周下载3100万次。今年ViteConf将线下举办,VoidZero推进Rolldown以升级Vite核心,还与NuxtLabs合作开发Vite DevTools。Vite 7要求Node.js 20.19+或22.12+,默认浏览器目标变更,Vitest 3.2支持Vite 7。新增buildApp钩子,移除部分弃用特性。官方鼓励测试新API并反馈。

JavaScript TC39提案 Deno

What's coming to JavaScript
Deno公司致力于推动JavaScript发展,参与TC39标准委员会。TC39第108次会议推进9项提案,涉及4个阶段。阶段4有显式资源管理、Array.fromAsync、Error.isError;阶段3为不可变ArrayBuffer;阶段2是Random.Seeded和Number.prototype.clamp;阶段1包括保留尾随零、比较和随机函数。这些提案将使JavaScript资源管理更安全、异步操作更简单、数值处理更方便等,下次TC39会议9月下旬举行。

Swift Android 跨平台

Swift 官方正式支持 Android,iOS 的跨平台春天要来了吗?
近日 Swift 官方宣布成立 Android 工作组,将 Android 列为官方支持平台。其通过 LLVM 适配,借助 Android NDK 实现跨平台编译。目前核心标准库已能在 Android 编译,Foundation 和 Dispatch 等正在移植,但 UI 部分官方暂未提供支持。交互上需自行实现桥接绑定,Swift on Android 目前较毛坯,在交互和 UI 方面欠缺,iOS 的跨平台春天还需等待。

[iOS新知] iOS开发 Swift Android

iOS 开发者要失业了?Swift 进军 Android 背后的真相
6月26日Swift官方成立Android工作组。Swift发展快,苹果想让其“全平台通吃”。工作组工作包括让Swift在安卓原生支持、改造核心包等。此事影响大,优点是生态强大、找工作选择多、有望一套代码打天下;压力是iOS开发独特性降低、要学安卓知识、竞争更激烈。工作组成员来头大,官方称6.2和6.3版本会支持安卓,开发者应迎接挑战。

[AndroidPub] Google AI开发技术栈 学习路径

Google 的 AI 开发技术栈学习路径
本文介绍了 Google 的 AI 开发技术栈学习路径。涵盖基础模型如 Gemini、Gemma 家族;开发工具与平台有 Google AI Studio、Gemini API;开发框架包括 Keras、JAX、Tunix;基础设施有 XLA、LLM - d 项目;边缘计算方面是 Google AI Edge。还展望未来,提及 AlphaEvolve、AI co - scientist、Gemini 机器人模型等创新方向,展现了 Google 在 AI 领域的领先实力,助开发者构建创新应用。

[深思圈] AI coding Amp 编程工具

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起
文章介绍AI coding黑马Amp。它由Sourcegraph推出,与Claude code同列S级。Amp开发过程独特,以播客开源。其有颠覆性产品哲学,如少即是多;对模型深度理解,与之共舞;构建反馈循环;引入子代理。还探索背景代理,重新定义编程时空。未来编程工作流将从工具到伙伴。Amp成功源于技术驱动、深度聚焦等底层逻辑,预示编程新时代到来。

[谷歌开发者] AI 智能体 Langbase Gemini 模型

强强联合 | 借助 Langbase 和 Gemini API 构建可扩展的 AI 智能体
文章介绍借助 Langbase 和 Gemini API 构建可扩展 AI 智能体。AI 智能体发展迅速,为开发者带来新可能。Langbase 可助力构建、部署和扩展智能体,其与 Gemini 模型无缝集成。使用 Gemini 模型构建智能体有性能卓越、效率提升、成本低、吞吐量高的优势。Langbase 简化开发者工作,二者结合能让开发者构建新智能应用,可查看相关研究深入了解。

[InfoQ] 谷歌 Gemini CLI AI编程

一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
谷歌发布 Gemini CLI,其免费使用配额慷慨,支持多平台,开源且获 15.1k 星。与 Claude Code 等对比,它功能丰富,可与编辑器搭配。其接入 Gemini 2.5 Pro 通用模型,产品和研究负责人认为通用模型更适合多数开发任务。开发者反馈其代码生成和理解能力提升显著,在大项目中表现优于 Claude Code,谷歌在代码能力上或实现赶超。

[CSDN] Google Gemini CLI AI编码工具

Google重磅出招!Gemini搬进终端,发布开源神器Gemini CLI:免费、百万上下文、每天千次调用
2025年6月26日,Google将旗舰AI模型Gemini带进终端,发布开源工具Gemini CLI。它免费,用Gemini 2.5 Pro模型,百万上下文长度,每天可调用千次。其功能丰富,能在终端多方面提供帮助,还可与Code Assist集成。该工具完全开源,获不少关注。不过,围绕它存在争议,有人认为提效,有人质疑弊端,还有实测显示它易被‘越狱’且主动升级攻击。

[独立开发] Claudia AI编程 GUI工具

告别命令行! Claude Code终于有图形化界面了(附稳定解决方案)
文章介绍Claude Code有了图形化界面。Claude Code命令行操作对非工程师不友好,YC支持的开源项目Claudia解决了此痛点。Claudia是为Claude Code设计的GUI应用及工具包,由Asterisk开发,理念是“隐私优先,本地优先”。它有交互界面、积分使用面板、Agent管理等功能,为开发者提供便捷高效且注重隐私的AI交互环境,还降低了AI技术应用门槛。作者创建交流群并提供稳定方案咨询。

产品/设计

58同城 icon设计 视觉升级

“大方无隅”-58改版设计icon篇
2024年58同城完成产品视觉升级,确定设计理念。此次icon设计从“大方无隅”获灵感,从五维度展开:形态上融合方圆;与业务专属符号结合;用弧线曲线;表意选普遍认知形象、注重细节和情感共鸣;色彩拓展体系并关联业务;搭建视觉层级、适配不同场景;还制定规范并科学验证。图标虽小却能量大,未来将继续创新带来优质体验。

[信息与交互设计研究所] 计算机视觉 信息交互设计 应用案例

计算机视觉|赋予感知与认知能力
计算机视觉是让计算机从图像或视频中获取、处理信息,赋予机器感知与认知能力的技术。其应用广泛,变革众多行业。文中介绍了相关应用案例,如Virtual Realms:wall利用计算机视觉捕捉动作、记录活动;Agro拖拉机借助雷达、传感器和摄像头完成任务;NOVA太空酒店机器人能收获食材、运送食物;BéKKU可让家人互动、防护家庭安全、检查身体等。

[体验进阶] 淘宝AI官网 生意管家 AI作图工具

淘宝AI官网换掉老土的科技蓝后,高级多了
文章介绍淘宝AI官网升级。生意管家是淘宝官方商家AI工具,但使用门槛高。此次围绕官网首页和AI作图工具展开优化。官网首页重构框架、拓展内容承载空间,用微动效与鼠标交互反馈展示AI能力。AI作图工具升级采用操作路径清晰、节点衔接连贯、交互自然友好、视觉工整简约、框架体验一致的策略,降低上手难度,满足商家需求,将复杂技术转译为易上手工具。

[信息与交互设计研究所] AI设计 设计产品 创意变革

AI生成设计:揭秘未来设计的无限可能
文章指出设计行业正处技术革命浪潮,AI生成设计产品从实验室走向大众,挑战人类创意垄断,重新书写设计本质。接着介绍多款AI设计产品,如Tablin老年护理机器人、Keepy家庭运营机器人、Legit助行器、WAGGY WITH ME车载项目,它们分别在老年护理、家居运营、医疗康复、人车宠物关系等领域发挥作用,利用AI技术带来新变革。

[58UXD] 58 同城 设计项目 交通媒体

拆解 2025 爆款设计!特殊交通媒体如何让品牌 “成” 风破浪
本文介绍 2025 春战换刊项目,春节期间品牌营销竞争激烈,58 同城突出新口号“事事可成 58 同城”。项目以“扫码”为核心,“码”为创意内核。地铁通道设计对“码”深度雕琢诠释品牌理念;武汉轻轨设计考虑空间与体验,强化品牌理念。设计还注重本地化表达。提案阶段创意丰富,完稿严谨。通过模块化设计实现复用延展,兼顾效率与传播效果,是团队协作的成功实践。

行业/思考

[腾讯研究院] 智能+,腾讯研究院,产业升级

万字解读“智能+”:加什么,怎么加?
文章指出“智能+”是给千行百业植入新时代基因,中国智能经济处于爆发前夜。需厘清“加什么”和“怎么加”。“加什么”包括新认知、新数据、新技术;“怎么加”涵盖拓展云上智能、重建数字信任、培育π型人才、全员AI Native、确立新机制。最后提到将形成智力即服务新形态,智能+如同竹子生长,待条件成熟将迎来产业升级奇点。

[腾讯研究院] 凯文·凯利 2049年预言 科技趋势

关于2049年,凯文·凯利的85个预言
《连线》杂志创始主编凯文·凯利在《2049》中提出未来5大核心概念。到2049年,多数智能手机将被智能眼镜取代,形成镜像世界。人机互动方式改变,AI助理将普及。职场方面,“人+机器”模式凸显,中层管理受冲击大。AI催生商机,如太空经济等。内容井喷,创作者需做好自己并找粉丝。教育、医疗等领域也有变革,科技在机器人、太空等五大领域将大爆发。

[追问nextquestion] AI 动物语言 跨物种交流

AI听懂的,究竟是动物的语言,还是人类的想象?
文章围绕AI解析动物语言展开。目前利用AI解析动物语言尚处起步阶段,虽取得一定成果,如发现抹香鲸语音字母表、大象用名字称呼彼此,但破译难度大,要理解交流背景和细微差别。AI赋能体现在处理数据、揭示模式、推动跨物种理解。不过,存在内容生成偏向人类、训练数据不足等问题。未来或可通过多模态模型等实现“人 - 动物对话”,但这不仅是技术问题,还涉及认知、伦理与文化挑战。

[十字路口Crossing] AI 创业 产品

2025过去一半了, AI带给我的9个Aha Moments
这是 Koji 在年中分享的 AI 领域 9 个 Aha Moments。2025 年 AI 行业迅速进化,如 DeepSeek 从默默无闻到开源带来公平竞赛机会。文中还提及 Manus 快速迭代的成功、对“汤姆猫”类产品的思考、AI Agent 的潜力等。此外,作者强调不要盲目追风口,要回归用户需求,还指出设计、情绪价值在 AI 时代的重要性,呼吁在科技与人文的十字路口寻找伟大产品。

[新智元] OpenAI 微软 AGI

独家揭秘OpenAI核心文件:AGI五级突破实锤!微软130亿投资或打水漂
文章围绕OpenAI与微软在AGI问题上的争议展开。Ilya Sutskever曾预言AI潜力大但失控后果严重,OpenAI创立初衷是让AGI造福人类。微软投资超130亿美元,合同规定OpenAI宣布实现AGI,微软技术授权或受限。《通用人工智能能力的五个等级》论文将AGI实现视为渐进光谱,划分AI能力为五级。OpenAI发展快,微软焦虑,双方陷入AGI定义权之战,论文未公开,谈判艰难。

[新智元] GPT - 5 OpenAI AI风险

OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态
文章围绕GPT - 5展开,多位人士爆料提前体验,网友也有灰度测试经历。奥特曼确定今年夏天发布,称其可能完全多模态。此外还提及GPT - 4.5预训练相关知识,OpenAI华人科学家谈AGI之路。最后,听证会上专家预测AI时间表与风险,主张政府建评估机构、采取“三P战略”应对。

[InfoQ] 00后创业者 AI产品 Cluely

十周前才写下第一行代码,如今颠覆 9 个行业?员工人均 10 万粉,00 后创业者狂言:我们将超越 OpenAI
本文围绕 00 后 AI 创业者 Roy Lee 及其产品 Cluely 展开。Roy 从普通大学生逆袭,Cluely 获高额融资、估值达 1.2 亿美元且已盈利,但也引发争议。对话中,Roy 讲述成长经历、创业缘由,称掌握算法玩转平台实现病毒式传播,以内容吸引用户决定产品方向。他认为分发比传统营销有效,相信 Cluely 分发机制能超越 OpenAI,还强调真实是成功关键。

[Fun AI Everyday] Product Hunt AI应用 2025趋势

深度解读 | Product Hunt 2025 最佳 AI 应用
本文深度解读Product Hunt 2025最佳AI应用。该平台是新产品发现平台,聚集多方用户。截至6月关注度TOP10的AI产品覆盖多场景。介绍了Tana、Chronicle等6款核心AI应用特点。还指出2025 AI应用趋势,如融入核心生产力场景、任务自动化等。这些应用正从新奇走向务实高效,重塑工作方式,展示了AI作为“生产力新基建”的潜力。

[硅星人Pro] Kimi Researcher AI Agent 端到端强化学习

Kimi Researcher团队自述:Agent不是缝合怪,它就是模型(附内测名额)
文章介绍Kimi Researcher,它是月之暗面首个AI Agent,开启内测,可生成带引用的深度研究报告。其采用端到端强化学习,区别于主流“工作流”模式,虽面临环境不稳定等挑战,但通过技术创新提升训练效率。该模型在Humanity's Last Exam中成绩优异,还呈现智能“涌现”现象。此外,文章列举其在尽调搜索、知识梳理等多场景的应用,产品后续会更新开源。

[PaperAgent] 大语言模型集成 北航 综述

告别单一大模型依赖!北航等机构发布综述:大语言模型集成(LLM Ensemble)
北航等机构发布综述介绍大语言模型集成(LLM Ensemble)。因单一LLM有性能问题且不同模型擅长领域等有差异,LLM Ensemble综合多模型优势。文章将其方法分推理前、推理时、推理后三大范式共七大类,对各类方法研究工作深入分析。还从集成策略、粒度和目标总结分析,提出更具原则性片段级、精细化无监督非级联、通用级联式推理后集成等未来研究方向。

[海外独角兽] FutureHouse AI for Science 科研自动化

FutureHouse 联合创始人:AI Scientist 不是“全自动化科研”
本文是对 FutureHouse 联合创始人 Andrew White 的专访。他介绍自己从化学工程进入 AI for Science 领域的经历。FutureHouse 聚焦科研自动化,开发多个 AI 科研 agent,构建科研 API。他认为生物比化学更具平台化潜力,科研自动化不会 100% 替代人类,AI 可辅助科研。还探讨了 AI 在生物科学研究中的应用,如计算预测、多组学数据学习等,对部分方向持保留态度,也提及 FutureHouse 后续计划。

[微软亚洲研究院] AI 医疗健康 医学研究

对话 | 比尔·盖茨、Peter Lee与OpenAI研究负责人:AI将如何重塑医疗健康及医学研究的未来
本文是微软研究院播客节目对话节选,比尔·盖茨、Peter Lee与OpenAI研究负责人探讨AI对医疗健康及医学研究的影响。认为AI可协助记录、处理文书、提建议,改善就诊体验,在回访中也价值大。虽有进步,但仍面临幻觉、缺乏基准测试等问题。还讨论了模型训练、专业化、替代情况等,预测未来两年有大规模试点,AI辅助作用将增强。

[Founder Park] AI Coding TRAE AI IDE

TRAE 如何思考 AI Coding :未来的 AI IDE,是构建真正的「AI 工程师」
文章围绕TRAE对AI Coding的思考展开。先介绍编程语言发展是不断抽象求简的过程,AI Coding正酝酿飞跃。接着指出好的AI IDE需模型、产品、工程能力结合,TRAE旨在构建AI工程师。还介绍TRAE核心功能,如代码补全、自然语言写代码,其月活已超百万。最后通过案例说明AI虽助力开发,但仍需用户手动操作,为此TRAE推出Solo模式,期望实现AI做开发与流程重构。