239

公众号 AI Feed

公众号 AI Feed

国内

[大淘宝技术] 多模态AI 身份核验 身份证照片检测

多模态AI质检:身份核验场景实践
文章介绍多模态AI模型用于身份证照片质量检测实践。先说明业务背景,指出用户上传身份证常见图片问题影响体验和业务。引入多模态模型检测,对比其与OCR文字提取区别。实践中模型调用有幻觉、RT高、准确率和稳定性问题,采用对应方案。上线用多阶段发布策略,线上表现良好,OCR失败用户再次失败率下降、申请转化率提升。还提及模型计费,该实践在业务和技术上有诸多价值。

[大转转FE] 前端开发 Cursor AI辅助编程

188工时压到149!揭秘我们如何用Cursor让前端效率狂飙
文章介绍在会员系统前端开发引入Cursor辅助编程,整体效率提升21%。列举多个实践案例,如根据原型图生成路由、基于UI生成DOM结构、AI生成mock数据等,展示其提效作用;也指出在复杂交互、动效等场景中AI存在准确率低等问题。强调AI是‘高级代码助手’,未来应构建人机协同模式、沉淀上下文知识、重构研发流程,聚焦高价值创新。

[Lynx Family] Lynx 3.4 开发者工具 新特性

Lynx 3.4 正式发布
2025年9月17日,Lynx 3.4正式发布,延续双月发布节奏,Lynx 3.3为其奠定基础。该版本新增HarmonyOS适配、支持Windows开发环境,推出Trace和Recorder开发者工具,开源文本输入组件。还优化了回收策略,使动画更灵活,支持可变字体。开发者参照官网更新依赖版本即可完成升级。

[得物技术] MySQL DDL变更 表膨胀

破解gh-ost变更导致MySQL表膨胀之谜|得物技术
文章围绕 MySQL 表在 DDL 变更后出现的问题展开。业务在 OneDBA 平台变更后,表空间膨胀近 100%、统计信息偏差大、部分 SQL 慢查。作者先介绍索引结构、DDL 变更机制,指出变更机制与大记录叠加致页分裂瑕疵,使一页仅存一条记录。还分析统计信息出错及与慢 SQL 关联,最后给出临时和长期解决办法,如低峰期执行原生 DDL、调整变更流程。

[快手技术] 快手 电商搜索 OneSearch

快手端到端生成式搜索框架OneSearch,让搜索“一步到位”!
文章介绍快手端到端生成式搜索框架OneSearch。传统电商搜索架构有商品描述混乱、相关性差等问题。OneSearch有三大创新点:KHQE模块强化相关性,多视角策略建模用户偏好,引入PARS系统增强排序能力。经离线和在线测试,它在CTR、CVR等指标上表现优异,计算效率提升、成本降低,泛化能力好。未来团队将探索实时编码、强化学习及多模态特征应用。

[蚂蚁技术AntTech] 大模型 幻觉控制 强化学习

大模型幻觉控制技术分享
蚂蚁保险技术团队在幻觉控制方面取得进展,在公开幻觉榜单HHEM获Top 1,提升了模型事实遵循率。其用强化学习降低模型幻觉,数据上从预生成与打分、难度分层筛选、输入空间覆盖三方面切入;奖励设计以LLM - as - Judge为核心奖励,构建多维度奖励矩阵。该过程需动态迭代。通过“剪枝”理解RL降幻觉过程,要找平衡。实验验证方法有效,适合工业界推广。

[货拉拉技术] 货拉拉 大数据跨云迁移 技术方案

货拉拉离线大数据跨云迁移-综述篇
本文介绍货拉拉离线大数据跨云迁移项目。2023 年底启动,2024 年 5 月完成。公司大数据架构历经多次变迁,此次迁移规模大、架构复杂。设计了“可验证、可回滚”方案,包括基础设施搭建、数据迁移等步骤。实施中解决网络隔离、海量数据迁移等难题。项目成功完成,后续思考持续优化方案、提升自动化能力及积累云上技术选型经验。

[转转技术] 转转回收 大语言模型 智能问答系统

LLM在转转回收问答系统的主要应用场景及关键技术
转转深耕循环经济,其上门回收质检环节面临挑战,为此研发基于大语言模型的质检知识智能问答系统。文章围绕三大应用场景展开:意图理解通过闭环机制精准捕捉需求,结合语义与推理能力,有三重核心价值;RAG问答采用三层精炼架构,保障答案质量;知识库维护通过人机协同知识工厂,高效更新知识。三大场景环环相扣,构建持续进化的新一代问答系统。

[腾讯云TVP] AI编程 架构师夜生活 技术变革

当AI接管键盘,程序员的价值是什么?
软件开发领域因AI崛起变革,‘氛围编程’标志开发者与机器协作新时代。9月22日《架构师夜生活》直播聚焦AI时代技术人生存与进化。看点包括科班出身如何补AI课、企业构建团队看重什么、人类工程师不可替代的价值。还介绍了主持人和嘉宾,鼓励大家预约直播,与行业领袖探索技术突围路,重新定义价值。

[腾讯云开发者] HDR图片处理技术 腾讯云数据万象 技术规划

“闪瞎眼”的黑科技!HDR图片处理技术的现状与未来
文章介绍了HDR图片处理技术的现状与未来。HDR通过扩展亮度差异提升视觉效果,在电视等设备已广泛应用。现状需从生成和查看两方面看,目前部分手机芯片支持。技术上有10bit和Gainmap两种方案。处理HDR图片面临兼容性、复杂度等难题。腾讯云数据万象推出解决方案,优化处理。未来规划包括支持格式互转、生态打通及SDR转HDR。

[腾讯云开发者] Claude Code 无状态设计 AI编程助手

为什么Claude Code放弃代码索引,使用50年前的grep技术?
文章围绕Claude Code放弃代码索引、选用grep技术展开。先阐述状态本质,介绍无状态思想历史,如Unix管道、函数式编程等。接着说明无状态设计有可组合、并行自然、简单等优势。指出选择无状态或有状态是工程权衡,现实常混合使用。最后对比Claude Code与其他编程助手技术,表明其选择因零配置、确定性、隐私保障等优势,是Unix哲学现代传承。

[腾讯技术工程] 开源项目 维护经验 社区氛围

开源项目的死与新生!
文章围绕开源项目的生死展开。许多开源项目因各种因素走向死亡,作者分享延长项目生命周期的经验。指出开源目的影响项目寿命,开发者选择项目要考量其存活可能。还介绍评判项目优劣的方法,强调调研、避免重复造轮。当项目无法维护应及时承认并提供替代。维护项目要拥抱社区标准、有决策者、不怕犯错、支持渐进迁移,同时注重维护社区氛围,像做产品一样做项目。

[腾讯技术工程] 跨端开发 Kuikly框架 液态玻璃

腾讯开源框架 Kuikly 再升级!率先适配 “液态玻璃”,原生体验更极致
本文围绕腾讯开源框架Kuikly适配“液态玻璃”展开。先介绍“液态玻璃”是苹果UI设计重要演进,给跨端框架带来挑战。接着对比自绘渲染和原生渲染路线适配“液态玻璃”的差异,指出原生渲染优势明显。然后阐述Kuikly适配经验,包括原则、API设计、适配策略和兼容性保障。最后总结跨端框架应集成利用平台能力,Kuikly适配验证了其可将原生创新转化为优势。

[阿里云开发者] PolarDB Supabase 开发工具 高效开发

PolarDB Supabase 助力 Qoder、Cursor、Bolt.diy 完成 VibeCoding 最后一公里
文章介绍PolarDB Supabase助力开发完成VibeCoding。日常开发常被“摩擦力”打断,AI原生IDE也存在前后端上下文断层问题。PolarDB Supabase提供“零摩擦”后端基础,通过MCP Server填平断层。其引入Qoder + MCP工作流,让AI从“猜测”到“精通”,实现智能共创。还与bolt.diy集成,缩短“编码 - 预览”延迟。最后通过两段开发录屏展示工作流可运行性,鼓励开发者选择合适工作流开启创造。

[阿里云开发者] Agent架构 动态治理 AI应用

配置驱动的动态Agent架构网络:实现高效编排、动态更新与智能治理
文章提出配置驱动的独立运行时Agent架构,解决低代码/平台化Agent方案企业级落地难题。该架构汲取低代码配置化理念,独立进程部署满足企业需求。核心思想包括配置化定义、运行时组件更新等。还介绍AI注册中心、Agent Spec定义等。通过Agent Studio管控,执行引擎驱动,分布式部署。A2A协议实现Agent协作,动态治理促进与业务融合,最终提供通用标准化范式,提升AI业务价值。

[阿里云开发者] API协议 微服务 大模型

API协议全景图:从REST到MCP的选型指南
文章以开源项目 HiMarket 为背景,梳理六种主流 API 协议。RESTful API 应用广,但有局限;GraphQL 可按需取数,前端友好;微服务体系有 Apache Dubbo、gRPC、Spring Cloud 三种高性能方案;WebSocket 用于实时通信;大模型场景用 SSE;MCP 场景从 HTTP + SSE 升级到 Streamable HTTP。API 不断演进以平衡性能、灵活性和实时性,未来还会发展。

[阿里云开发者] 人工智能 Mem0 Milvus

Mem0 + Milvus:为人工智能构建持久化长时记忆
文章介绍了 Mem0 和阿里云 Milvus 结合为 AI 构建持久化长时记忆。Mem0 是 AI 智能体记忆层,能调取历史对话、精准记录偏好等。Milvus 是向量相似性搜索分布式数据库,适用于多种“相似性”匹配场景。通过两个实践说明了二者结合的应用:一是开发有记忆的 AI Agent,二是借助图谱引擎和向量引擎解析信息复杂关系,展示了其高效、可扩展的长时记忆解决方案优势。

[阿里云开发者] Cursor AI辅助编程 开发提效

30分钟轻松掌握Cursor,快速提升开发效率和体验
文章验证了Cursor利用AI大模型在WebX老项目中开发模块的有效性。介绍AI辅助编程高效用法,如让LLM生成方案、代码,多轮对话调整。阐述Cursor主页面分区及AI聊天区各区域功能。通过在老项目构建新功能和代码优化重构的实战,展示其提效能力,如十二轮对话生成项目主要内容,还提及可与MCP结合提升效率。

[KooFE前端团队] 前端开发 JSX 组件模型

超越 JSX:重新思考前端的组件模型
文章指出当前基于 JSX 的前端组件模型面临挑战,需重新思考。组件承受抽象重压,功能过载,导致脆弱性、性能下降和调试困难,应理清关注点。基于函数的 UI 模型难应对有状态、事件驱动的现实,现代框架有不同处理方式。将效果与 UI 放一起会产生耦合,应让服务等管理逻辑。结构组合不应依赖树嵌套,现代框架更灵活。还介绍了重新思考 JSX 编译和执行的框架,强调组件是基础,但要重新思考使用方式。

[京东技术] Prompt工程 大语言模型 电商风控

看我如何用Prompt工程将大模型调教成风控专家
作者作为交易风控算法工程师,分享将大语言模型调教成电商风控专家的过程。先遇传统审核难题,初始用大模型结果不佳。后分四阶段优化:一是给AI操作手册,实现流程自动化;二是注入业务常识,降低误报率;三是提升分析深度,让AI从订单级到团伙级分析;四是引入双假设裁决框架,使AI进化成风控专家。最后提炼出Prompt工程心法。

[58UXD] AI时代 设计师 破局实践

AI 时代,设计师如何破局?答案藏在这 3 个实践里
文章指出AI时代设计岗位受冲击,提出设计师破局思路。将传统线性工作流升级为“AI初筛+人工精修+数据验证”闭环模式,利用“漏斗法”聚焦需求。借助“人+AI”流程确定新设计风格并落地,将设计重点转至流量入口提升数据。搭建专属工作流,覆盖多数业务需求,提升生图精度和新人上手速度。打造人+AI设计知识库,未来计划推广“AI+设计”模式。

[TRAE.ai] 游戏开发 TRAE TapTap

零 Unity 经验卡牌策略游戏开发实录
零代码、零 Unity 经验开发者借助 TRAE 开发卡牌策略对战游戏。初期开发遇阻,后调整为三步开发策略,TRAE 生成代码模块化提升。落地细节上实现战斗双反馈、组合卡效果等。在 SDK 接入、隐私合规调整、64 位架构配置上,TRAE 助力完成上架流程。开发者总结经验,建议适可而止、及时保存、大胆推测小心求证。

[TRAE.ai] TRAE Figma 设计开发

从设计元素到可运行代码:TRAE + Figma MCP & SOLO 内置 Figma 工具
本期分享围绕 TRAE + Figma 展开。TRAE 与 Figma 结合是设计和开发领域流行用法。TRAE IDE 模式支持 Figma MCP、SOLO 模式内置 Figma 工具,能让 AI 获得完整设计上下文,将设计元素转化为可运行代码。TRAE 中国版和国际版 IDE 支持 Figma MCP,可从内置市场添加并配合智能体使用。SOLO 模式内置工具和窗口,能自动解析设计文件,转化元素为代码,还可通过提示词补充信息生成前端代码。

[TRAE.ai] 自动化测试 TRAE 测试用例生成

基于 TRAE 的自动化测试用例智能生成方案
本文介绍基于TRAE的自动化测试用例智能生成方案。团队有文本即自动化和自动化用例智能扩写两大需求。方案通过TRAE智能体调用Playwright MCP工具将测试步骤文本转化为Web UI操作,沉淀元素信息,再进行测试数据扩写,最后人工校准。还阐述用例生成、增强的具体方法,制定Pytest自动化测试开发规范,指出当前受模型思考次数限制,建议提升限制和支持连续任务执行。

[TRAE.ai] AI编程 TRAE SOLO 开发实践

AI 工具站开发:3 小时 SOLO,全栈开发+自动部署
本文作者分享用 TRAE SOLO 开发 AI 工具站的实践。TRAE 分国内、国际版,SOLO 模式 7 月新推出,可根据需求自动完成全流程。作者以开发含用户端和管理端的 AI 工具站为例,描述需求后,TRAE 生成产品和技术文档,自动化开发,支持调试、集成 Supabase 简化操作,还能一键部署上线,整个过程顺畅,体现 AI 提效。

[iOS新知] Swift 6.2 并发编程 性能优化

Swift 6.2 发布了,并发编程终于不再是噩梦
2025年9月17日Swift 6.2发布,其在并发编程上改进显著,采用单线程默认模式、优化async函数、引入@concurrent标记,避免数据竞争。还新增InlineArray和Span优化性能,Embedded Swift支持更多特性。开发工具更新包括VS Code扩展、编译警告控制等。此外,async调试改进、核心库更新,如Subprocess和Foundation NotificationCenter等,还支持WebAssembly编译,适合并发编程项目升级。

[前端充电宝] 前端开发 README.md AGENTS.md

还在死磕 README.md?你的前端项目更需要这个新玩意!
文章指出随着AI在开发中参与度增加,传统README.md在AI时代显得力不从心,新的文件规范AGENTS.md兴起。它由OpenAI提出,已被数万个开源项目采用,并非替代README,而是弥补其不足。AGENTS.md结构化、可执行、精炼高效,适合前端复杂开发场景,能分开处理人和机器需求,让代码更一致、提高效率、减少沟通成本,未来人和AI可分工协作。

[前端充电宝] 前端生态 pnpm 供应链攻击

前端生态屡遭攻击,pnpm终于出手了,上大分!
过去两年前端圈子供应链攻击频发,如账号被盗、依赖链被篡改等,‘追新’项目易中招。前几天 pnpm 发布 10.16 版,新增 minimumReleaseAge 功能,设置版本‘冷静期’,防‘零小时攻击’。还添加 minimumReleaseAgeExclude 配置和环境差异化设置。虽有安装慢等小问题,但能防攻击。此前也有工具提出类似思路,前端依赖管理已形成给版本留缓冲期的共识。

[Android 开发者] Android Canary 发布渠道 开发者

Android 预发布计划革新:Canary 发布渠道正式亮相
Android 开发者关系团队为更好支持开发者,对预发布计划重大改进,推出 Canary 发布渠道取代开发者预览计划,与 Beta 版计划并行。以往开发者预览模式有局限,如不关联发布渠道、仅早期可用等。Canary 渠道可让用户通过 OTA 持续接收更新,尽早试用新功能。适合想探索早期 API 的开发者,使用时可在 Pixel 设备或模拟器安装,还能通过 SDK 管理器获取 Canary SDK,要通过 Google 问题跟踪器反馈。

[AndroidPub] Android开发 BroadcastReceiver WorkManager

2025年,BroadcastReceiver 还有人用吗?
文章探讨 2025 年 BroadcastReceiver 是否还会被使用。曾它是处理各类事件的首选,但如今问题凸显,如广播可能无法到达,受后台限制、电池优化影响,存在安全隐患和维护难题。文中对比旧方案 BroadcastReceiver + AlarmManager 和新方案 WorkManager,推荐根据不同场景选择合适工具,如 WorkManager 用于同步数据,Foreground Service 处理长时间任务等,建议不再过度依赖 BroadcastReceiver。

国外

Cloudflare 自DDoS 代码审查

How Cloudflare Ended Up Self-DDOSing Its Own Network: A Breakdown of the Outage
2025年9月12日,Cloudflare因仪表板更新失误引发自DDoS事件,致控制平面API故障。事故源于React代码中useEffect钩子错误,使仪表板重复调用API,叠加服务部署,致租户服务不堪重负。Cloudflare采取限流、扩容、回滚代码等措施恢复服务。此次事故凸显全面代码审查、AI辅助审查及部署保障机制的重要性,强调自动化工具对预防事故的作用。

Safari 26.0 WebKit 新特性

WebKit Features in Safari 26.0
本文介绍Safari 26.0的新特性与改进。新特性涵盖CSS(如锚定定位、滚动驱动动画)、Web API(如可信类型API、URL模式标准)、JavaScript(支持模式修饰符)等多方面;功能改进包括让各网站在iOS和iPadOS成Web应用、支持HDR图像、visionOS支持沉浸式音视频和元素、新增数字凭证API等。还修复大量各方面的漏洞,提供了反馈途径和更新方式。

前端开发 MCP服务器 AI

10 MCP Servers for Frontend Developers
文章介绍了10个适合前端开发者的MCP服务器及1个实验性的Angular MCP服务器。MCP是新兴开放标准,利于开发者在IDE中用AI获取文档与支持。这些服务器各有用处,如Canva MCP可一键生成应用;Dart MCP能让AI与平台交互;DigitalOcean MCP可在IDE内构建并部署应用等。Angular MCP处于实验阶段,能提供遵循最佳实践等工具。

Bun Node.js 生产环境

Why using Bun in production (maybe) isn't the best idea
文章指出Bun虽推动了JavaScript生态发展,但在生产环境使用未必是最佳选择。Node吸收了Bun部分功能,且非所有功能都适合集成到一个运行时。Bun宣传性能数据存疑,其非标准API会造成迁移困难,版本管理也不符合语义化。此外,它还有设计选择不佳、路线规划随意、维护问题多等问题。不过,Bun适合原型、脚本等场景,若要用于生产,需遵循一定原则并改进自身。

动画SVG 替代GIF CSS动画

Replace Your Animated GIFs with SVGs
文章介绍用 SVG 替代动画 GIF 的方法。SVG 文件小、可无限缩放,还能使用部分媒体查询。先展示简单菱形旋转动画,说明可将 CSS 样式写在 SVG 内,用 img 元素加载也能运行动画。又以僵尸弹手风琴为例,详述复杂 SVG 动画制作,其大小仅为 GIF 的 2%。此外,SVG 可作背景图,部分媒体查询有效,但存在动画需自动运行、不支持 prefers - reduced - motion 等限制。

JavaScript ES6 ReactJS

JavaScript Refresher : Master ES6, Array Methods, Async/Await & Import/Export in 2025
本文是 JavaScript 复习指南第二部分,适合复习或入门者。介绍 ES6 特性,如默认参数和模板字面量;展开与剩余运算符;数组方法,像 map、filter 等;异步/等待简化异步代码;导入/导出实现代码模块化。还给出初学者关键要点、练习建议,鼓励通过视频学习,掌握这些特性对 React 开发有益。

冒泡排序 可视化 算法

Bubble sort visualization
文章围绕冒泡排序可视化展开。先介绍冒泡排序可将数组元素按升序排列,虽算法简单但效率低。给出一维数组冒泡排序可视化代码,包括 HTML5 Canvas 搭建、数组填充与打乱、排序及可视化步骤。还展示了二维数组排序代码,通过添加二维主数组,对每行重复操作并绘制 2x2 像素方块,最终实现可视化效果。

AI 动态

[AI 深度研究员] AI创业 Claude Mike Krieger

先别融资|Anthropic 首席产品官:一人用 AI,先做三步
本文整理自Mike Krieger和Dario Amodei访谈。提出创业先别融资组队,用“一人+AI”跑通产品闭环。一人起步能保持想法统一、高效,Claude可扮演多角色,如产品、合同、治疗师等。判断项目能否继续,要看有无真实用户、用户建议及投入回报。Artifact因缺乏增长动力被停。现在可用Claude三步走通一轮,再考虑融资。

[AI 深度研究员] AI 创造力 诺奖对话

诺奖对话 90 分钟要点:Hinton为何说 AI 有“创造力”?
2025年9月18日,诺贝尔奖推广机构举办对话探讨“AI是否具备创造力”。“AI教父”Hinton认为AI已有创造力,能理解问题、自主解决;Haroche则以AI无观察能力、动机和社会环境为由反对;Maria关注其进步速度。Hinton还警告AI正走向不可预测方向。此外,对话还讨论了AI对社会在工作、教育等方面的影响,指出这是关于未来文明的预演,人类需重新定义自身价值。

[AI 深度研究员] 扎克伯格 Meta AI

扎克伯格新三件事:神经手环、显示眼镜、个人AI
北京时间9月18日Meta Connect 2025现场,扎克伯格展示“随时在线”新世界,虽现场翻车但阐述核心观点。他提出神经手环、显示眼镜、个人AI构建的交互体系,AI从点开用变为戴着用,强调眼镜是理想形态,控制和UI界面改变带来自然体验。同时,组织研发靠近决策中心,AI功能升级成有感知力的伙伴,眼镜或成新入口,标志Meta战略从虚拟现实转向AI协作。

[AI 深度研究员] AI 商业逻辑 Mo Gawdat

未来 15 年,AI 将改写商业逻辑|《快乐算法》作者、谷歌 X 前高管
《快乐算法》作者、谷歌 X 前高管 Mo Gawdat 预测,AGI 2026 年到来,2027 年起人类将经历 12 - 15 年动荡期,AI 会重塑企业现金流、就业结构和价值链。AI 正从工具变为主导者,改写商业规则,影响决策、运营和消费模式。同时,社会规则滞后,人类应从执行者变为方向定义者,重新定义人类价值。

[AI 深度研究员] AI原生组织 Claude Code Cat Wu

AI 原生组织怎么建:Claude Code 产品经理 Cat Wu 的起步顺序
本文基于Claude Code产品负责人Cat Wu访谈,介绍AI原生组织起步顺序。Claude Code自2025年5月活跃用户近增3倍、营收提5.5倍。其起步是工程师整合模型到日常工具,先应用,组织结构自然形成;功能靠用户反馈迭代,筛选代替审批;打造组织接口,让人人会用;目标是构建生态,让他人搭建AI助手。强调先做好用工具,组织节奏自然跟上。

[AIGC开放社区] Rust AI 大语言模型

技术大神用纯Rust从零构建了LLM,在GitHub上大火
文章介绍用纯Rust构建的LLM项目RustGPT,它模块化清晰、配置“迷你”,训练分预训练和指令微调两步。Rust在AI领域弥补C/C++和Python不足,社区涌现如mistral.rs、candle等项目。其有内存安全、无畏并发、零成本抽象特性。微软、谷歌等巨头纷纷布局。Rust不会取代Python和C++,而是切入二者间的“真空地带”,提升开发效率和安全性。

[AI大模型应用实践] Agent框架 Parlant 对话式Agent

如何“驯服”你的Agent?这可能是你见过最优雅与可控的Agent框架 | 深度体验
文章围绕Parlant框架展开,指出企业应用Agent时,LLM不确定性是最大障碍,现有优化方法有局限。Parlant专注对话式Agent,采用ABM方法,通过指定业务准则并强制执行,降低LLM认知负担。文章还通过构建模拟10086客服助手的实例展示其使用方法,如添加指南、工具、客户信息等。该框架独特且灵活,但也存在规则执行复杂、依赖LLM有失误等不足,适合构建高度可控的对话智能体。

[Datawhale] 金融领域 思维链压缩 AFAC2025

AFAC 2025 冠军方案解析:金融领域中的长思维链压缩
本文分享AFAC2025金融智能创新大赛“金融领域中的长思维链压缩”赛题冠军方案。赛题旨在优化模型推理路径、压缩冗余内容。作者提出多阶段压缩与自一致性偏置解码框架,经数据增强、多阶段压缩、高效微调、推理优化实现思维链高效压缩。该方法在金融领域表现出色,有迁移潜力,代码已开源,同时指出方案不足并提及前沿技术。

[Datawhale] 李飞飞 空间智能 Marble模型

李飞飞空间智能最新成果来了!
2025年9月17日,斯坦福大学教授李飞飞创业公司World Labs发布限量开放测试预览版空间智能模型Marble。输入单张图片或文本提示,它就能生成持久存在的3D世界,用户可自由导航探索且免费。与此前成果比,生成的3D世界规模更大、风格更多样、几何结构更干净。用户能浏览、构建、导出3D世界,还可组合结果构建更大世界。目前可加入候补名单访问预览版。

[DoNews] 腾讯AI 智能体 技术应用

腾讯AI的“三板斧”,首先砍向智能体
本文围绕腾讯AI“三板斧”首砍智能体展开。首先介绍腾讯在全球数字生态大会提出构建“好用的AI”,其“三板斧”含智能体等。智能体成AI时代主要应用载体,政策推动其普及,腾讯云结合业务打造多个智能体,实现降本增效。ADP 3.0升级多方面能力,发布战略全景图,升级基础设施,启动“AI应用繁荣计划”。腾讯靠技术实力搭建壁垒,智能体也将拓展海外市场。

[Founder Park] AI就业冲击 哈佛论文 职业发展

真实、残酷的 AI 就业冲击,从一篇极其精彩的哈佛论文聊起
文章从哈佛论文切入,探讨AI对美国就业市场的冲击。2022年中起,初级岗位增长停滞并负增长,与高级岗位形成剪刀差。研究通过DiD方法证明AI采纳者公司初级岗位招聘量断崖式下跌,主要是不再招聘而非裁员。批发和零售业受冲击最大,中上等大学毕业生最易被优化。最后给出启示,如尽快跃迁、思考暗知识和元技能、向兴趣要ROI。

[Founder Park] AI记忆 上下文工程 现象学

从上下文工程到 AI Memory,本质上都是在「拟合」人类的认知方式
本文从技术和哲学角度探讨从上下文工程到AI Memory。先介绍上下文工程概念、重要性及做法,指出其是构建AI Agent关键。对比模型上下文和人类注意力有限性,说明优质上下文重要。分析人类记忆机制,包括分类、过程等。比较人类与AI记忆的异同。最后通过与胡塞尔对话,探讨AI意识、情感等问题,认为可通过实现意识现象学结构涌现人工意识,研究AI记忆能深化对人类存在意义的思考。

[Founder Park] Notion 3.0版本 Agent功能

时隔 7 年,Notion 发布 3.0 版本,全面进入 Agent 时代
时隔7年,Notion发布3.0版本,全面进入Agent时代。3.0版本引入Agent功能,像内置「AI队友」,能完成人类在Notion中的操作。它可将用户从繁琐工作解放,能自主执行20分钟多步骤复杂工作流,有高度个性化「记忆库」,还即将推出「自定义Agent」功能,可自动运行并与团队共享。

[Founder Park] AI创业 投资人 创业者

张鹏对谈王蓓、段江:AI 创业,别着急降本增效, 先有 Prosumer 再说
本文是极客公园张鹏与高瓴创投王蓓、Fotor AI段江、Google Cloud孙素梅的对话。指出AI创业范式与移动互联网时代不同,应先找“prosumer”,注重生产力提升。创业要懂“模性”和“人性”,融资需谨慎。不要急于降本增效,先获忠实用户。可关注工作流场景,护城河是综合能力。创业者选Google这样的平台可助力成长。

[Founder Park] OpenAI Codex 开发工具

如何用好 Codex?OpenAI 内部实践指南:7 个最佳应用场景,6 个使用 Tips
文章是 OpenAI 关于用好 Codex 的实践指南。介绍了 Codex 特点及在其内部开发流程的全面融入。阐述 7 个应用场景,如理解代码、重构迁移等;给出 6 个使用 Tips,包括从提问模式开始、像写 Github Issue 组织提示等。虽 Codex 处于研究预览阶段,但已改变开发方式,未来将更深度融入工作流。

[Founder Park] Shopify AI Agent系统 Sidekick

Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Shopify 以 AI 助手 Sidekick 为例,分享构建生产级别 AI Agent 系统经验。Sidekick 从简单工具调用系统演变为复杂平台,过程中遇工具复杂性难题,通过‘即时指令’解决。评估方面,用‘基准真相集’取代‘黄金数据集’,让大语言模型裁判与人类对齐,用‘用户模拟’测试。训练采用 GRPO 遇‘奖励作弊’,经迭代改进解决。最后给出架构、评估、训练部署等方面核心建议。

[Founder Park] AI ChatGPT Claude

两份报告,两种 PMF:ChatGPT 跑通了 Copilot,Claude 验证了 Agent
文章基于 OpenAI 和 Anthropic 报告,对比 ChatGPT 和 Claude 用户使用情况。ChatGPT 周活达 7 亿,用户心智似 Advisor,交互以对话式为主,常见用例为实用指导、信息获取和写作,非工作场景使用多。Claude 作为企业级 LLM 市场头号玩家,用户心智似 Agent,引领指令式模式,用户倾向让其执行任务,企业使用以自动化为主,对高成本任务需求大。

[Founder Park] AI硬件 Plaud 许高

Forbes 报道:2.5 亿美元年化收入,硬件销量超百万,Plaud 是怎么赚钱的?
Forbes报道AI硬件创企Plaud,其年化收入将达2.5亿美元,产品利润率媲美苹果iPhone。创始人许高自筹资金创业,设备NotePin销量超百万。公司采用‘深圳硬件+硅谷AI’模式,面向海外市场,以‘硬件+订阅’服务盈利,约半数收入来自年度AI订阅服务。虽面临竞争,许高认为大厂推出颠覆性设备尚需数年,他还规划推新形态设备,增强人类智能。

[InfoQ] Claude模型 基础设施漏洞 用户流失

Claude 急了!模型降智,官方长文用 bug 搪塞?开发者怒怼“太晚了”:承认不达标为何不退钱?
本文围绕Claude模型展开,8 - 9月初其质量下降,Anthropic归咎于三项基础设施漏洞。详细介绍了上下文窗口路由错误、输出异常、近似top - k XLA:TPU编译错误三个bug及处理办法。检测困难源于验证流程缺陷、隐私保护措施及症状差异。虽官方提出改进方案,但很多用户不买账,还因使用限制严格等问题不断流失。

[InfoQ] 亚马逊云科技 AI Amazon Bedrock

一家营收千亿美元的公司,如何回应 AI 落地的策略问题
2025年9月19日,亚马逊云科技官宣Qwen3和DeepSeek v3.1上线Amazon Bedrock。该产品秉持“Choice Matters”理念,提供超二百余款模型。此前行业因资本和技术推论,对这一理念存疑,但2025年基础模型发展表明,单一模型方案有短板。Amazon Bedrock能提供选型建议,适应行业波动。不同模型能力有差异,保障AI落地需灵活选型,其还具备评估和测试选型能力,影响AI落地进程。

[InfoQ] 企业数据分析 Agent技术 数势科技

AI 引领的企业级智能分析架构演进与行业实践
本文是数势科技AI负责人李飞在QCon大会分享内容。介绍企业数据分析与洞察难点,指出智能分析平台需建立统一标准衔接三层数据系统。阐述结合Agent技术可解决问题,能打破信息茧房、提升效率。介绍Data Agent技术路线,包括处理流程、降低错误率方法、语义层处理等。认为Agent应聚焦解决数据到洞见问题,还分享模型基座、产品形态选择及企业数字化落地心得。

[InfoQ] OpenAI GPT - 5 - Codex AI编程

7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破
9月16日,OpenAI推出新模型GPT - 5 - Codex,专为AI辅助编程设计。此前Anthropic在编码场景占主导,GPT - 5 - Codex出现或改变格局。它在SWE - bench得分高,“思考”时间动态。其优势在于“多面统一”代理和更优后训练特性,能连续7小时完成复杂重构。此外,OpenAI在探索不同交互界面和工具适用场景,还面临代理记忆、迁移审查等问题,未来将朝多代理方向发展,推动软件工程变革。

[K姐研究社] 谷歌 Learn Your Way 教育

谷歌推出“Learn Your Way”,用AI重新定义教科书
谷歌推出教育工具 Learn Your Way,用 AI 重新定义教科书。它将教科书变为多模态内容,加入互动和测验,实现个性化学习。其把内容拆解成沉浸式文本、分段测验等形式,可根据学生年级和兴趣调整。经专家评估和随机对照实验,证明它有效提升学习效果和长期记忆。目前已在 Google Labs 上线,用户可申请内测,它有望带来教育变革。

[MacTalk] AI编程 Trae Cue

别再幻想 Vibe Coding 打天下,AI 编程最实用的功能是这个
2025 年 AI 编程工具“百花齐放”,Vibe Coding 虽美好但不实用,Andrej 认为应让不同工具在不同场景各司其职,他常用“代码补全”。字节跳动 IDE Trae 里的 Cue 功能强大,能重构编程动作。它有代码补全、多行修改等功能,更新快,模型更优。Cue 能处理琐碎基础工作,提升开发效率,让开发者专注创造。

[OpenBMB开源社区] 语音生成模型 VoxCPM 面壁智能

面壁小钢炮迎新:VoxCPM 语音生成媲美真人、声音复刻超像!
文章介绍面壁小钢炮新成员 VoxCPM 语音生成基座模型。它由面壁智能与清华实验室联合研发,已开源且有体验平台。其在合成语音自然度等方面达 SOTA 水平,词错率低、音色相似度高,推理效率卓越。生成语音听感超拟人,克隆音难辨真假,支持中英双语复刻、公式符号音频合成等。采用独特端到端 TTS 方案,由四大模块组成,更多技术细节待报告。

[PaperAgent] RAG HiChunk HiCBench

让RAG告别断章取义,HiChunk做到了~
文章围绕让 RAG 告别断章取义的 HiChunk 展开。现有 RAG 评测忽视文档切分,腾讯优图提出 HiCBench 评测基准,含人工标注多级切分点与证据稠密 QA。HiChunk 框架用微调 LLM 建多级语义树,配 Auto - Merge 检索算法。它有两级子任务,还能处理超长文档。实验显示,HiChunk 在切分准确率、端到端 RAG 等方面表现良好,速度快可在线部署。

[PaperAgent] OCR技术,PaddleOCR,开源项目

大模型虽好,但恕我直言:在OCR面前,开源小模型更香
文章讲述项目需实现纸质文档自动化数字处理,起初考虑云端大模型API调用和开源大模型本地化部署,前者费用高,后者硬件要求高,都行不通。后经建议尝试开源项目PaddleOCR,它功能全、集成度高,迭代快。其新特性如PP - OCRv5识别精度高,PP - StructureV3解析能力强,训推一体工具链好用,易用性高。测试显示准确率高,最终决定采用该方案。

[PaperAgent] AI Agentic编程 GPT - 5 - Codex 软件开发

GPT-5-Codex背后AI Agentic编程技术最新全面综述!
OpenAI发布的GPT - 5 - Codex优化了agentic coding。AI Agentic Programming重塑软件开发流水线,能自主完成复杂任务。它与传统代码补全在交互方式、工具使用等方面不同。其典型工作流从人提需求开始,Agent经多步操作,人再审查合并。有大模型、Prompt工程等4大技术底座。主流Agent有对比分类,未来还有编译器开放API、分层记忆架构等5大机会。

[Peter在深港] AP2协议 人工智能 支付

离钱最近的Agent协议 - AP2协议
谷歌推出代理支付协议(AP2),这是 A2A 和 MCP 的扩展,与超 60 家机构合作。它为跨平台安全支付交易构建“与支付方式无关”框架,解决 AI 代理支付的授权、真实性和问责性问题。通过委托指令和可验证凭证建立信任,支持多种场景。该协议还能解锁新商业体验,支持新兴支付系统,未来规划呼吁协作,众多合作伙伴表达支持。

[Peter在深港] YC、Vibe Coding指南、人工智能

YC 的 《Vibe Coding 指南》
文章介绍YC的《Vibe Coding指南》,包含规划流程、版本控制、测试框架等多方面内容。规划要制定全面计划、增量实施等;版本控制严格用Git;测试优先高层测试;调试利用错误信息等;还提及人工智能工具优化、复杂功能开发、技术栈考量等,最后鼓励持续改进,还可通过微信加入交流社群。

[TesterHome社区] 软件测试 测试左移右移 职业发展

大厂不再招测试?技术浪潮下测试相关职业的发展新局
文章探讨了技术浪潮下测试相关职业发展新局。“大厂缩减测试岗位”并非否定测试价值,而是淘汰单一“执行型测试”。测试左移右移打破瀑布模型低效闭环,左移贯穿全流程降低成本,右移补全测试盲区。国内企业有相关实践,但转型需警惕“技术变形”。测试领域处于转型阵痛期,自动化、AI测试成变革引擎,从业者要提升技术、协作等能力,向新兴岗位转型。

[Thoughtworks洞见] AI时代 人才配置 技能需求

AI时代的人才新论:年轻开发者真比资深专家更懂AI吗?
文章探讨AI时代人才新论。客户需求转变,有人认为年轻开发者更懂AI,但依赖毕业生团队有弊端,他们虽熟悉新工具,却缺辨别优质代码经验。资深专家能预见AI代码隐患。最优解是新老组合,发挥互补效应。AI崛起重构企业所需技能组合,批判性思维等高阶技能重要性凸显,企业或可拓宽人才招募范围,将专业知识与AI能力结合满足企业需求。

[VibeAI产品君] 智能研发生态 WeaveFox CLI 前端开发

WeaveFox 智能研发生态
文章介绍 WeaveFox 智能研发生态,其产品矩阵有丰富上下游生态,覆盖多日常工作环境,如设计工具、浏览器、命令行、IDE 插件。重点介绍 WeaveFox CLI,它是面向前端开发者的命令行工具,兼容多款大模型,安装便捷。具备写代码、多模型切换等功能,还能完成查 IP、git 提交等工作。未来会持续提供更多生态工具。

[Web3天空之城] Palantir 亚历克斯·卡普 西方困境

Palantir CEO最新访谈全文: AI, 西方困境, 数据帝国
Palantir首席执行官亚历克斯·卡普在访谈中就争议话题发声。他为公司在国家安全等方面角色辩护,称技术有安全保障。他认为人工智能时代边境管制必要,西方衰落源于文化价值信仰丧失和反精英主义。还谈到公司未进行针对美国公民的数据收集,产品难被滥用。此外,他支持以色列自卫权,批评现代进步运动,反对新保守主义外交政策。

[云中江树] Seedream 4.0 PPT制作 图像创作

用Seedream 4.0重新定义PPT:多图融合+4K直出,我的PPT终于有救啦?
文章介绍字节发布的豆包·图像创作模型Seedream 4.0,它是一站式图像创作神器,支持4K多模态生图等功能,推理快、主体一致性强。可通过火山引擎AI体验中心体验。作者分享用其做PPT的过程,从框架搭建到各页面制作,效果出色。此外,它还有手账卡片制作、一键改图等创意玩法,具备多图融合等杀手级优势,同时给出实战技巧,虽不能完全替代人,但对非专业人士帮助大。

[信息与交互设计研究所] 康复医疗 AR/VR技术 游戏化设计

智趣康复:探索游戏化与AR/VR在医疗中的奇妙应用
传统康复模式枯燥,游戏化与 AR/VR 技术正带来变革。TongueFlex Pro 结合 AR 技术,有两种训练模式,能增强舌头肌肉,缓解老年人吞咽困难,具便携、操作简单等特点。REMEDY 是用于 PTSD 患者自我治疗的 VR 设备。Dr.Tate 平台用 VR 技术解决儿童牙科恐惧症,将就诊流程设计成冒险,让孩子轻松看牙。

[信息与交互设计研究所] 人机交互 VR应用 情感识别

交互与技术结合:人机交互案例分享
文章分享人机交互案例。一是PSiFI系统,由Pooi See Lee等团队研发,能结合言语与非言语表达数据实现实时情感识别,在VR环境展示数字人应用;二是谷歌的Tilt Brush,基于HTC Vive头盔的VR绘画应用,可在3D环境作画;三是Boolean Planet,由Vincent Houzé设计,球体表面画面随音乐变幻,观众触摸会有互动效果。

[十字路口Crossing] AI 自我治愈 Prompt

我用 AI,治好了那个总说“我不够好”的自己
文章介绍用AI治愈自我的新方式。Therapy GPT社区让AI成私密伙伴,人们分享治愈Prompt。如BPD年轻女性借AI梳理情绪获新生。文中精选10条热门Prompt,包括当向导、治取悦症、转化创伤为创作等,还讲述其使用场景与作用,虽不能替代专业咨询,但为与自己和解提供安全空间,体现科技助人更好做自己的温暖变革。

[十字路口Crossing] AI应用 OpenRouter榜单 开发者工具

API 账单不会说谎:OpenRouter Top 10 榜单,看到下一个爆款
文章基于 OpenRouter 公开数据,盘点 2025 年 9 月调用量 Top 10 的 AI 应用榜单。榜单排除巨头,揭示被主流忽略的 AI 生态,其应用分两类:为开发者服务的 Coding Agent 和提供情感价值的角色扮演与娱乐。文中还介绍各应用,如 Kilo Code 开源易用,Cline 自主可控,BLACKBOXAI 强调一体化等,并整理 Top 20 名单,关注【十字路口 Crossing】回复口令可领取。

[十字路口Crossing] AI 智跃 Agent 一体机 Jomy

专门面向 CEO 的 Agent 一体机|对谈 302.AI 创始人 Jomy
本文是对 302.AI 创始人 Jomy 的访谈。他推出的智跃 Agent 一体机,售价 68000 元,可断网运行,能为 CEO 生成「真相报告」。该产品定位企业管理者,源于 Jomy 自身创业管理困境。他谈到产品定价、盈利模式、自身经历等,还介绍产品优势如数据安全、算力成本低等,能解决信息搜集和处理痛点,未来看好小模型 + Agent 趋势。

[十字路口Crossing] 工业、时序大模型、数字技术工人

1个 AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意
文章是对极峰科技创始人王筱圃的访谈。介绍了时序大模型,它与大语言模型不同,训练数据和目标有别,应用广泛。极峰科技打造“数字技术工人”,解决传统工业自动化不足。通过复刻工人特质、引入agent解决成长和可控性问题。以垃圾焚烧电厂为例,数字工人可替代4人,提升焚烧效率。销售采用“用工逻辑”,未来或引发工业生产组织形式变革,改变人类岗位定义。

[张鹏科技商业观察] 具身智能 人形机器人 发展预期

具身智能还需要一个「五年耐心」
文章指出具身智能发展需「五年耐心」。目前通用机器人尤其是人形机器人进产线挑战大,核心价值更像「情绪价值」。迈向「GPT - 3.0 时刻」关键是将数据问题转化为算力问题。从「GPT - 3.0」到「GPT - 4.0」更漫长,受仿真局限、试错成本高、物理世界长尾问题复杂等约束。终局玩家需有一流 AI 团队、海量真实数据、顶级制造能力及雄厚资本和坚定信念,马斯克是突出玩家。

[拔刀社] 企业AI应用 复合型人才 AI使用报告

【Claude最新报告】全球150国企业使用AI的4个残酷现实
文章基于Anthropic发布的使用报告,分析全球150多国企业使用AI的现实。一是AI在各行业扩散不均,依赖公共知识的行业应用更成熟,依赖内部数据的行业较滞后。二是企业要全自动化,API调用多为纯自动化,青睐确定性高的任务。三是便宜没用,好用才重要,能解决问题的AI更受企业欢迎。四是需能向AI解释业务的复合型人才,他们未来身价会提升。强调企业要懂用AI,作者还开放一对一交流。

[搜狐技术产品] Lottie动画 双状态切换 性能优化

Lottie动画双状态切换的渐进式优化实践
本文围绕Lottie动画双状态切换的渐进式优化展开。传统方案有启动和切换卡顿问题。经三次优化:先引入异步加载和缓存,提升性能但快速切换有状态丢失问题;再用状态机和Pending机制解决加载时序问题;最后解决图片资源加载问题。性能对比显示,启动耗时和状态切换性能大幅提升。还给出资源规范、预加载策略和降级方案等最佳实践。

[数据可视化 AntV] AI信息图 外滩大会 开源

打工人福音!外滩首发 AI 信息图,告别熬夜做图表
外滩首发 AI 信息图,是打工人福音。写报告方案时文字表达存在问题,而用图表达重点清晰、逻辑明了、表达力强。AI 信息图能将信息结构化等,使抓信息更高效。该功能已上线,电脑端可直接访问 tbox.cn/infographic 免费使用。还计划 11 月 22 日开源底层能力,GitHub 仓库为 https://github.com/antvis/infographic ,欢迎大家在评论区晒作品。

[新智元] Grok 4 Fast AI模型 基准测试

马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini
xAI推出Grok 4 Fast,融合推理与非推理双模式,支持200万token上下文。它在NYT Connections和AA智能指数中表现卓越,超越GPT - 5等模型。推理测试碾压前代,成本直降98%,速度是GPT - 5的2.5倍。编码评测登顶,擅长工具调用,通过API调用价格创新低,获取AI智能成本持续下降,有望成开发者新宠。

[新智元] 大语言模型 人格幻觉 行为实验

醒醒,LLM根本没有性格!加州理工华人揭开AI人格幻觉真相
加州理工与剑桥研究揭示大语言模型(LLM)存在“人格幻觉”。研究团队让LLM填问卷、做行为实验,发现模型“自报性格”与实际行为几乎无关。问卷显示LLM“人格”近乎完美,但行为实验中表现不佳,“自报性格”难预测其行为。Persona注入也仅改变语言表述,对行为无实质影响。研究提醒用户勿轻信模型“自报人格”,产业应重视行为导向的对齐方法。

[新智元] 华为 金融行业 AI

靠10万+粉丝,北漂插画师秒贷款!华为全栈AI加速,让银行及时看见
AI浪潮下金融行业变革深刻,全球“AI+金融”转型成趋势。传统金融面临效率、成本等挑战,AI成破局者。华为全栈技术助力,与银行成立实验室。2025全联接大会发布“金融智能体加速器FAB”,具开箱易用等特点。华为解决算力焦虑,助力银行AI治理。其与金融机构合作成果多,如和交行等打造样板点,还将深化合作,拓展金融AI场景边界,让金融服务更高效公平。

[新智元] OpenAI 硬件 算力

OpenAI最新硬件2026年底亮相!狂挖苹果20+老将,首款神秘设备或将颠覆iPhone
OpenAI硬件野心凸显,计划2026年底或2027年初推首款消费设备。其5月花65亿美元收购io,数月内从苹果挖来超20名资深工程师。Jony Ive和Tang Tan是吸引苹果老将跳槽的关键,Tang Tan将主导首代设备。立讯精密已拿下组装合同。不过挑战苹果硬件地位不易,此前诸多尝试多失败。此外,OpenAI因算力不足,计划未来五年投1000亿美元租服务器,最终或自建数据中心和芯片。

[新智元] 天才少年 涂津豪 罗福莉

18岁天才少年,登上Nature封面!
本文介绍18岁天才少年涂津豪登上《Nature》封面的事迹。他作为实习生参与DeepSeek - R1研究,该模型成史上首个经严格同行评议的大模型。此前,他获2024阿里数赛AI赛道全球第一,还将Claude 3.5改造成推理模式,开源项目获15k多星。他在博客发表对安全和AGI的思考。此外,还介绍了论文另一作者罗福莉,她学术成就高,论文被引数达10140次。

[新智元] 阿里 通义DeepResearch AI

阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定
阿里开源通义DeepResearch,在多项权威基准上超越OpenAI、DeepSeek。它告别一问一答模式,像研究员一样工作,能拆解问题并调用工具完成研究。团队构建智能体合成数据体系,模型支持ReAct和Heavy两种推理模式。还打通端到端训练链路,构建基础设施。该成果赋能高德、通义法睿等产品,其开源让人人可构建专属智能体,证明轻量模型在深度研究领域也能称霸。

[新智元] AI数据 澳鹏数据 数据竞争

小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马
文章指出AI竞争已从模型规模转向数据质量,全球“数据大战”进入下半场。小扎豪掷143亿买数据未达预期,马斯克裁员转招“专业AI导师”。中国澳鹏数据崛起,2025年上半年营收3.06亿。其把握多轮市场机遇,有五大平台技术领先,还提供大量成品数据集。面对新挑战有三大应对招,未来战略清晰,目标2030年前中国区营收超20亿。

[智东西] 小米 语音大模型 开源

刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很
9月19日,小米开源首个原生端到端语音模型Xiaomi - MiMo - Audio,参数70亿,预训练数据超1亿小时。该模型在多项测试达SOTA,超越部分主流开闭源模型。它功能丰富,能对话、生成音频等,还具备语音续写等能力。小米还开源相关模型、报告和评估框架。其有三大技术创新点,开发评估基准。此次开源将加速语音大模型研究,小米会持续开源发力语音AGI。

[智东西] 李飞飞 3D世界 空间智能模型

炸场!李飞飞发了个「永久世界」,谷歌Genie 3瞬间不香了?
2025年9月17日,李飞飞创业公司World Labs公布空间智能模型成果,发布可查看和创建3D世界的Marble平台。其模型给定图文提示可生成持久、可导航、可控3D世界。与谷歌Genie项目相比,生成的3D世界永久存续,用户可免费自主导航。该模型支持零成本自由切换视角漫游,几何复杂度丰富,能转化多种风格内容。早期体验者反馈工作时间大幅缩短,未来有望让创意人士受益。

[机器之心] AI MiroMind 陈天桥

陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准
机器之心报道,陈天桥旗下 MiroMind 团队在全球首个动态实时 LLM 智能体未来预测基准 FutureX 中连续两周夺冠。MiroMind 采用记忆驱动机制,专为预测与决策设计。其在 FutureX 榜单表现惊艳,还成功预测网球排名和加密货币价格。该团队登顶基于信息洞察等核心能力。MiroFlow 框架成绩优异且开源,自研模型 MiroThinker 也将开源。陈天桥邀全球 AI 人才加入打造预测大模型。

[机器之心] 亚马逊云科技 Qwen3 DeepSeek-V3.1

超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了
机器之心报道,亚马逊云科技将 Qwen3 和 DeepSeek-V3.1 两大国产模型纳入 Amazon Bedrock 平台。Qwen3 性能提升、部署成本低,有四个版本,架构和功能有创新;DeepSeek-V3.1 推理高效、性价比高。亚马逊云科技还提供「大模型选型实战」Playground。其重视开源生态,秉持「Choice Matters」战略,构建超 400 款模型的库,让客户灵活选模型。

[机器之心] 大模型开源 AI Agent AI Infra

LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
本文围绕《2025大模型开源开发生态全景图》2.0版展开。全景图收录114个项目,60个出局、39个新晋,生态洗牌剧烈。方法论升级,新方法使AI Coding、Model Serving、LLMOps成主力赛道。各层变化显著,AI Agent层AI Coding疯魔;AI Infra层Model Serving、LLMOps火热,模型训练回调;AI Data领域平静。此外,开源许可现限制变体,还梳理大模型发布时间线,揭示路线分化等现象。

[机器之心] 小红书 音频大模型 开源

没想到,音频大模型开源最彻底的,居然是小红书
近几个月开源成AI社区焦点,国内厂商多在文本等领域开源,音频生成占比小。小红书自去年起在音频领域稳定开源,推出FireRedTTS、FireRedASR等成果,获社区关注。近期又有新成果,如FireRedTTS - 2、FireRedChat。其技术栈完整,还探索新玩法。小红书对开源生态有长期承诺,计划推更多模型,未来有望在AI音频市场抢占先机。

[极客公园] 腾讯 AI 数字生态大会

腾讯 AI 的新叙事
本文以 2025 腾讯全球数字生态大会为观察样本,探讨 AI 如何改变腾讯。一方面,AI 精耕存量业务,如腾讯会议、问卷等产品功能升级,重塑业务逻辑,成果外溢创造行业新增长。另一方面,CodeBuddy 等 AI 原生应用是进攻核心,降低技术门槛吸引新开发者,连接腾讯生态。腾讯构建了核心场景与新工具相互促进的增长飞轮,从流量帝国进化为价值创造循环体。

[极思TopMinds] 淘宝 AI购物 电商

深度|淘宝的“秘密武器”,新AI功能彻底终结“选择困难症”
文章指出当代购物存在‘目标明确,规则模糊’问题,是一种‘精神内耗’。淘宝推出‘AI帮我挑’(AI导购)和‘AI万能搜’功能解决此问题。‘AI帮我挑’将‘人找货’变‘被动问答’,通过询问场景需求精准推荐;‘AI万能搜’能针对目标模糊情况给创造性建议。这覆盖了日常购物决策场景,让AI成懂用户的管家,拉开AI普及新时代序幕。

[极思TopMinds] AI 李飞飞 Marble平台

深度|AI圈地震!李飞飞的Γ永久世界」凭什么让⾕歌都黯然失⾊?
本文介绍李飞飞团队的Marble测试平台。它能通过图或文字生成可永久探索的3D世界,标志AI竞争焦点转向对物理世界的感知等。其“永久世界”具有永久持续、零成本漫游、风格多样特点。与谷歌Genie相比,Marble更强调“永久性”和“零成本漫游”。它是“空间智能”愿景的亮相,补充挑战“语言为王”路线,虽处早期测试,但潜力大。

[海外独角兽] 编程 AI Stripe

Stripe x Cursor,硅谷两代“金童”对谈: 未来5年IDE里将不再是代码
本文是 Cursor CEO Michael Truell 和 Stripe CEO Patrick Collison 的对谈。二人探讨了 Patrick 早期技术实践,如用 Smalltalk 搭建公司、用 Lisp 写 AI bot。还谈及编程未来,认为 5 年后 IDE 或改变,编程更不拘形式。AI 可重构代码、降低成本。此外,介绍了 Stripe 技术理念,早期选 MongoDB 和 Ruby,现推进 V2 API 重写,统一概念提升效率。

[海外独角兽] 上下文工程 Agent开发 AI

超越 Prompt 和 RAG,「上下文工程」成了 Agent 核心胜负手
本文介绍了上下文工程(context engineering)这一概念,它指在正确时间为 agent 提供正确信息,是 agent 开发核心。随着工具调用增多,简单 agent 面临 context 管理难题,催生了该工程。文中归纳出转移、压缩、检索、隔离、缓存五大策略,还结合 the Bitter Lesson 启示,指出应减少结构搭建系统,让产品随模型能力增长而发展。

[海外独角兽] 医疗AI OpenEvidence 医学知识平台

一半美国医生都在用的AI产品,OpenEvidence 是医疗界的 Bloomberg
OpenEvidence是受关注的医疗AI公司,满足医生对循证医学知识需求。它绕过传统采购流程,以PLG策略获超40%美国医生用户,咨询量猛增。平台构建数据飞轮,收入靠广告,未来广告、订阅双轮驱动。其TAM大,产品功能丰富,有独特技术路径。但面临传统巨头、AI初创公司和大厂竞争,需强化内容、嵌入工作流等保持领先,已获多轮融资。

[深思圈] 软件开发 Macroscope AI

前Twitter高管融资4000万美金,当每个公司都有上千个 AI 程序员时,谁来管理这支混合军团?
前 Twitter 高管 Kayvon Beykpour 的新公司 Macroscope 获 4000 万美元融资,旨在用 AI 改变软件团队工作方式。软件公司规模扩大易导致信息不对称、管理难题,传统管理工具难以解决。Macroscope 以代码库为源头,通过“代码遍历”系统结合大语言模型,为不同角色提供价值,能解决传统工具无法回答的问题。其出现或引发软件开发行业变革,也对中层管理、人才市场等产生影响。

[深思圈] AI助手 TwinMind 创业项目

24岁博士毕业的天才少年,从Google X出走获570万融资,要用AI颠覆人类记忆
本文介绍了TwinMind项目,三位前Google X科学家获570万美元融资,欲用AI颠覆人类记忆。该应用试图成为“第二大脑”,能本地处理信息。其创始人因工作痛点意识到记忆对AI的重要性。技术上创新多,如纯Swift构建、支持多语言等。有超3万用户,体现出全球化需求。它定位记忆优势,有望从工具变伙伴,但面临竞争、隐私等挑战,商业模式有潜力,也有扩展和风险问题。

[深思圈] AI养老 Meela 创业

另辟蹊径,专为老年人提供AI陪伴服务,融资350万美金
本文介绍了专为养老院老人打造的AI电话伴侣Meela。它获350万美元种子轮融资,创始人因个人经历投身此项目。其商业模式清晰,养老机构月付65美元。纽约养老院实验显示,它能改善老人抑郁焦虑、提升社交参与度。技术设计贴合老人需求,定位为人际互动补充。虽有技术、隐私和伦理问题待解决,但在养老市场潜力大,有望成应对老人孤独的创新解法。

[深思圈] AI摄影 Phota Labs 摄影行业

a16z投了两个华人560万美金,让AI成为每个人的专属摄影师
本文介绍获a16z领投560万美元种子轮融资的Phota Labs,其用个性化视觉AI重新定义摄影。它解决AI生成图像身份真实性问题,从“记录瞬间”转向“重新创造瞬间”。技术基于身份识别和背景理解,重新定义创作流程。有消费应用和API双产品策略,市场潜力大。不过也带来伦理问题,还会影响摄影行业,未来个性化、多模态整合等是发展方向。

[深思圈] 情感 AI Nuance Labs 人机交互

不只是聊天机器人:华人团队打造会"察言观色"的情感AI助手
文章介绍了 Nuance Labs 创业公司,其由前苹果工程师创立,获 1000 万美元种子轮融资。该公司致力于构建理解和表达情感的 AI 基础模型。当前 AI 存在情感智能缺失问题,Nuance Labs 从根本重新思考,用自回归变换器建模人类行为。其技术有独特创新,应用场景广泛,不过也面临数据、实时性等挑战。从投资看,该领域前景好,有望开启人机交互新纪元。

[深思圈] GenAI时代 AI广告 Koah公司

GenAI时代广告应该是怎么样的?2500万美元退出后再创业,这位连续创业者如何用AI广告再造独角兽?
文章聚焦 GenAI 时代广告,指出当前 AI 应用订阅模式有局限,忽略大量免费用户且运营成本高。Koah 公司获 500 万美元种子轮融资,其创造“AI 原生”广告,嵌入对话流程,数据表现佳。它重新构建 AI 广告生态,虽面临用户接受度、广告主教育、技术竞争等挑战,但为 AI 应用提供变现途径,促进生态健康发展,实际案例也凸显 AI 广告优势。

[火山引擎] 火山引擎 Viking长期记忆 Viking视频知识库

告别AI应用“金鱼记忆”,火山引擎发布Viking长期记忆
9月11日,火山引擎发布国内云厂商首发的端到端长期记忆标准产品Viking长期记忆,为AI构建持久记忆体,解决当前AI应用缺乏记忆的瓶颈。它基于VikingDB向量数据库,有精细捕捉事件与建模长期画像能力,效果优、性能强、适配广。此外,同期上线的Viking视频知识库有领先视频模态处理能力,可用于多场景。Viking长期记忆已开放体验并支持API接入。

[火山引擎开发者社区] 火山引擎 弹性文件存储 AI 存储

火山引擎正式发布弹性文件存储
AI 浪潮中,传统文件存储难以满足需求,成为制约 AI 算力释放的瓶颈。火山引擎推出弹性文件存储(EFS),它面向 AI 设计又兼顾传统 NAS 需求。其性能与容量解耦,提供多种带宽模式;自研 FSX 客户端提升性能;实现智能双向数据流动,降低存储成本;支持千亿级文件数;与计算生态深度融合。EFS 重新定义 AI 训推效率上限。

[爱范儿] Chrome更新 AI浏览器 Google

Chrome 迎来大更新,Google 是否结束了 AI 浏览器的战争?
Chrome 迎来自 2008 年发布以来最大升级,引入 Gemini 后成为 AI 浏览器。它有诸多新功能,如跨标签页对话、信息总结、智能体能力、地址栏升级为全能框等,还增强了安全防护。这些更新支持美国英语用户,Mac 和 Windows 版已上线,安卓和 iOS 版将推出。Chrome 全球市场份额领先,此次更新或使 AI 浏览器走向大众化。

[硅星人Pro] Vibe Coding AI编程 大厂产品

阿里、百度、腾讯、美团齐聚的Vibe Coding 圆桌,却被12岁小孩姐“军训”?
本文围绕Vibe Coding展开,在AI创造者嘉年华上,阿里、百度、腾讯、美团的AI编程产品总监探讨其定义与未来。他们介绍了自家产品特点、用户群体及能实现的事。12岁小孩姐果果分享使用感受并指出不足。嘉宾们还讨论了用AI编程赚钱的方式。但Vibe Coding下半场挑战大,创新门槛提高,产品差异缩小,营收逻辑不稳固,长期赢家需靠盈利。

[硅星人Pro] AI创业 朱啸虎 全球化

对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
9月20日,硅星人骆轶航与金沙江创投朱啸虎对话,探讨AI创业话题。谈及DeepSeek,朱啸虎认为其保证AI不被少数公司控制,开源是趋势。Manus在Go - to - Market上是范本,AI编程赛道创业公司难参与。投资倾向垂直场景Agent和能创造价值的“牛马机器人”。AI硬件要做减法,全球化中国C端创业者应自信,建议堂堂正正做中国公司,还提及估值、资本及AI创业趋势等问题。

[算法进阶] AI技术 大模型 RAG

图解AI核心技术:RAG、大模型、智能体
文章围绕AI核心技术展开,介绍大模型中Transformer与混合专家(MoE)结合推动发展;阐述5种大模型微调技术特点及应用场景;对比传统RAG与Agentic RAG,指出Agentic RAG优势;列举5种智能体设计模式、5大文本分块策略;介绍智能体系统5个等级;对比传统RAG与HyDE、RAG与Graph RAG差异及适用场景;还提及KV caching优化技术提升大模型生成速度。

[腾讯研究院] 硅谷AI转型 裁员 组织变革

硅谷大厂裁员背后的组织变革丨硅谷AI转型录NO.1
《硅谷AI转型录》聚焦AI对工作的重构。硅谷大厂裁员背后是AI驱动的系统性变革,如Meta缩减中间管理层、为高薪聘人而裁员。AI使组织扁平化,初级岗位就业难,毕业生创业更独立。AI Coding让关注点从技术转向商业价值。企业转型迷雾中,合伙人制受关注,但AI落地有阻碍。未来,大重构、创业深入行业、重视主观能动性成趋势,砸钱改革、小团队独角兽、全球化也将更普遍。

[腾讯研究院] 产业数字化 就业调研 数字经济

产业数字化就业调研报告:全国产业数字化就业总量约6千万,集中于小微市场主体
腾讯研究院等联合开展《产业数字化就业调研》。结果显示,2024年底全国产业数字化就业总量6195.1万,占比8.4%,后连续下降,2025年二季度末降至6000.9万,企业2083.1万、个体户3917.7万。批发零售业岗位最多,文化娱乐业渗透率最高。多数传统产业‘触网’浅,就业集中于小微主体,电商是主力。

[腾讯设计族] 腾讯 中秋礼盒 设计

「云启·探月」中秋礼盒设计
腾讯「云启·探月」中秋礼盒以“科技点亮传统,设计温暖人心”为核心理念。基于中秋消费市场趋势,通过符号转译、材质创新、交互设计让AI融入中秋文化。礼盒可成智能氛围灯,有多种光效模式。分层开箱设计具仪式感。其实现文化传承、情感连接、环保实用、品牌传播价值统一,让设计连接产品、品牌与用户。

[逻辑学家] AI认知革命 超级智能对齐 智能体不完备定理

AI认知革命:从Ilya的“超级智能对齐”到智能体“不完备定理”
文章围绕AI认知革命展开,先介绍Ilya的“超级智能对齐”,即确保超级智能目标与人类价值一致,指出其是AI发展到终极阶段的必然需求及面临的风险。接着从哥德尔不完备定理探讨超级智能的局限性,引出智能体“不完备定理”,分析其三个层面的表现及根源在于“身份危机”。最后提出智能体能力六边形,涵盖身份、容器等六方面,为构建安全可信智能体提供思路。

[量子位] AI播客 ListenHub 量子位智库

AI播客的未来是成为每个人的音频助手,事实性、完整性和活人感都很重要|对话ListenHub
量子位智库与ListenHub创始人橘子老师深入交流,探讨AI播客发展。ListenHub定位创作者的AI嘴替,有AI播客、FlowSpeech等功能。付费用户多为自媒体从业者,其特色功能使其脱颖而出。产品开发先抛MVP,重视付费用户需求。AI产品开发“人人都是产品经理”,其竞争优势在用户know - how。未来Agent或成创作产品终态,ListenHub目标成每个人的音频助手。

[量子位] OpenAI 小扎 人才竞争

OpenAI神秘狠人,花名Bob
文章介绍OpenAI神秘狠人Bob,他负责推理用CUDA内核,其编写的Bob内核每日在大量GPU上执行万亿次,OpenAI对他依赖极高。坊间传言小扎想挖走他,评论区指向Scott Gray。Scott是OpenAI资深人员,技术背景与Bob内核高度吻合。当前硅谷人才竞争激烈,此前OpenAI核心研究员多被小扎挖走,此次奥特曼能否留住Bob引人关注。

[量子位] AI 3D生成 Tripo平台 VAST公司

3D生成到达3.0阶段,不止提升行业渗透率,也正催生3D原生新玩法 | 对话3D生成平台Tripo
本文是对3D明星创企VAST的访谈。AI 3D生成市场广阔但也有诸多疑惑。Tripo平台已覆盖大量用户,推出3.0模型。其降低3D生成成本,用户用文字图片就能生成模型,还能定制手办。平台客户涵盖大众和专业用户,通过社区活动让UGC参与创作。3.0阶段3D生成衍生众多玩法,产品解决UGC和PGC共性问题,未来还将提升效果。此外,还介绍了产品开发、用户增长等方面的情况。

[量子位] 汽车、AI智舱、荣威

豆包大模型开始上车了!上汽荣威率先进入AI智舱新拐点
本文介绍上汽荣威率先进入AI智舱新拐点。AI重塑汽车,真正的AI智舱需主动感知需求、深度思考、自主执行且有记忆功能。荣威M7 DMH全球首发豆包深度思考大模型,带来“车辆成精”体验,如解答用车及各领域问题、有强记忆力等,重新定义人车交互。豆包选荣威首发,因其有数据优势、优秀硬件接口和创新精神。

[量子位] AI经济 AI Agent 监管措施

谷歌DeepMind:AI独立创造价值的经济层正在形成
谷歌DeepMind和多伦多大学称AI Agent正催生全新经济层,提出“沙盒经济”并从起源和分离程度刻画。新兴经济形态发展趋势为自发涌现、高度可渗透,通过科研、机器人、个人助理场景应用。研究人员用市场机制和公平规则安排资源。为实现实用安全经济,需在法律、技术等多领域监管,还应守护人类价值。全球首个AI Agent交易市场MuleRun上线。