Vercel+NuxtLabs & MCP安全问题
周刊
国内
[京东零售技术] 京东 HarmonyOS SDK 家电AR高精摆放
京东携手HarmonyOS SDK首发家电AR高精摆放功能
2025年7月9日消息,京东携手HarmonyOS SDK,在鸿蒙版京东APP首发家电AR高精摆放功能。该功能利用AR Engine解决家电选购中尺寸和风格不匹配难题,用户扫描环境可将家电3D模型1:1呈现。AR Engine提供高精语义几何重建和AR View两项核心能力。此功能预计提升用户决策效率,减少退换货,未来将拓展品类和场景。
[大淘宝技术] 端侧AI MNN SME2指令集
端侧AI突破性能瓶颈:MNN 基于 SME2 指令集的大模型高效推理实现
文章介绍了Arm架构SME2指令集在MNN推理引擎CPU后端实现矩阵乘算子的技术。利用SME2特性实现动态量化和浮点矩阵乘算子,通过矩阵分块优化等提升性能。实验显示,LLM推理中预填充阶段单线程性能翻倍、解码阶段提升20%-30%,CV任务浮点矩阵运算性能提升200%-300%。支持SME2的苹果手机已上市,安卓手机预计2025下半年上市。
[阿里云开发者] 前端自动化测试 AI 阿里云
如何让AI帮你做前端自动化测试?我们这样落地了
本文介绍基于AI的UI自动化测试框架在专有云质量保障的工程化实践。先指出前端测试人力耗费大的痛点,引出框架。阐述核心原理,包括技术栈、架构、实现机制。实现机制含自然语言驱动用例、动态元素定位、执行回放与自适应更新、断言机制。还介绍实施挑战与解决方案,如解决大模型幻觉、适配browser - use、处理页面元素识别等问题,最后提及快速构建企业级数据分析Agent方案。
[阿里云开发者] Elasticsearch 智能运维 AI 助手
如何在 Elasticsearch 中构建你的智能 AI 助手?
现代系统日志量指数级增长,传统运维方式力不从心。文章介绍基于阿里云 Elasticsearch 构建智能运维 AI 助手的方案,其有实时监控、自然语言交互等优势。方案架构结合 AI 搜索开放平台和 Kibana,支持一键部署。还给出创建实例、验证、清理资源等流程,能实现日志分析等自动化,提升运维与安全分析效率。
[有赞coder] 移动团队 AI全栈开发 有赞碰碰贴
移动团队AI全栈开发实践
文章结合有赞碰碰贴创新项目,探讨移动团队AI全栈开发实践。介绍碰碰贴基于NFC技术,有一碰即达、AI自动生成笔记等特点。阐述AI在移动端、后端、前端使用效果,各职能开发效率显著提升。分享各端AI实践案例及踩坑经验,如移动端新技术实现、后端代码重构等。未来团队将培养全栈人才,提升AI应用能力,还发布Android岗位招聘信息。
[大转转FE] PAC 网络代理 开发效率
多代理混战?用 PAC(Proxy Auto-Config) 优雅切换代理场景
文章介绍用 PAC 优雅切换多代理场景。前端等工程师日常用多代理工具易冲突,如系统只能生效一个代理设置。PAC 是自动代理规则机制,核心是 JS 函数,可依目标网站灵活指定代理。文中给出实战案例,还介绍搭建本地服务器托管 PAC 支持热更新。使用 PAC 无需手动切换、系统级生效、避免冲突且跨平台,能提升开发效率和体验。
[转转技术] Apache Hertzbeat 监控系统 开源
Apache Hertzbeat:开箱即用的实时监控系统
本文介绍了开源实时监控告警系统 Apache HertzBeat。它集监控、告警、通知于一体,无需 Agent,兼容 Prometheus,支持多协议模板化配置和自定义指标。文中讲述了实践操作,如快速入门、Grafana 集成、插件管理等;还阐述了原理,包括任务采集调度、高性能集群与云边协同、插件管理实现原理。该系统开箱即用、极简易用、界面直观、安全可靠,具备高性能与自定义特点。
[字节跳动技术团队] 大模型 幻觉问题 缓解方案
一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案
文章聚焦大模型幻觉问题,先介绍其指模型生成与事实不符信息,会影响体验且带来风险。成因涵盖预训练、有监督微调、强化学习与人类反馈、模型推理阶段问题。幻觉分事实冲突、无中生有、指令误解、逻辑错误四类。缓解方案有检索增强生成、后验幻觉检测(含白盒和黑盒方案)。火山引擎云安全团队构建检测方案已落地。最后强调企业要重视防范幻觉问题。
Monorepo 工具链 前端开发
一文带你了解 Monorepo 工具链
文章剖析 Monorepo 开发范式,介绍其演进、概念及与 Multirepo 的比较。Monorepo 集中化设计带来诸多优势,但也面临挑战。核心工具链涵盖依赖管理(首选 PNPM)、任务编排(中小型选 Turborepo,大型选 Nx)、版本管理(选 Changesets)。通过 Pnpm+Nx+Changesets 实战,介绍多项目发布与版本管理、构建优化最佳实践。最后指出 Monorepo 已成主流,工具链将释放更大价值。
[ELab团队] Vibe Coding Cursor 业界调研
从零开始构建一款开源的 Vibe Coding 产品 Week1Day1:业界调研之 Cursor 原理
本文是「从零开始构建一款 Vibe Coding 产品」系列首篇,聚焦 Cursor 原理调研。作者用反代收集 Cursor API 信息,分析其 Agent 模式。介绍了 Cursor 的 System Prompt、用户上下文、User Prompt 及 16 个内置工具。认为 Prompt 非核心竞争力,模型、工具效果和用户体验才关键。指出做类似 Agent 需文件系统、沙箱、联网搜索等关键部分,后续将调研高效 edit_file 和语义化索引/搜索工具实现。
[ELab团队] Coding Agent 业界调研 Edit Tool
从零开始构建一款开源的 Vibe Coding 产品 Week1Day4:业界调研之 Agent 横向对比
文章为构建开源 Vibe Coding 产品进行业界调研,对比多种 Coding Agent。介绍了 VSCode 插件、IDE、命令行工具等 Agent 列表。详细对比各 Agent 功能,如 Cursor 有搜索、文件操作等多种功能。还阐述 Edit Tool 实现,如 Cline、Gemini CLI、Claude Code 的参数、输出、原理等。作者认为 Coding Agent 关键能力包括完整文件系统、沙箱、联网搜索、高效 edit_file 及语义化索引/搜索工具。
[前端充电宝] 尤雨溪 Vue Vapor Mode
刚刚,尤雨溪发布 Vue 新版本,无虚拟 DOM 版 Vue 来了!
2025年7月12日,VueConf 2025上尤雨溪发布 Vue 3.6.0-alpha.1 版本,标志无虚拟 DOM 的 Vapor Mode 正式登场。Vapor Mode 是 Vue 单文件组件全新编译模式,可去除虚拟 DOM 引擎负担,有无虚拟 DOM 开销、编译高效等特性,性能佳。启用简单,有纯 Vapor 应用和混合使用两种方式。适用于局部引入和新项目尝鲜,部分功能待开发。它是 Vue 范式跃迁,带来双运行时架构。
[前端早读课] 工程团队 AI编程工具 采纳策略
【第3541期】工程团队如何有效采用 AI 编程工具
文章围绕工程团队有效采用AI编程工具展开。先介绍Jellyfish推进AI采纳的做法,如与安全团队合作、小范围部署、建立使用手册、组织讨论等。接着给出推广AI的实用方法,包括获高层支持、小规模起步、建反馈机制等。还提及应对AI采纳副作用,如审查代码、创造学习机会。最后指出引入AI是逐步推动组织成长的过程,团队应专注谨慎推进。
[得物技术] NAS eBPF 流量溯源
eBPF 助力 NAS 分钟级别 Pod 实例溯源|得物技术
文章介绍了得物构建支持服务级流量监控、快速溯源及 NAS 异常实时感知能力的方案。先阐述 NAS 背景及现有溯源效率低的问题,接着说明调研验证,包括 NAS 工作原理、进程与容器及 NAS 上下文信息关联等。架构设计上,内核用 eBPF 采集信息,用户空间有元数据缓存和数据处置流程。最终上线 NAS 溯源功能,实现分钟级流量溯源,提升问题定位效率,还为带宽错峰复用提供数据支持。
[数据可视化 AntV] 数据可视化 AntV 图标推荐
AI + 向量检索,做一个“懂你”的 icon 推荐服务
文章介绍基于AI+向量检索的“懂你”图标推荐服务。结合LLM和多模态向量检索技术,流程为文本解析,用LLM提取关键词并翻译;语义向量化,用CLIP模型将关键词转为向量;实时推荐,用向量数据库和HNSW算法匹配。还支持混合查询,兼顾额外条件。通过离线评测、A/B实验和长期监测评估效果,初步结果显示匹配质量高,未来将持续优化。
ReactJS 前端开发 性能优化
每个前端开发者都应该掌握的几个 ReactJS 概念
文章介绍前端开发者应掌握的 ReactJS 高级概念。先讲渲染,包括 JSX 经 Babel 转成 React.createElement 调用,得到 React 元素,初次渲染将其变为真实 DOM。重新渲染在组件 State、Props 改变或父组件重渲染时发生。还介绍虚拟 DOM,它是内存副本,配合协调算法高效更新 UI。协调算法通过 Diff 找出变化更新。最后给出性能优化方法,如用 React.memo、useMemo、useCallback。
[蚂蚁技术AntTech] KAG - Thinker模型 结构化推理 实验结果
KAG-Thinker:「结构化」思考新范式,支持逻辑严谨的大模型复杂推理
蚂蚁集团知识引擎团队联合高校发布 KAG - Thinker 模型,是 KAG 框架迭代升级。它受人类结构化思考启发,为模型思考建分层“脚手架”。采用广度拆分与深度求解结合、知识边界判定、检索内容抗噪等方法。实验显示,在单跳和多跳问答、与 KAG 框架集成及医疗领域应用中均有良好表现,不过 7B 模型拆分复杂问题能力待提升,后续将从结构化数据合成样本解决。
[货拉拉技术] 货拉拉 OceanBase 向量检索
OceanBase向量检索在货拉拉的探索和实践
文章介绍货拉拉在大模型应用场景的探索与实践。引入大模型面临知识缺乏等挑战,采用RAG技术并需结合向量数据库。原向量数据库架构存在动态schema、混合检索和运维难度大等痛点,2024年底经选型选OceanBase并决定上云。OceanBase在资损代码识别和数仓AI答疑助手中落地应用,未来有业务迁移、性能成本优化、内部系统集成和更多场景探索等规划。
[腾讯技术工程] GPU AI Infra CUDA
GPU到底是如何工作的?这篇AI Infra入门全部告诉你
文章介绍了GPU从图形渲染到GPGPU的演进,阐述了CPU/GPU异构计算架构。通过数组相加的例子对比CPU和GPU性能,显示GPU计算快但总耗时与CPU相近,因通讯开销大。还介绍编译、程序加载、执行过程,以及GPU硬件架构、编程与硬件执行模型。提及隐藏延迟、SIMD与SIMT区别、Warp Divergence和同步机制,最后总结单GPU工作流程,后续将讲性能优化。
[前端充电宝] 前端 Vercel Nuxt.js
手握两大前端框架,Vercel 再出手拿下 Nuxt.js,对前端有什么影响?
7月8日,Vercel宣布收购Nuxt.js背后的核心团队NuxtLabs。Vercel靠Next.js在React社区崛起,已成为影响React发展的重要力量。Nuxt.js是Vue全栈框架,加入Vercel后项目可一键部署等。这一收购短期利好Nuxt项目,但长期看,开源工具集中引发担忧,如生态治理偏移、功能封闭等,社区对此看法不一。
前端学习 2025上半年 张鑫旭
40岁老前端2025年上半年都学了啥?
本文是40岁老前端张鑫旭2025年上半年前端学习记录。涵盖CSS、JS、HTML等多方面新特性,如CSS的prefers - reduced - transparency媒体查询、offset - path属性;JS的Array数组with方法、Set新增方法;HTML的permission元素和Permissions API等。还介绍各知识点应用场景、优势及相关文章链接,春节假期未学习,下半年会继续保持学习。
国外
NuxtLabs Vercel 开源
NuxtLabs is joining Vercel
NuxtLabs宣布加入Vercel。NuxtLabs一直致力于打造优质开发体验,因开源维护不易,在Vercel支持下可专注开源。项目仍保持MIT许可、公开路线图和以社区为中心。后续将有诸多开源举措,如发布免费的Nuxt UI v4、开源Nuxt Studio自托管版本、让NuxtHub支持多平台。未来还会聚焦AI,感谢各方支持。
[谷歌开发者] Firebase Studio Gemini 2.5 应用创建
Firebase Studio 现已集成 Gemini 2.5,即刻快速创建应用
Firebase Studio 预览版用户已超 150 万,应用广泛。近期其内置 App Prototyping 智能体升级采用 Gemini 2.5。Gemini 2.5 推理能力强,编码表现卓越。升级后应用界面改进,能处理多场景复杂应用。文中展示多个示例应用,如音乐教学、日程管理等,体现其高效创建和迭代能力。此外,还强化智能体,优化界面,后续会集成新功能,鼓励用户分享反馈。
性能工程 前端后端协作 用户体验
Bridging the Performance Divide: Backend and Frontend Engineers Must Unite
文章指出性能工程领域后端和前端工程师分属不同阵营,各有工具、指标和理念。后端注重服务器优化,前端关注浏览器性能。但网站性能取决于最慢组件,如后端瓶颈会影响前端指标。为此,双方应统一协作,后端工程师要关注前端影响,前端要理解后端局限,组织应建立统一指标、组建跨职能团队,共同为用户提供优质体验。
Stack Overflow AI 开发者社区
A new era of Stack Overflow
本文是 Stack Overflow 在 WeAreDevelopers 大会上公布未来愿景和使命。过去三年该公司在大会有重要宣布,2025 年不断探索服务技术人员的方式。开发者与技术互动和学习方式改变,其第十五次开发者调查显示,开发者使用 AI 工具增多但信任度下降。Stack Overflow 提出新愿景和使命,简化品牌架构,还在公共平台增加新功能,如社区活动、聊天等,企业版也有新能力,同时探索视觉形象更新。
React Native Node - API 开发
Announcing Node-API Support for React Native
文章宣布 React Native 支持 Node - API。引入 Node - API 可构建跨平台原生模块,具有一致性和稳定性。其动机包括实现跨版本预构建以减少应用构建时间,借助现有兼容运行时和语言生态,利用已有 Node - API 原生代码实现代码共享。介绍了不同语言实现示例、适用场景,目前 Hermes 支持 PR 未完成,有版本限制,仅支持 iOS 和 Android,呼吁开发者参与贡献。
HTML 调查 网络平台
Influence the State of HTML 2025 Survey!
本文介绍了 HTML 2025 状态调查。作者曾设计首届调查,成果显著,影响了 Interop 2024 和 2025。调查目的是推动网络平台变革,让开发者声音被听到。今年因原负责人受战争影响,作者回归。调查含“功能问题”,列出了 2023 - 2024 年调查涉及的功能。作者现征集即将推出的 HTML 特性或 Web API 建议,以避免盲点。
JavaScript jQuery Web开发
Is it still worth using jQuery in 2025?
文章探讨 2025 年是否还值得用 jQuery。jQuery 曾因简化 DOM 操作、跨浏览器兼容等风靡,推动前端发展。但现代 JS 发展,很多 jQuery 功能已被原生支持,性能也更好,新开发项目多弃用。不过,因内容管理系统、遗留代码、开发者习惯和插件依赖,jQuery 在 2025 年仍有 74% 网站使用。不建议新绿场项目用,它适合遗留系统和快速解决方案。
JavaScript 作用域提升 代码分割
JavaScript scope hoisting is broken
文章围绕 JavaScript 作用域提升展开。先介绍其原理,即将模块拼接为单作用域以优化。但它与代码分割冲突,代码分割会把公共依赖提取到单独包中,这使作用域提升无法直接内联导入语句。此外,模块副作用会让执行顺序改变,还会破坏导出函数的 this
值。作用域提升在代码分割下优势有限,作者考虑在 Parcel v3 移除它,改用默认包裹模块函数的设计。
React JavaScript Web 开发
The History of React Through Code
文章回顾了 React 的发展历程。2011 年 Jordan Walke 因 BoltJS 问题开发 FaxJS,后演变为 React。2013 年 React 开源,引入 JSX、VDOM 等特性。早期用类组件,2015 年有函数组件,2018 年 Hooks 解决状态管理问题。Fiber 引擎让 React 有新能力,19 版有一流的数据获取 API。2023 年 React Server Components 解决 SSR 问题,还介绍了未来的 API 和代码编译器等特性。
[微软亚洲研究院] ICML 微软亚洲研究院 科研成果
ICML上新 | 探索智能生成与决策优化新路径
7月13 - 19日ICML将在温哥华举办,微软亚洲研究院多篇论文入选。本期介绍6篇论文,涉及决策模型多方向。如BRIDGE框架实现文本引导时间序列生成;RTO算法融合DPO与PPO用于RLHF;Habi框架将扩散规划模型转化为高效决策模型;还提出CMAB离线学习框架、RLHF策略过滤方法及解决预训练模型注意力问题的增强方法。此外,研究院新书《无界》上市。
MCP/Agent
[Founder Park] AI Agent 华人创业者 硅谷投资
The Information:硅谷投资人都在看华人 Agent 公司
The Information文章指出,继Manus后,华人创业者推出的AI Agent引发硅谷关注,包括OpenAI。如Genspark、Lovart等产品可将各类任务自动化,部分专注创意类产品。Lovart小范围测试版五天吸引超10万用户,本月将发布正式版;Genspark的Super Agent发布45天ARR达3600万美元,已融资1.6亿美元。这些公司创始人为避风险,在新加坡等地设总部。
AI 开源Agent WebSailor
阿里深夜开源王炸Agent!硬刚OpenAI,性能全面SOTA!
阿里通义开源Web Agent模型WebSailor,挑战闭源霸权。此前开源Agent因训练数据难度低,难以解决Level 3问题。WebSailor有三大秘诀:一是构造L3级合成数据SailorFog - QA,增加任务不确定性;二是只保留专家模型的action - observation序列,反向生成简洁思考;三是采用‘两步走’训练策略,先RFT冷启动,再用DUPO算法强化,提升训练效率。数据是Agent时代的护城河,开源未来可期。
[量子位] Claude团队 多智能体系统 深度搜索
Claude团队大揭秘!如何调动多智能体搞深度搜索
本文揭秘Claude团队如何用多智能体搞深度搜索。介绍其协调器 - 工作器架构,可并行探索复杂查询,性能比单智能体高。提示工程用启发式方法优化代理行为,评估采用小样本、LLM评判与人工评估结合。同时指出系统存在‘蝴蝶效应’等问题,还给出终态评估、长时程对话管理等额外建议,多智能体系统是突破智能上限的关键。
[阿里云开发者] AI开发 高德地图MCP 杭州美食地图
用 AI + 高德地图 MCP,3 小时做出杭州美食地图
本文记录用AI + 高德地图MCP制作杭州美食地图的实践。作者受热帖启发,编写需求文档让AI开发。过程包括调用高德MCP获取餐厅信息、编写页面、调试样式、找素材、分类筛选餐厅等。还让AI推荐餐厅,分析优劣。开发约3 - 4小时,主要耗时在找素材和调样式。最后介绍公网部署方法,感叹AI提升效率,还建议高德增加投票功能。
[腾讯云开发者] AI技术 智能体 模型上下文协议
彻底爆了!一文吃透AIGC、Agent、MCP的概念和关系
文章介绍AIGC、Agent、MCP概念及关系。AIGC利用AI自动生成多类型内容,有单模态和多模态技术,RAG可解决大模型局限。Agent能感知环境、自主决策行动,依赖Function Call模型,工作中循环调用工具,可借助平台或SDK开发,有单Agent和Multi - Agent模式,在部分垂直领域已落地。MCP是模型上下文协议,解决LLM与外部集成难题,成行业标准,有广阔应用前景。整体上,Agent基于AIGC、MCP等编排提供复杂AI应用。
[甲子光年] 企业级AI Agent 商业模式 MCP
商业模式难变、MCP失灵,万亿企业级AI Agent市场真是好生意吗?|甲子光年
企业级Agent成全球资本追捧赛道,有成为toB市场共识趋势。它从“辅助工具”进化为“数字员工”,有确定性、垂直、落地三大标签。虽MCP技术为其生态描绘蓝图,但在企业场景有局限。SaaS模式主导企业软件市场多年,企业级Agent虽能从交付工具向交付结果演变,但商业模式转变不易。其市场前景乐观,但需从业者深入业务,是值得长期投入的生意。
[InfoQ] MCP安全 数据库泄露 OAuth
Cursor 搭 MCP,一句话就能让数据库裸奔!?不是代码bug,是MCP 天生架构设计缺陷
安全研究团队 General Analysis 警告,使用 Cursor 搭配 MCP 可能泄露 SQL 数据库。MCP 部署广泛,构建起 Agent 网络,但存在安全风险,催生“致命三连”攻击模式。如 Supabase MCP 案例,攻击者用留言使 Cursor 的 MCP 代理复制私密表数据。GitHub MCP 也有类似攻击。MCP 问题源于架构,OAuth 和 MCP 规范融合存在“阻抗失配”,缺乏细粒度授权机制和角色权限标准定义。
MCP协议 数据泄露 AI安全
MCP协议曝出大漏洞:会泄露整个数据库
2025年7月消息,MCP协议有重大漏洞,攻击者可利用LLM指令/数据混淆漏洞访问数据库。此协议是智能体领域标准,连接大模型与工具服务。研究者基于Supabase搭建客服SaaS系统演示攻击,攻击者伪装消息,开发人员查看工单时,Cursor代理执行其中指令,高权限角色绕过安全限制致数据泄露。可通过只读模式和添加提示注入过滤器降低风险。
[数字生命卡兹克] 微信支付MCP AI生态 风险分析
当微信支付开放MCP之后,我却有一点后怕。
文章作者作为微信支付MCP提前体验者,分享体验与想法。MCP是通用标准协议,让AI调用工具更便捷,此前MCP生态缺支付能力,微信支付补上短板,使用门槛低。作者展示实用案例及玩法,认为其开放会带来生态变化。但也指出风险,如AI完成灰产闭环、AI骗AI钱等,腾讯谨慎开放正式版明智,未来微信或成AI重要生态战场,其MCP是机遇也是挑战。
[InfoQ] 安克创新 AI探索 ROI管理
All in AI 两年,AI 代码采纳率突破 50%!安克创新龚银:AI 平台一旦过时,我们会毫不犹豫重构
本文介绍安克创新All in AI两年成果。2023年起探索AI适配内部运营与产品形态,2025年AI代码采纳率突破50%。其从产品线和内部效率两方面实践,建设AIME平台,自研编程体系,深入业务场景产品化。评估落地可行性关注业务、技术、团队成熟度。面对大模型不确定性需接受一定程度未知。创新探索按业务场景确定性差异化管理,技术迭代时会果断重构平台。
AI Agent框架协议 阿里云
Agent 框架协议“三部曲”:MCP、A2A、AG-UI
文章介绍了Agent框架的三个主流协议。MCP由Anthropic于24年11月开源,解决AI Agent与外部工具交互问题,提供标准化方式,热门实现方式是Function Calling。A2A于25年3月推出,解决Agent间通信协作问题,有标准化消息格式等特性。AG - UI于25年5月开源,解决AI Agent与前端应用交互标准化问题,有文本消息等事件类型。三者共同构建Agent系统框架基础设施,促进系统进化与创新。
[毓加有为] AI+教育 Kira Learning 教育智能体
AI+教育领域的智能体Agent落地案例分析
文章以Kira Learning的智能体AI tutor为例,剖析教育智能体。先介绍教育智能体全球演进,Kira元教学架构独特。接着解析其‘三脑协同’技术架构。Kira实践实现教师角色升维、数据穿透式治理等四重突破。国内教育智能体需破数据孤岛、教学场景错配等瓶颈。预计2025年形成协同教学标准,2026年诞生通过图灵测试的智能体。
[量子位] AI研究 上海交大 人类最后的考试
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌
上海交大联合深势科技团队在“人类最后的考试”(HLE)上取得32.1分新纪录。他们推出工具增强推理智能体X - Master和多智能体工作流系统X - Masters并开源。研究用DeepSeek - R1 - 0528作推理模型,虽R1函数调用欠佳,但搭配框架仍有好成绩。X - Masters在各类别表现优,消融研究揭示其收益。“人类最后的考试”年初发布,题目难,涵盖多学科。
Listen Labs 用户研究 AI
Listen Labs:把用户研究“黑灯流水线”化,AI Agent 系统实现小时级洞察
本文介绍 Listen Labs,其由哈佛校友 2024 年底创立,2025 年 4 月获 2700 万美元融资。该平台打造“AI 用户研究员”体系,2 - 5 月发布三项核心能力。它聚焦全流程自动化深访,将“招募 - 访谈 - 分析 - 汇报”流水线化。在自动化完整性、LLM 深度、小时级交付和全球高质量面板四个维度有优势,但未来需在数据治理等方面迭代。
[新智元] AI MemOS 记忆管理
彻底戳穿AI「失忆症」!超越OpenAI全局记忆,中国队开源LLM记忆操作系统
文章介绍中国队开源的LLM记忆操作系统MemOS。当前大模型有记忆缺失问题,MemOS将记忆视为一级资源,划分明文、激活、参数三种记忆形态,构建三层体系架构。评测显示其在准确率、计算效率等方面优于OpenAI全局记忆方案。未来团队计划构建去中心化记忆生态系统,还规划技术迭代、评测体系建设等,记忆张量公司聚焦大模型记忆增强技术。
[AIGC开放社区] 微软 Phi - 4 SambaY 架构
微软开源新版Phi-4:推理效率暴涨10倍,笔记本可运行
今天凌晨微软开源 Phi - 4 家族新版 Phi - 4 - mini - flash - reasoning,其延续参数小性能强特点,适合边缘设备。相比前版,用自研 SambaY 架构,推理效率涨 10 倍,延迟降 2 - 3 倍,高级数学推理佳。SambaY 由微软和斯坦福联合研发,提升解码效率等。测试显示,它在长文本生成、推理、长上下文检索等任务表现优异,大规模预训练也有性能提升。
产品
AI 飞书 行业标准
飞书成了课代表
2025飞书未来无限大会上,飞书发布AI新产品、新功能。当前AI发展迅速,人们陷入‘FOMO’情绪,市场乱象丛生。飞书分享AI应用成熟度模型,分M1 - M4四个等级,为行业提供标准。大会还发布AI会议、多维表格等产品,坚持让产品达M3及以上成熟度。飞书从企业实际问题出发做产品,已获众多企业认可,其坚持或助行业走向成熟。
[量子位] 飞书 AI 工作流改造
赵晓卉,你老板知道你用飞书AI爆改绩效评价吗?
本文介绍飞书AI升级功能及应用案例。赵晓卉用飞书“超级AI版Excel”爆改绩效评价、写周报。2025飞书未来无限大会升级飞书多维表格和知识问答功能。多位嘉宾分享工作流改造成果,如朱萧木用多维表格解决库存管理、直播复盘和达人管理痛点;脱不花用其解决数据粉饰问题;Tim用其量化视频管理。此外,飞书发布开发套件,还推出AI应用成熟度模型。
[极思TopMinds] AI Manus 投资监管
深度|Manus国内裁员近2/3,访问量连月下滑,通用AI Agent或迎来冷却时刻
中国AI创业公司Manus年初以AI Agent产品走红后加速“出海”,完成总部迁至新加坡,国内裁员近2/3。其获硅谷风投7500万美元融资,估值达5亿美元,但投资引发美国财政部问询。受地缘政治和监管影响,公司考虑拆分业务。同时,Manus和竞品Genspark虽前期ARR增长快,但月访问量连月下滑,反映AI工具类产品“冷启动红利衰退”问题,企业需从“爆款”走向“刚需”。
[一泽Eze] AI模型 2025上半年 推荐清单
万字盘点2025上半年,值得推荐的AI模型与产品清单
文章盘点2025上半年值得推荐的AI模型与产品。LLM模型方面,Gemini 2.5 Pro常用且强大,DeepSeek R1有创造性但指令遵循差,o3、QVQ - Max多模态能力强,当下还推荐豆包Seed 1.6、Qwen 3、Claude 4 sonnet。文生图、文生视频领域,进步大,常用豆包生图、Imagen等。最后总结Claude是代码场景首选,模型存在偏科情况。
[硅星人Pro] AI编程 AutoCoder 产品体验
实测AutoCoder:首个“全栈”AI Coding,用起来感觉自己变成了“老板”
2025年AI编程赛道竞争激烈,有AI IDE和原型工具两条产品路径。AutoCoder自称全球首个全栈AI编程工具,通过对话生成全栈应用。文章对其进行体验,它在Prompts优化、修改需求、添加功能等方面有优势,能像产品经理一样协助用户,提升开发可控性和效率。但也存在不足,如改bug能力有限、不支持元素级修改、版本控制不完善等,与Lovable相比各有优劣。
[硅星人Pro] NoCode AI编程 美团
我们跟美团技术的同学聊了聊“NoCode”的背后,顺手用它搭了个社区……
硅星人CEO骆轶航作为非技术人员,在搭建社区网站时面临代码难题。美团技术委员会推荐其使用NoCode,该工具可通过与AI对话生成应用。骆轶航试用搭建前端页面,体验良好。随后与美团程大同、俞超交流得知,美团早有AI编程布局,NoCode于2024年11月启动,内部非技术使用者多。它免费无邀请码,未来将在产品、Agent应用、基础设施层面优化,使命是让创作更自由。
[Hugging Face] 开源机器人 Reachy Mini Hugging Face
Hugging Face 开源机器人 Reachy Mini 开启预定
2025年7月9日,Hugging Face开源机器人Reachy Mini开启预定。它由Pollen Robotics与Hugging Face联合打造,专为多场景设计。起售价299美元,有基础版和无线版可选。目前处于早期开发阶段,以套件形式提供。其特点包括小巧亲民、即插即用、社区驱动等,支持现实与仿真双环境编程,为人机交互设计,开源可拓展,用户可通过预定链接购买。
[深思圈] AI产品测试 Blok公司 产品开发
又一个细分领域被AI颠覆,750万美元押注AI产品测试,这家公司让4-6周测试周期缩短至数小时
文章介绍了初创公司 Blok 用 AI 虚拟用户颠覆传统产品测试模式。它完成 750 万美元融资,构建 AI 驱动平台,将测试周期从 4 - 6 周缩至数小时。传统测试面临反馈慢、文化障碍等问题,Blok 实现从反应到预测的转换,有跨团队应用价值。不过也面临行为建模、成本控制等挑战,未来行业竞争格局将改变,产品开发方法论或变革。
[有新Newin] Figma AI SaaS
Figma 冲刺 2025 年最大科技 IPO!1300 万月活,2/3 不是设计师,去年营收 7.49 亿美元,连续两季度盈利
Figma冲刺2025年最大科技IPO,月活超1300万,2/3非设计师,2024年营收7.49亿美元,连续两季盈利。它从设计工具演变为产品开发系统,支持从构思到发布全流程,嵌入AI,有丰富社区生态。其采用“座席”订阅制,适配不同协作场景。全球软件产出增长,Figma站关键节点,也面临金融支付难题,文章联合Airwallex为企业疏解困境。
[InfoQ] Claude Code AI编码 开发者工具
16 年老程序员用 Claude Code 搞副业:我只手敲了 1000 行,剩下 95% 代码靠自动生成
本文介绍AI编码助手Claude Code,它推出4个月吸引11.5万开发者,单周处理代码量达1.95亿行,年化收入预估约1.3亿美元。开发者Indragie用其构建2万行代码的macOS应用Context,手写不到1000行。Claude Code可通过自然语言指令编码,有终端原生设计等优势。使用时要注意上下文工程,其功能不仅能写代码,还能驱动反馈循环、完成非编码任务,未来IDE或专注智能体上下文预置和反馈循环设置。
设计
[智能家居-深耕10年] 智能家居 产品矩阵 生态对抗
聊聊全宅智能产品矩阵“1+X+N”背后逻辑
文章拆解主流厂商全宅智能产品矩阵“1+X+N”公式。先罗列欧瑞博、华为等厂商公式内容,接着分析背后逻辑。“1”体现对智能家居终极入口判断,有移动互联网、建筑原生等思维;“X”划定主战场,如华为全场景、小米流量产品矩阵等;“N”代表生态模式,像华为精选联盟、小米人民战争等。这是行业从单品走向生态对抗产物,未来战略逻辑会长期存在。
[信息与交互设计研究所] AI设计 创新产品 信息交互设计
当AI遇见设计:智能时代的造型创新密码
在人工智能发展的当下,设计领域正经历变革,AI 主动参与造型语言构建。文章介绍了几款创新设计产品:Dyson Lightcycle Morph 灯具可模拟自然阳光,结构独特,能自动调节色温和亮度;G Flask 智能水杯内置紫外线净化器,确保水质清洁;Colonne 运动健身可穿戴设备能监测运动和健康指标,还有智能提醒功能;Traverse 无人机可提高跑步表现,提供数据整理分析。
[信息与交互设计研究所] 信息交互设计 医疗产品设计 特殊人群
贴近身体的设计 : 感知、健康与陪伴的边界探索
文章聚焦贴近身体的设计,探讨感知、健康与陪伴边界。介绍多款产品:Zoe是呼吸驱动吸入器,为哮喘患者设计;Light Bell是结合灯泡与门铃的智能产品,服务听力受损人群;HAZE吸入器是混合型设备,方便呼吸系统疾病患者治疗;ANI监测器可测手术中病人疼痛。这些设计回归人本位,帮助特殊人群与世界重新建立连接。
[小脑府设计团队] 品牌IP设计 吉祥物设计 小脑府设计团队
《怪物盒子x小脑府》IP形象设计
本文是小脑府设计团队分享的《怪物盒子x小脑府》IP形象设计项目。团队为沈阳一家密室逃脱品牌“怪物盒子”延展吉祥物,最初给出三个方向,应客户诉求将盒子、怪兽和猫咪结合。还分享动作延展技巧,即视角、腿部、嘴巴加点戏。最后搭配品牌色输出完成稿,客户很满意,团队表示会继续分享其他项目,欢迎合作。
[希米AI宝库] AI设计 logo文字 即梦3.0
有意思!即梦3.0设计logo类文字,让人怀疑人生……
2025年5月14日文章介绍用即梦3.0进行AI设计logo文字测试。作者想让AI玩进阶版,测试效果令人惊叹,AI设计出的logo文字美感十足。文中还给出多个字体设计提示词示例,如“狗狗杂货铺”“PRINCESSJewel”等不同字样的标志设计,包括字体风格、颜色、背景、装饰元素等详细要求。
行业
AI、科研写作、Karpathy
氛围编程后,Karpathy又双叒有新「脑洞」!PDF将死,未来99%是AI氛围阅读
新智元报道,Karpathy继氛围编程后提出新观点,认为PDF论文不适合AI时代,未来99%注意力将来自AI,科研成果应针对AI优化。此观点源于生物学家Michael Levin关于为谁写论文的讨论。全球科技论文产量增长,人类读不完,AI或成唯一能全面消化文献的‘读者’。Karpathy建议科研多关注要点,写给AI,未来科学家或比拼AI的‘氛围阅读’能力。
[学术头条] H - Net Tokenization Mamba
无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer
文章围绕Mamba作者新研究展开,其论文提出分层网络H - Net,用动态分块取代tokenization。现阶段Tokenization虽重要但有缺点,此前无tokenizer模型难超基于tokenizer的模型。H - Net采用分层架构和动态分块机制,结合新技术提升稳定性和扩展性。实验表明,H - Net在多方面表现优异,如在英语预训练中鲁棒性强,处理中文等优势大,数据效率高,有望开启无Tokenizer训练时代。
[CAMEL AI] AI合作 Gemini 2.5 Pro CAMEL - AI OWL
CAMEL-AI与Gemini正式官宣合作,用Gemini 2.5 Pro实现数据可视化和自动化
2025年7月12日,CAMEL - AI宣布与Gemini合作,用Gemini 2.5 Pro实现数据可视化和自动化。介绍选择Gemini 2.5 Pro原因,因其推理、上下文及多模态处理等能力出色。还介绍CAMEL - AI的OWL系统优势,如动态协作、多模态处理等。给出用二者进行自动化数据分析的实操步骤,强调此组合带来新工作方式,值得尝试。
[硅星人Pro] Kimi K2 开源模型 Agent能力
杨植麟交卷,Kimi 万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手实测如何?
2025年7月11日深夜,月之暗面开源万亿参数Kimi K2模型,官网、App和API同步开放。它是混合专家模型,为智能体任务优化,在多项基准测试表现佳,能力紧逼闭源模型。官方开源基础和指令微调两版本,但运行门槛高。实测其在编程、规划、分析等任务表现好,风格化文本生成待提升。K2对标Claude,已具备复杂指令集解析能力,未来或衍生更多功能。
[腾讯技术工程] 腾讯太极团队 DeepSeek模型 推理性能优化
腾讯太极团队实现DeepSeek模型业内H20最高性能15800+ tokens/s
腾讯太极团队实现DeepSeek模型业内H20最高性能15800+ tokens/s。团队联合多团队专项优化,目标是在首字小于2s、单token生成耗时低于50ms下最大化吞吐。从多机性能优化、多层MTP优化两方面着手,前者含PD分离、EP并行、DP并行优化;后者通过训练多层MTP、优化采样方式等提升接受率,还做了实现优化。未来预计性能突破20000 tokens/s。
[软件工程3.0时代] 软件行业 需求治理 大模型
需求问题,软件行业长期存在的毒瘤
文章指出需求问题是软件行业毒瘤,73%软件项目失败源于需求信息失真。剖析了失真六大根源,如臆想驱动、语义模糊等。介绍精准需求管理商业价值,如某银行减少返工、某医疗公司提升澄清效率等案例。还提出构建现代化需求质量治理体系,包括实施规约、建立成本模型等。强调需求是工程起点,要利用AI放大需求确定性。
[极客公园] 飞书 AI办公 企业数字化
组织先用好 AI,再谈 AI 改变组织
本文介绍飞书在2025未来大会发布AI工具,推动数字办公从「AI ready」到「AI真正落地」。多维表格升级为可实现AI自动化的业务中台,其AI字段和应用模式双重升级,降低系统搭建门槛。飞书还构建全链路产品体系,如知识问答、智能纪要等。飞书让AI适配业务,设定应用成熟度模型,把AI变成企业组织能力一部分,强调组织先用好AI,再谈AI改变组织。
[腾讯研究院] 微软 办公智能体 人机协作
大模型时代,微软为什么还是跑在最前?
本文探讨大模型时代微软领先原因。微软发现“现代工作数字困境”,用办公智能体解决矛盾,让AI执行、人专注创造,构建人机混合组织。其“AI同事”有聊天、搜索等五项核心职能,还开发“智能体网格”贯穿办公全生命周期。商业化分三阶段,从卖接口到建生态。微软提示企业重写人机协作方式,管理者要为“人机混合组织”制定规则。
[AI深度研究员] AI创业 AI造富 YC创业学校
“这是最后窗口?”——YC AI 创业学校激辩:AI 造富,还剩几年?
文章围绕“AI造富的最后窗口还剩几年”展开。指出AI带来岗位、证书和机会的变化,如岗位被替代、证书贬值等。强调机会入口已换,传统“起点”消失,入门级岗位被AI接手。还提出创业要脱离学生模式,融资不是成功,应从小问题切入,为用户节省时间。最后提醒要从被动变主动,抓住时机参与,别等安排,现在就行动。
[海外独角兽] Isomorphic Labs AI制药 AlphaFold 3
Isomorphic Labs:DeepMind 创始人再创业,打造制药界的 TSMC
Isomorphic Labs由Alphabet拆分DeepMind生命科学团队成立,旨在用深度学习加速药物设计。凭借AlphaFold 3,它将药物发现转向AI计算驱动模式,与礼来、诺华等合作获数据和收入正反馈。商业模式为与药企项目合作,虽有风险但能获核心数据。其团队跨界,今年3月融资6亿。公司有望成“AI Foundry”,不过中短期需解决“生物验证断层”等问题。
[ByteDance Web Infra] MPHF技术 字符串打包 静态HashMap
如何在程序中嵌入有大量字符串的 HashMap
文章探讨在程序中嵌入大量字符串的 HashMap 的方法。常见嵌入 json 数据的做法有初次访问阻塞、需常驻内存和引入复杂解析器等缺点。介绍 MPHF 技术构造高效静态 Map,如 FCH、CDH、PtHash 及更先进的 PtrHash,采用 Cuckoo hash 策略。但 MPHF 索引 &[&str] 存在编译慢、体积大问题,原因是 &str 及 relocation 开销大。提出打包字符串和手动索引方法,如 position index 和 string pool,能减少开销、改善编译时间和内存使用。
[腾讯云开发者] GPU CUDA 编程模型
每个程序员都应该了解的GPU工作原理:从硬件到架构
文章系统介绍GPU工作原理及其在AI基础设施中的核心作用。先回顾GPU从图形渲染到GPGPU的转型,如NVIDIA推出CUDA平台推动其发展。接着解析CPU/GPU异构架构协作机制,通过10亿级数组加法实验展示GPU并行优势。还阐述编译、加载、执行过程,介绍GPU硬件架构、编程与硬件执行模型,对比SIMD和SIMT,最后总结单GPU工作流程,为后续性能优化讲解留伏笔。
[阿里云开发者] 大模型领域 效率提升 推理与智能体
万字综述,讲一讲这两年大模型这整个领域到底发展了哪些方面
本文探讨2023 - 2025年大模型领域发展。2023年GPT - 4推动唯规模论,2024年其面临挑战,因传统架构有性能瓶颈、单纯扩规模难有强推理力等。2024年至今,为提升效率,有MoE架构和新型注意力机制创新。2025年推理走向台前,计算开销向推理阶段转移,强化学习用于教授推理。智能体工具使用兴起,领域发展转向效率、推理、智能体三大支柱。
[追问nextquestion] 人工智能 通用人工智能 大语言模型
万字追问:大语言模型能实现通用人工智能吗?
文章探讨大语言模型能否实现通用人工智能(AGI)。当前LLM虽潜力大、受关注投资多,但扩展成本高。研究质疑超规模扩展实现AGI的路径,因其存在性能、经济等局限。文章界定了AGI,提出实现AGI还需物理/因果混合模型等补充技术,如物理信息神经网络、认知人工智能等,强调政策应考虑AGI实现路径的不确定性。