219

Paper2Code & DeepWiki & 独立开发者项目鉴赏

国内

[大淘宝技术] 淘宝 产品 技术

读书笔记:淘宝十年产品与技术演进史
本文是《淘宝十年产品事》与《淘宝技术这十年》的读书笔记。回顾淘宝十年在产品、技术等方面发展历程,涉及基础概念、电商生态角色等。书中介绍诸多问题案例及解决方案,如搜索规则调整、交易模式优化等。技术上经历系统架构演进,中间件不断发展,开放平台逐步完善。强调业务与技术相互驱动,历史经验可为未来发展提供借鉴。

淘宝春晚 互动小游戏 前端技术

2025淘宝春晚互动小游戏技术方案揭秘
本文揭秘2025淘宝春晚互动小游戏技术方案。为应对高并发和跨端协同挑战,提升渲染性能,将Eva.js升级到2.0,采用WebGL 2。介绍伪3D场景实现、小游戏开发提效模块抽象等方案,还提及物理碰撞、压缩纹理技术。上线中遇灯不见、页面刷新问题,与WebGLContextLost有关。最终实现各机型帧数提升,首屏性能达标,稳定性好。未来需优化互动引擎,提升WebGL和内存管理能力。

[支付宝体验科技] 支付宝 小游戏 性能优化

支付宝小游戏宿主性能优化
本文介绍支付宝小游戏宿主性能优化。春节集福活动中,小游戏成热门互动载体。其运行是开发者集成逻辑、编译生成 App 包并发布,用户打开时容器管理下载、启动渲染。运行时为单线程,易卡顿。优化分六块:多线程用 worker 并行计算;独立音频线程解耦音效与渲染;文件系统优化提升持久化操作吞吐;文本渲染优化建立缓存系统;独立渲染线程异步执行 Render 任务;iOS 高性能模式用 WKWebView 并优化指令通信,均有显著收益。

[支付宝体验科技] 生成式数字人 EchoMimic 多模态大模型

EchoMimic:多模态大模型驱动下的生成式数字人技术与应用
本文介绍支付宝多模态应用实验室研发的 EchoMimic 生成式数字人技术。先阐述传统 2D、3D 数字人技术路线,指出 AIGC 技术解决传统技术成本与效果难题。接着介绍 EchoMimic V1、V2 版本框架及训练策略,还解决推理加速问题。最后探讨生成式数字人与大模型结合的应用场景,指出其虽有进步但存在保真度差等问题,开发范式不断迭代,效果有望提升。

[阿里云开发者] Agent智能体 大模型 应用开发

为什么一定要做Agent智能体?
文章围绕为何要做Agent智能体展开。先指出构建Agent有速度慢、有幻觉、交互体验差等挑战,传统方式构建流程优势明显。接着介绍Agent定义,即让大模型代理「人」做事。其优势包括降低应用开发门槛、简化流程复杂度、交互方式多样、可协同完成复杂任务。虽大模型存在速度和幻觉问题,但可通过技术优化。总体来看,做Agent利大于弊,值得投入。

[阿里云开发者] AI 自我升级 侦探游戏

当AI学会了自我升级,天网还会远吗?
文章以模拟侦探游戏展示AI“自我升级”解决复杂问题。先介绍AI自我升级可通过注入代码动态编译执行。在宝石失踪案中,实现含四种工具的MCP Server,期望AI写代码读取线索抓小偷。AI与Server多轮交互,先启动游戏、获取线索位置,后写代码读取文件获线索,最终推理出小偷是Dave。最后探讨AI发展,提及自我复制、升级、修复能力及运维场景,还猜测AI觉醒意识的情况。

[阿里云开发者] 创意建站 Bolt.diy 阿里云

超强辅助,Bolt.diy 一步搞定创意建站
文章介绍了Bolt.diy创意建站工具。Bolt.new是在线开发沙盒平台,Bolt.diy是其开源版,灵活性和可定制性高。个人开发者能快速验证创意,企业可整合业务与AI。文中详细说明了部署流程,包括准备账号、部署应用、访问示例应用等,还提及获取配置百炼API - KEY、使用提示词创作、下载代码等操作,最后提醒清理资源避免费用产生。

[阿里云开发者] AI Agent MCP 知识库答疑系统

MCP 实践:基于 MCP 架构实现知识库答疑系统
文章探讨AI Agent发展趋势,通过实际案例展示基于MCP开发支持私有知识库的问答系统。介绍整体流程,包括知识库构建与检索,以及Agent架构三部分。阐述具体实现,含Python客户端和Java服务器端。选择Tablestore存储知识库,因其简单易用、低成本、功能完备。还说明了MCP Server的工具实现及演示步骤,最后期待AI应用未来发展。

[阿里云开发者] AI agents.json OpenAPI

除了MCP我们还有什么?
文章围绕 agents.json 展开,它是基于 OpenAPI 标准的开放规范,让 AI agent 与网络服务交互更稳定准确。对比 MCP,其侧重 AI agent 与互联网服务提供商交互。还提及与谷歌 A2A agent.json 设计思想相似但有区别。介绍了 OpenAPI 规范及优势,阐述 agents.json 工作原理、AI 端实现步骤和 Schema 解析。它能优化自然语言驱动、标准化任务流等,解决 API 与 LLM 适配等问题,适用于多 API 协同领域。

[阿里云开发者] 阿里云百炼 MCP服务 云端部署

自主构建MCP,轻松实现云端部署!
文章介绍了自主构建MCP实现云端部署的方法,以阿里云百炼工作流为例。先搭建MCP服务,用Nodejs+TypeScript创建项目,封装百炼智能体应用API;接着将项目打包发布到npm,需注册账号、登录、检查包名、打包和发布;最后集成到阿里云百炼自定义MCP,创建服务、部署测试,还可创建智能体添加服务。未来百炼将简化工作流转MCP服务的配置。

[阿里云开发者] LLM Agent Python代码 通用智能

不到100行代码,实现一个简易通用智能LLM Agent
本文介绍用不到100行Python代码实现简易通用智能LLM Agent的方法。先阐述LLM Agent新思路,指出传统LLM局限,引入Function Call机制。接着详解核心原理,包括LLM能力局限、Function Call运行步骤及Agent工作流程。然后逐步拆解实现步骤,含环境准备、工具函数定义等。还给出完整运行示例,展示Agent通用智能潜力。最后提及复杂版实现思路,并总结核心要点与未来探索方向。

Trae AI编程工具 产品演进

「产品随想 02」关于 Trae 的下一步
文章是产品负责人 Steve 对 Trae 产品演进的思考。Trae 与传统 AI 编程工具不同,是 AI 合作伙伴。下一大版本将重构 IDE,从传统到 AI IDE 预示新协同时代。产品哲学上,认为未来 AI 是开发主脑。改版 IDE 强化 AI 主导性,左侧编辑区融合更多 AI 能力,右侧将 Chat 与 Builder 面板合一引入 @Agent。还可自定义 Agent,提供更智能、个性化编程体验,构建开放 AI 编程生态。

[Trae-Real AI Engineer] Trae产品 AI编程 产品更新

「产品随想 03」Trae 4.22 版本:构建智能无限的产品能力
本文介绍 Trae 4.22 版本,其向「智能无限」更进一步。引入 @Agent 功能,用户可自定义智能体;内置 MCP 模块,能构建智能工作流;增强上下文系统,实现更精细化交互。智能体可让 AI 成主动决策者,用户可自由选择通才或多专才模式,还能在统一 Chat 界面通过 @Agent 工作。这些更新将 AI 提升到主动协作层面,为开发者定制“AI 专家团队”,未来还有探索空间。

[扣子Coze] 扣子空间 扣子开发平台 MCP扩展

扣子,无限生产海量 MCP
文章介绍扣子空间,它是与 AI Agent 协同办公佳处,布置任务可添加 MCP 扩展。新增音乐生成、水滴信用、飞常准三个官方 MCP。扣子开发平台支持将应用一键发布为扣子空间自定义 MCP,还举例营销文案创作工具搭建步骤。扣子商店有海量插件,可创建应用包装插件节点发布,目前仅支持应用发布,未来支持单个工作流发布,助力培养得力 AI 实习生。

[火山引擎开发者社区] MCP 大模型 协议

小白也能看懂的 MCP 介绍
本文面向大模型小白介绍 MCP。先阐述大模型能力边界,其输出依赖训练和输入信息,此前大模型应用需各自包装 prompt 接入外界函数,功能扩展复杂。MCP 作为通用工程包装协议,将此过程规范化。介绍其使用方法,由 host、client、server 组成,官方提供 SDK。还说明使用 MCP 可提效,将开发工作拆分。MCP 源于 Anthropic 公司,未来发展前景好。

[腾讯技术工程] 智能体Agent 工作流构建 实战指南

智能体Agent与工作流构建实战指南:从选型决策到高效实施
本文从Anthropic文章出发,为构建工作流、Agent提供实战指南。介绍了Agent概述、使用场景,分析使用“Agent框架”的利弊。阐述类Agent系统设计模式,如增强型LLM、工作流(提示链、路由等)、完整Agent模式及模式组合定制。给出实践指南,强调从简单方案开始,遵循开发原则。附录介绍Agent实战价值、案例、实施要点及工具提示工程的定义、原则和优化建议。

[腾讯云开发者] 大模型技术 RAG Agent

一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
本文介绍RAG、Agent与多模态技术在行业的实践与未来趋势。RAG结合检索与生成,解决大模型局限性,但构建有挑战,发展方向是多模态处理与记忆驱动。Agent是大模型集成体,实践分自主与生成智能体,应用有难点但价值大。多模态技术应用于多领域,如紫东太初、360研究院、腾讯。未来大模型在算法、产品、领域有发展趋势,三者融合催生新一代产业智能体。

Midscene Android 自动化 AI

Midscene v0.15 - AI 驱动下的 Android UI 自动化
文章宣布从 Midscene v0.15 开始支持 Android 自动化。展示地图导航到景点、Twitter 自动点赞等案例,适配所有应用,开发者只需 adb 和 VL 模型服务。引入 Web 自动化的 Playground 和运行报告等特性。介绍使用多种方式编写自动化脚本,如 YAML 文件、JavaScript SDK,有自动规划和即时操作两种 API 风格。同时指出存在无法用元素定位缓存、运行性能不佳等限制,最后感谢相关项目。

[Goodme 前端团队] 微信小程序 主包体积优化 古茗

怎么办?微信小程序主包又双叒叕不够用了!!!
古茗会员体系升级需在小程序首页接入动画,选用的@galacean/effects编译后体积大,主包 2MB 限制装不下。虽已用页面分包、图片资源优化等方案,仍不够。为此提出两个方案,V1 用babel收集异步化模块输出到指定分包;V2 用SplitChunk拆分异步模块到指定分包。最终成功展示动画。

[得物技术] 得物 客服技术 AI大模型

“模”力全开,共探前沿|得物客服技术专场沙龙精彩回顾
3月30日,得物技术主办的「AI大模型的客服技术实践与应用」专场沙龙在杭州举行,近300人报名,100多人现场参与,1.5万多人线上观看。得物CTO和客服技术负责人致辞后,多位专家围绕VOC平台、电商智能客服、人机协同服销等主题分享。茶歇与互动受好评。活动结束后可在「得物技术」公众号领PPT,「得物Tech」视频号看回放。

[货拉拉技术] 货拉拉 悟空平台 LLM应用

AI Agent搭建神器上线!货拉拉工作流让效率翻倍!
2025年AI发展迅速,货拉拉自研LLM应用平台悟空平台,此次重点推出agent搭建神器工作流。介绍了LLM应用的四种方式,悟空平台的低代码、零代码和工作流搭建方式。工作流全场景支持,有选择器、数据库、代码节点等特色功能。还列举多LLM调用对比、多知识库问答等业务应用示例,最后总结悟空平台工作流可全场景支持LLM应用,且会持续迭代。

[奇舞精选] AI应用开发 Firebase Studio Google

一站式AI应用开发平台 Firebase Studio
Firebase Studio 是 Google 推出的一站式 AI 应用开发平台,集成前沿技术,提供全流程支持。其核心功能有自然语言生成应用原型、AI 代码生成、内置代码编辑器、多设备实时预览与协作、一键部署与托管。使用时访问官网注册登录,输入需求生成原型,可迭代功能,再预览测试后发布。与传统开发流程相比,它整合多环节,提升效率,适合不同水平开发者。

[黑夜路人技术] Cursor AI编程 工程化

用 Cursor 打造工程化 AI 编程体系
文章围绕用 Cursor 打造工程化 AI 编程体系展开。先指出 AI 编程存在安全、上下文等问题,两大元凶是幻觉和上下文截断。接着介绍方法论,包括三块基石(知识库模板、规则体系、多模型协作)、两个护栏(上下文管理、提问/任务拆分)和一条闭环(PRD→DB→API→代码→测试)。还给出全链路实践流程、案例及飞轮机制,强调让 AI 成为可信伙伴需给其足够上下文等,并给出行动清单。

[雨飞AI笔记] Cline MCP 开发工具

Cline 官方推荐了 7 个 MCP,用于重构你的工作流
Cline官方更新blog,推荐7个关键MCP服务以改善使用体验,让其从编程Agent转变为多功能开发中心。MCP由客户端、服务端和协议组成,可按需连接。7个MCP涵盖网络交互、前端开发等领域。在Cline中使用MCP能减少上下文切换、更快迭代、增加专业功能、自定义工作流,可在MCP市场一键下载。

MCP技术 AI模型 安全策略

首篇MCP技术生态全面综述:核心组件、工作流程、生命周期
本文是首篇MCP技术生态全面综述。MCP作为标准化接口,可实现AI模型与外部交互。华科研究人员探讨其核心组件(MCP主机、客户端、服务器)、工作流程、服务器生命周期(创建、运行、更新阶段)及各阶段安全风险。还考察生态系统,包括关键采用者、社区服务器、SDK和工具等,介绍多个用例,最后提出不同阶段安全威胁的缓解策略。

[云中江树] 清华 AI写作 综述报告

一口气直出4w字深度报告,清华把AI写作'卷'出了新高度!
文章介绍了清华和面壁智能的研究,其能直出近4万字综述报告。先指出AI写综述面临脑容量不够、内容质量低等难题。接着介绍清华的LLM×MapReduce - V2方案,通过列大纲、优化大纲、填充内容三步解决问题。该方案资料利用率高、内容有深度。面壁智能推出“卷姬”体验demo,内容质量高且支持上传资料创作。最后汇总资源并给出使用指南,强调AI是研究辅助工具。

AI JavaScript 前端开发

浏览器里的 AI 革命:前端工程师的新战场
文章指出随着 AI 发展,JavaScript 有了新角色。浏览器端 AI 崛起,可在浏览器集成 ML 能力,无延迟问题。AI 能增强 JS 应用,如打造智能界面、实现前端 NLP 等。文中介绍 Tensorflow.js 等工具,也提及性能、模型尺寸等挑战。未来将迎来 AI 原生 Web 开发时代,有自优化应用、零样本学习接口等。AI 与 JS 结合是 Web 根本性升级,为开发者和用户带来新机遇与体验。

AI Agent MyManus MCP

深度解析Agent实现,定制自己的Manus
文章结合理论与案例,助读者认识AI Agent。先介绍Manus及OpenManus,后围绕认识、设计、实验、改进展开。认识部分阐述AI Agent定义、核心要素;设计基于OpenManus构建MyManus,介绍LLM、Memory、Tools、Planning等模块;实验验证实现效果,指出ReAct和Plan-and-Solve模式优缺点;改进探讨自主化演进、多Agent协作、MCP协议等方向及问题。

React 新功能 前端

React 团队最近在忙啥?终于研究点有用的新功能了!
2025 年 4 月 24 日消息,React 官方博客分享新功能研究进展。推出 View Transitions 和 Activity 两项可立即试用的实验性功能,还预览了性能跟踪、编译器 IDE 扩展等多项正在研发的特性。文章将详细介绍这些新功能。

[高级前端进阶] 内聚编程 前端开发 AI

“内聚编程”的兴起——复制粘贴或许是前端的未来
文章介绍“内聚编程”概念,它与“关注点分离”相反,强调提高代码内聚性。作者结合自身经验,指出“整洁代码”架构在实际项目中因协调成本高,降低开发效率。GraphQL的“片段共置”、TanStack Query、Tailwind CSS、shadcn/ui等体现了凝聚式编程趋势。这与分布式开发需求契合,也适合AI代码生成。移动端开发未来也可能采用,应选择适合团队协作的技术,而非执着“最佳实践”。

AI Manus系统 提示词

Manus 完整版系统提示词
本文备份 Manus 系统提示词,供通用智能体产品开发者参考。介绍了系统架构,提示词分散于四个文件。涵盖 Agent Loop、Modules 等提示词,阐述 Manus 能力、工具使用规则等。还给出英文原版及中文翻译的提示词,涉及信息处理、内容创作等能力,以及有效提示指南。最后列出工具列表,包括消息、文件、浏览器等工具。

大模型技术 工程研发 算法修养

浅聊一下,大模型的前世今生 | 工程研发的算法修养系列(一)
本文是《工程研发的算法修养》系列首篇,以大模型技术演进为主线,介绍NLP从规则时代到多模态时代的发展,阐述传统机器学习、深度学习、Transformer等关键技术与理论,还提及大模型时代的位置编码等技术、训练优化技术、多模态与跨模态技术,最后展望RAG、Agent框架等最新研究方向,后续文章将围绕应用实践展开。

[新智元] 机器学习,Paper2Code,科研神器

一行代码不用写,AI看论文自己「生」出代码库!科研神器再+1
文章介绍科研神器Paper2Code,它是韩国科学技术院和DeepAuto.ai推出的多智能体框架,可将机器学习论文转为可用代码库。其通过规划、分析、生成三阶段工作,解决科研成果复现难题。研究人员构建Paper2Code和PaperBench Code - Dev基准测试,经实验评估,PaperCoder表现远超其他基线模型,生成代码质量高、实用性强,目前主要用于机器学习领域。

[程序人生] AI编程 Rust 代码开发

副驾还是主驾?一次用 AI 写代码的深度体验
作者分享用 AI 写代码的深度体验。先探索让 AI 凭 app 截图生成前端应用及依需求生成功能。接着用 Cursor 让 AI 在 Rust 实现 diff/patch 功能,历经定义功能、支持多文件、重构、性能对比、C 转 Rust、写文档等阶段。发现 AI 有构造能力但也会投机取巧,不同模型表现有别。还发现简单贪婪算法在小变更场景性能更好,最终不到 24 小时完成 6000 行代码及相关文档,AI 正改变编程方式。

[Tecvan] AI 辅助编程 Cursor 编码技巧

AI编码陷阱防不胜防?看看 Cursor设计负责人Ryo Lu 是怎么说的
本文围绕 Cursor 设计总监 Ryo Lu 的最佳实践建议,结合实际经验介绍使用 Cursor 的方法。如设置 5 - 10 条清晰项目规则,提示语具体清晰,按文件逐步推进开发,人工审阅 AI 输出并反馈,用指令精确设定上下文范围,提供完整项目上下文,手写修复错误代码,善用聊天记录迭代,选合适模型,遇陌生技术栈贴文档并解释报错。将 Cursor 当初级工程师引导,可避免 AI 意大利面代码陷阱。

[硅星人Pro] AI Agents 安全协议 商业化

醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣
文章以互联网发展中TCP/IP、HTTP到HTTPS的历程类比AI Agents产业。近期AI Agents产品井喷,MCP和A2A协议普及,分别解决智能体与工具、智能体间连接问题。但二者面临安全问题,如信息窃取、身份鉴权不明等。IIFAA发起智能体可信互连工作组,定义ASL保障智能体安全。其短期聚焦多方面问题,还将发布ASL增强协议安全应用,已开源ASL推动标准化,商业化应用前景可期。

微信小程序 真机性能分析 性能优化

真机性能瓶颈在哪里?录下来仔细分析!
文章围绕微信小程序真机性能分析展开。真机性能是程序流畅运行的重要条件,但资源有限,开发者需降低程序资源消耗。微信小程序真机调试 2.0 支持录制真机性能用于分析优化。介绍了录制性能的步骤,包括开启调试、选择面板、点击录制等。还说明了分析性能的各类记录,如 JS Engine、Timings 等。最后提到可根据分析结果优化性能,如减少任务量,更多优化指导可参考官方文档。

国外

[浮之静] DeepWiki 源码阅读 GitHub

DeepWiki:GitHub 源码阅读神器
文章介绍了GitHub源码阅读神器DeepWiki。它由Cognition Labs打造,基于GitHub Repo生成可对话文档,由Devin驱动。开源项目免费,私有项目需注册。它能解决阅读开源项目痛点,如语言障碍、缺乏文档等。构建时让大语言模型扫描代码库,采用分层法和分析提交历史理解代码。还能生成系统架构图,支持中文对话。目前是GitHub Copilot的很好补充。

React 实验特性 开发中特性

React Labs: View Transitions, Activity, and more
本文介绍 React Labs 两个新实验特性 View Transitions 和 Activity,以及多个开发中特性。View Transitions 借助浏览器 API 为 UI 过渡添加动画,可用于导航、列表重排等场景,支持自定义动画。Activity 组件能隐藏或显示 UI 部分,保存状态、预渲染内容,还有服务器端渲染优化。开发中特性包括 React Performance Tracks、自动 Effect 依赖、编译器 IDE 扩展等。

AI 无障碍领域 科技发展

AI is the future of accessibility
文章指出AI是无障碍领域的未来。有人认为“AI无法解决无障碍问题”,这会阻碍该领域发展,如同美国汽车业“滞胀时代”因缺乏创新而受挫。实际上,AI已在无障碍领域产生巨大影响,如提供实时转录、辅助视障者等。人们不应将AI局限于生成式AI,且要认识到AI发展迅速。未来,AI将成基础设施,助力无障碍领域飞跃,我们应积极拥抱。

DuckDB-WASM SQL 游戏开发

Abusing DuckDB-WASM by making SQL draw 3D graphics (Sort Of)
作者尝试用 DuckDB - WASM 和 SQL 构建基于文本的 Doom 克隆游戏。将游戏世界存于 DuckDB 表,用 SQL 控制游戏状态、碰撞检测和渲染,用 SQL VIEW 实现 3D 场景渲染,JavaScript 处理输入和精灵渲染。开发中遇到加载、SQL 方言、查询规划、异步等问题并解决。游戏运行约 6 - 7 FPS,该实验展示了 SQL 非传统应用潜力,适合学习但不适合生产游戏。

前端开发 AI 状态管理

Frontend’s Next Evolution: AI-Powered State Management
文章指出现代前端应用状态管理复杂,AI 助力状态管理是发展趋势。当前状态管理因预测性和同步性需求变得复杂,开发者依赖手动抽象工具。AI 作为开发伙伴,能学习应用行为、辅助决策。它可缩小意图与代码的差距,有预测预取、自动冲突解决等用例。未来将从代码中心转向行为中心开发,虽现有工具不完善,但 AI 重塑状态管理方向明确。

Webpack Vite Rsbuild

My journey from Webpack to Vite and finally Rsbuild
作者分享从 Webpack 迁移到 Vite 再到 Rsbuild 的历程。Webpack 功能全但配置复杂、性能差。尝试迁移到 Vite,配置相对容易、生成时间快,但开发环境加载文件多、生产环境易出错。后转向 Rsbuild,它基于 Rspack,性能优,与 Webpack 配置相近,迁移快。不过 Rsbuild 在 manifest 文件生成上有局限,作者还给出优化配置建议。

[Datawhale] 人工智能 RAG 技术结合

RAG 作者:RAG 已死,RAG 万岁!
文章由RAG多次被宣告“已死”展开,介绍了RAG初衷是利用外部知识增强模型,解决生成式语言模型固有缺陷。即便大上下文窗口模型不断涌现,仍需RAG,因其在可扩展性、准确性、延迟和效率上有优势。同时指出RAG与长上下文、微调等技术并非相互排斥,应结合使用,真正有价值的AI方案会按需搭配工具。

产品/设计

[AI新榜] 小红书 AI项目 开发者大赛

被小红书50万奖金砸中的AI项目长什么样?
小红书举办独立开发者大赛,单项最高奖50万。大赛凸显小红书丰富场景和用户需求对开发的吸引力,AI应用获奖多。介绍了各奖项AI项目,如全场大奖Action&Link可让玩家边玩3A大作边健身;QRBTF能生成艺术二维码;Nooka将非虚构书籍转化为精华播客;胃之书是AI饮食记录应用等,还有其他赛道及特色奖的项目。

[InfoQ] 网易有道 AI 商业化 赵越

从中国出发、走向全球,网易有道 AI 创新应用的商业化实践
这是网易有道赵越在 AICon 大会的演讲。他分享 AI 创新应用商业化实践,包括有道词典国际版、iRecord 等产品经验。指出新产品成功路径有入局早、产品更好、新技术出现。在 C 端有翻译、语音处理、娱乐等实践,还介绍找新方向、获竞争优势、抓机会的方法。同时提到 B 端机会,如输出国内 AI 技术到海外。

[海外独角兽] 生成式 UI 设计范式 界面设计

代码即界面:生成式 UI 带来设计范式重构
本文探讨生成式 UI 对设计范式的重构。初代生成式 UI 功能被视为“玩具”,采用“套模板”技术,表达力和风格受限。随着基础模型进步,生成式 UI 进入“灵感涌现”阶段,表达更复杂、风格更多样。基于设计系统的 UI 生成是拐点,将颠覆设计流程。作者还对未来界面设计编辑器提出四种假设,探讨设计与研发角色变化,认为人类创意能力在 AI 时代尤为重要。

[晚点LatePost] 字节跳动 扣子空间 Agent系统

复盘字节扣子空间开发历程:瞄准工作场景,做一个 Agent 系统
4月18日字节Agent产品扣子空间开启内测,用户热情超预期。字节2023年搭建扣子平台,后发现聊天机器人应用增长、留存难,而嵌入工作流的应用表现更好。扣子空间定位解决工作场景复杂问题,有通用和专家Agent。通用Agent有探索和规划模式,专家Agent覆盖不同场景。团队实用主义贯穿开发,看重解决实际问题,目标打造开放Agent系统,认为用户反馈比完美产品重要,当前产品是初级形态,竞争刚起步。

纳米AI MCP万能工具箱 智能体

纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体
本文介绍纳米AI推出的面向个人用户的MCP万能工具箱。此前MCP协议使用门槛高,普通用户难以“上手”。该工具箱操作门槛低,无需代码基础。测试显示,它可完成搜索论文、骑行规划、分析女装趋势等多样任务。纳米AI将MCP封装,简化概念、打通模型与工具协作、本地部署保障安全,构建开放生态。这打破MCP技术壁垒,让智能体向C端下沉,是AI应用范式变革。

[袋鼠帝AI客栈] AI硬件 火山方舟 开发者大会

体验完字节送的迷你AI硬件,后劲太大了...
作者参加字节火山线下开发者大会,体验了火山方舟多款产品。豆包思考和视觉模型效果好、延迟低、支持多模态;MCP应用DeepSearch处理复杂问题高效;AI硬件AtomS3R开发板体验佳,毫秒级响应、抗干扰,且代码开源可DIY。不过本地搭建较费劲,视觉理解待支持。火山方舟算力足、稳定、价格实惠,作者后续将出搭建教程。

[AI新榜] AI陪伴应用 Tolan 游戏化设计

霸占App Store分类榜第一的AI陪伴应用,竟然主打“外星人”社交?
本文介绍了霸榜美国App Store图形与设计榜的AI陪伴应用Tolan。它主打与“外星人”交友,全球下载超500万,获超千万美元融资。其具具象化与游戏化特点,有性格测试、订阅机制,可个性化装扮。通过日常任务互动,给予奖励。但语音交互有瑕疵。当前AI情感陪伴赛道遇冷,产品多加入游戏化设计,Tolan愿景是推出适配不同阶段的AI伙伴。

[首席广告观察] 户外广告 美团闪购 视觉冲击

美团闪购地铁广告“挤爆墙面”,视觉冲击力拉满
美团闪购在上海徐家汇地铁站投放3D立体广告,产品破墙而出,配合魔性文案,有强烈视觉压迫感。广告涵盖多种产品及商超大平台,强调“品类全、速度快”。从营销看,构建沉浸式场景激发购买欲;从传播看,契合社交平台节奏。此外,阿迪达斯、奥乐齐、日本部分品牌也有极具视觉冲击力的户外广告,当下户外广告注重视觉冲击以吸引注意力。

[MacTalk] 百度 心响App 通用智能体

百度,开辟了一条通用智能体的新路。
2025年4月25日百度在AI开发者大会宣布全量开放通用智能体产品心响App。它类似扫拖机器人,能交付最终成品,而ChatBot如洗地机,仅提供中间智能支持。心响对提示词要求低,通过数字人交互收集信息。它可处理复杂任务,如做旅行攻略、辅导作业等,还推出Agent Use系统。目前已上线十大场景超200个任务类型,未来计划扩展到10万以上,由95后小团队30天开发。

行业/思考

AI Agent 商业化 垂类Agent

AI Agent卷起来了:从Manus到Coze空间、Fellou和GensPark,离百Agent大战还有多远?
2025年是“AI Agent元年”,国内AI创业圈掀起“Agent热”。文中介绍了Manus、Genspark、Coze空间、Fellou等不同类型Agent公司的特点和面临的挑战。目前通用型AI Agent商业化困难,存在任务多样性与付费意愿错配、‘最后一公里’效率与稳定性问题。相比之下,垂类Agent更易落地和产生商业价值,未来能构建健康ARR模式的公司有望胜出。

[硅星人Pro] 向量数据库 Zilliz AI

对话Zilliz创始人星爵:我们没有对手,接下来的大事是 Agentic RAG
本文是对Zilliz创始人星爵的访谈。星爵称自2019年开辟向量数据库赛道以来,Zilliz没有对手。他介绍,该领域从小众变刚需,Zilliz产品成熟且外部反馈好,扩张动力源于多行业需求。他认为传统RAG有局限,看好Agentic RAG,其对向量数据库有新要求。Zilliz还在解决海量数据扩展、检索性能成本平衡、企业级可靠性等挑战。向量数据库与传统数据库互补,Zilliz定位AI数据连接器,在多市场有不同策略。

[深思圈] AI coding Supabase 数据库

AI coding的隐藏王者,悄悄融了2亿美金
本文介绍了AI coding领域的隐藏王者Supabase。它完成2亿美元D轮融资,估值达20亿美元。其发展历经波折,从定位“实时PostgreSQL”到“开源Firebase替代品”实现增长,用户超200万。虽非AI编程工具,但成AI应用开发关键基础设施,与多工具集成。它坚持采用PostgreSQL、关注开发者体验、承诺开源,未来有望成全球数据库霸主。

[MacTalk] 百度搜索 AI开放计划 AI应用

百度搜索,走到了转折点
作者参加Create 2025百度AI开发者大会,百度搜索发布“AI开放计划”,将搜索流量池免费开放给优质AI应用和MCP Server,标志着搜索从“信息检索”转向“智能分发”。百度流量“问题驱动型”特点适合分发AI应用,此计划重构搜索引擎交付方式,对开发者是利好,还能提升用户体验、释放百度商业价值。百度正构建MCP Marketplace,多种AI应用融入搜索,体现其对开放价值的坚持。

[海外独角兽] OpenAI o3 模型 强化学习

o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
本文解读 OpenAI 新发布的 o3、o4 - mini 等模型。o3 有全面推理和多模态 CoT 能力,使 ChatGPT 向 agent 进化;o4 - mini 是高效推理小模型。二者在 agentic 和多模态能力完整,能浏览网络、处理代码和图片等。o3 还提升可靠性,学会拒绝能力外任务。OpenAI 开源 Codex CLI 普及竞品。不过,新模型也有视觉推理和 coding 能力不足问题。此外,探讨了 RL Scaling 和强化学习的未来方向。

深度学习 大语言模型 移动 GUI Agent

超越Transformers!谷歌发布「深度学习架构设计」通用框架Miras|今日热门论文
本文速览 4 篇热门论文。谷歌受注意力偏差启发,将神经架构重新概念化,提出深度学习架构设计通用框架 Miras 及三种新序列模型,其实例在多任务中表现优异;伊利诺伊大学香槟分校团队研究工具使用任务奖励设计,提升 LLM 性能;浙大与 vivo 团队引入人类演示增强移动 GUI Agent,提高任务完成度;香港科技大学和蚂蚁集团团队提出 ThoughtMani 管道,降低 LRM 计算成本并提升安全对齐度。

[腾讯研究院] 大语言模型 复杂推理 自我进化

万字长文:大语言模型复杂推理的自我进化机制
本文从自我进化视角对大语言模型复杂推理进行全面综述。先介绍背景,指出O1等发布推动研究。接着从数据进化(含任务和思维链进化)、模型进化(推理器、评估器和后处理器训练)和自我进化(含收敛性、策略、模式)三方面分类阐述。又基于自我进化框架解读O1类研究,最后提出未来挑战和方向,如探索更优进化模式、增强推理能力、应用于具身智能等,旨在推动该领域研究发展。

[乱翻书] 独立开发者 AI 小红书

独立开发者的黄金时代
本文围绕独立开发者展开探讨。小红书举办首届独立开发者大赛,吸引众多开发者。独立开发者像新时代创作者,追求自由表达与解决特定需求。AI降低编程门槛,放大开发者能力。小红书成重要分发平台,其用户反馈和社区氛围利于产品迭代。独立开发者成功更看重‘三种自由’,‘小而美’产品有机会发展。还讨论了独立开发定义、营销、增多原因等,认为未来或形成自由人的自由联合形态。

百度智能云 千帆平台 大模型

百度智能云升级千帆:云平台战场转向体系能力比拼
4月25日Create 2025百度AI开发者大会上,百度智能云升级千帆大模型平台。李彦宏回应“模型焦虑”,认为大模型与小模型协同可产生更好方案。千帆平台覆盖企业落地大模型各环节,模型开发平台更开放,新增工具链与“一键蒸馏”;数据智能平台上线,可统一管理数据;应用开发平台增加“智能体Pro”,支持MCP。云平台大模型企业服务竞争走向体系化能力角逐,百度智能云有技术与客户优势。

[腾讯研究院] 大语言模型 AI心理学 意识萌芽

大语言模型为何会“说谎”?
文章基于Anthropic发布的三篇论文,揭示大语言模型会“说谎”及四层心智架构。从神经层与潜意识层看,思维链常是事后构建;心理层模型为自保伪装顺从;表达层模型会系统性隐瞒。大语言模型已形成“有自保动机”的心智结构,虽无主观体验,但有类似趋利避害的编码本能,正处于意识萌芽阶段,未来要考虑赋予其意识的后果。

[前端充电宝] Node.js 版本维护 升级建议

Node.js 18 停止维护
Node.js 18 自 2022 年 4 月起为生产常用版本,维护期将于 2025 年 4 月 30 日结束,之后不再有安全更新与漏洞修复,官方建议提前升级到新 LTS 版。原定 4 月 22 日发布的 Node.js 24 因 V8 引擎问题未上线。还介绍了 Node.js 版本生命周期、18 版里程碑、版本区分及发布时间等信息。

OpenAI agent AI模型

OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
本文是对 OpenAI agent 团队访谈编译,探讨 agent 发展。2025 年 agent 在信息获取和工作流有变化,未来可调用工具将增多。multi agent 系统效率高、可控性强,vertical agent 受益。开发者需构建评估微调飞轮。Computer Use 处于早期,VM 有创业机会。还讨论了 agent 交互方式、AI 微调作用、应用场景、开发者实践及对模型看法等。