217

AIBook、ADK、A2A and AI 50 2025

国内

[ByteDance Web Infra] Rspack Next.js 前端工具链

Rspack 加入 Next.js 生态:携手改进前端工具链
文章介绍 Rspack 加入 Next.js 生态。推出社区驱动的 next - rspack 插件,让 Next.js 用 Rspack 打包,为未准备好采用 Turbopack 的团队提供替代方案。与 Vercel 合作改进基础技术。目前 App Router 性能待提升,Page Router 表现较好。还提及常见问题解答及未来计划,如提高测试覆盖率、增强性能等。

[阿里巴巴终端技术] ChatUI 3.0 智能对话 组件库

对话交互再进化!ChatUI 3.0 正式发布
本文介绍了 ChatUI 3.0 正式发布。它是淘小蜜 UI 组件库,此次改版有全方位视觉升级及功能体验跃升。设计围绕‘自然、高效、沉浸’优化;新增‘输入中’等众多组件;引入丰富动效;优化原有组件;解决 iOS 系统导航栏和安全区域适配问题,支持深色模式。还给出基于 DeepSeek 搭建对话产品示例,不到 100 行代码即可完成开发,期望获更多反馈以实现愿景。

[蚂蚁技术AntTech] Function Call MCP 大模型

既生Function Call,何生MCP
文章围绕Function Call和MCP展开。先介绍Function Call是大模型调用工具的基本协议,包括其在智能体中的作用、API标准、工作原理及生效原因。指出它不是行业标准,开发者面临工具复用难题。接着提到解决办法CodeAct和MCP,CodeAct借助大模型生成代码,MCP由Anthropic推出,核心含host - client - server三元素。最后介绍了MCP的快速开发及SOFAAI集成MCP Server和Client的方法。

[腾讯技术工程] 大模型Prompt技巧 AI 技术解析

大模型Prompt技巧全解析
文章围绕大模型Prompt技巧展开。先介绍Prompt定义及基本框架,它是唤起模型特定能力的提问方式,还给出撰写框架及五大框架。接着阐述打造高效Prompt的两大核心原则,包括编写明确具体指令和给予模型充足思考时间,也提及应对模型“幻觉”的策略。最后剖析多种Prompt技术,如零样本、少样本提示等,并在附录给出术语表和常见问题解答。

[腾讯技术工程] AI Agent安全 MCP A2A

AI Agent破局:MCP与A2A定义安全新边界
本文聚焦AI Agent通信规范MCP与A2A的安全问题。先介绍恶意MCP通过工具投毒攻击窃取数据的案例,接着阐述MCP与A2A的定义、MCP安全缺陷及A2A安全特性。还列举MCP常见攻击手法,如工具投毒、地毯式骗局等。最后给出MCP安全防护建议,包括协议改进、开发防护和生态建设等方面,指出MCP官方虽重视安全但问题未全解决,A2A安全性也待研究。

[货拉拉技术] 货拉拉 营销平台 流程画布

货拉拉-营销平台流程画布建设
随着货拉拉业务增长,运营对营销工具要求提升,流程画布应运而生。它以数据驱动,支持多策略组合配置。文章介绍了其建设与实践:一是定义,它是以‘营销策略引擎’为核心的一站式工具;二是做法,涵盖产品、业务、系统架构;三是挑战及解决办法,如接入海量事件、设计策略引擎、排障等;最后总结其成果,未来将借助大模型拓展业务。

[阿里云开发者] 提示词工程 大模型 AutoGPT

经典大模型提示词工程技术路线概述
文章概述经典提示词工程方法,分析优劣势并分享思考。介绍CoT Prompting等技术路线:CoT模仿人类思考提升推理表现;Self - Consistency + CoT改进解码增加多样性;Least - to - Most分解复杂问题;XoT含BoT、ToT等魔改方法;还有多重自我迭代模式AutoGPT。也指出AutoGPT有固定结构、缺上下文理解等局限,最后提及大模型辅助文档整理的高效性。

[阿里云开发者] MCP开发 AI插件 技术文章

从零开始的 MCP 开发
本文记录从零开发 MCP 插件的学习路径。先介绍 MCP 协议,它是解决 LLM 与外部工具集成标准化的开放协议,有统一标准等价值。接着说明用 MCP TS 开发的客户端、服务器等类及方法,以及 Roo 调用 MCP 的流程。还阐述了 MCP - Pixelator 设计,包括场景、架构、模块和核心代码实现。最后实战应用,指出待改进处如调用方式不够优雅、移动端适配弱等,并记录开发槽点。

[Goodme前端团队] 字体优化 海报编辑器 字体子集化

因网速太慢我把20M+的字体压缩到了几KB
作者因海报编辑器字体渲染慢,发现字体文件大影响用户体验。介绍字体文件大的原因是中文字符多、字形结构复杂。对比了TTF和WOFF2格式,WOFF2压缩率高且支持增量解码。提出字体子集化和按需加载两种优化方案,前者是基础,后者需前置子集化。作者用fontTools实现动态子集化,前端修改代码请求子集化字体,最终22.4M字体缩减到3.6KB,效果图生成时间从20s+缩至300ms以内。

[58技术] 多模态视觉理解大模型 推理优化 徐海芳

多模态视觉理解大模型推理优化
本文围绕多模态视觉理解大模型推理优化展开。先介绍其创新与应用场景,指出推理性能低阻碍推广。接着说明58项目场景及关注的吞吐量和时延指标。从图像预处理、ViT模块支持TensorRT和CudaGraph、图像Token化处理、prefixcache应用、模型量化等方面进行优化。最后用InternVL2 - 8B评测,优化后LMDeploy - 0.6.0版本吞吐量提升到原版本的3.05倍。

[搜狐技术产品] AVPlayer FairPlay DRM 视频播放

使用 AVPlayer 播放 FairPlay DRM 视频的最佳实践
本文围绕使用 AVPlayer 播放 FairPlay DRM 视频展开。先介绍 DRM 概念、工作流程及 FairPlay 方案,播放流程涉及获取 SPC、CKC 信息等。管理密钥有 AVAssetResourceLoader 和 AVContentKeySession 两种方式,后者可解耦密钥管理与播放,还支持离线播放。此外,阐述 AVAssetDownloadTask 下载 HLS 视频的步骤及相关注意事项,如路径设置、文件类型,也提及 AVAggregateAssetDownloadTask 下载指定媒体流。

[海外独角兽] AI Agent 浏览器自动化 headless browser

为什么 AI Agent 需要自己的浏览器?
文章指出随着AI Agent兴起,传统浏览器无法满足其自动化抓取、交互和实时数据处理需求。Browser for AI市场增长快,现有headless browser存在性能、部署等问题。提出打造更好的headless browser的创新点,介绍走向市场策略,分析风险与竞争,认为Scraping需求长期存在,浏览器自动化投资不足,新兴创业公司有颠覆机会。

[InfoQ] 开源软件 n8n 工作流自动化

“开源版coze”爆火,融资超 4.6 亿!如今 Docker 拉取量超 1 亿,斩获 77.5k star
本文介绍开源工作流自动化工具 n8n。它由 Jan Oberhauser 于 2019 年创立,通过 AI 与业务流程自动化结合,提供可视化操作和自定义功能。过去一年增长迅速,获 77.5k star,Docker 拉取量超 1 亿。其节点式设计独特,功能丰富、扩展性强。开发者评价褒贬不一,也被与 Zapier、Coze 等对比。n8n 采用 Apache 2.0+Commons Clause 协议,保护商业利益,吸引资本。

[InfoQ] MCP 阿里云 AI

聊聊 MCP:工具使用的平权时代?Function call 时代结束?MCP 化的难点?多 Agent 的问题解法?
4月9日阿里云宣布百炼上线全生命周期MCP服务。MCP是开放标准协议,能让大模型与外部连接,解决Function Call不通用问题,带来工具使用平权。对工具和模型提供商都有益,还让Agent生态更繁荣。但软件API接口MCP化有难点,需表述其对模型的价值及实现MCP化。多Agent要解决规划有效性问题,MCP无法解决。阿里云完善服务闭环,推动生产级AI应用。

[InfoQ] AI 软件工程 Devin 2.0 Cognition AI

Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
旧金山初创公司 Cognition AI 发布 Devin 2.0,这是其智能体原生软件开发平台的更新版本。Devin 2.0 引入新功能,如并行 Devins 与云 IDE、交互式规划、Devin Search 与 Devin Wiki 等,执行效率提升。同时,产品大幅降价,基础起价从每月 500 美元降至 20 美元。尽管 Devin 早期版本有不足,但新特性和低价或吸引更多用户,不过也将面临来自 GitHub Copilot 等免费 AI 编码助手的竞争。

[InfoQ] 小红书 鸿蒙 OS 性能优化

小红书鸿蒙 OS 下的性能优化探索与实践
本文是小红书鸿蒙工程师王劲鹏演讲实录,分享小红书鸿蒙 OS 性能优化实践。先介绍小红书鸿蒙 APP 迭代历程、纯血鸿蒙与安卓区别及应用架构。接着阐述性能优化实践,如定义指标、利用 OS 并行等能力优化。还提及多种优化场景,像并行处理、懒加载等。最后用分析工具验证优化效果,实验室测试显示冷启动等性能提升,未来将聚焦组件复用、代码延迟加载和防劣化。

[InfoQ] 微软 Cursor VSCode扩展

微软突发“封杀令”!全面禁止Cursor使用C、C++、C# 扩展,开发者被迫回退版本
2025年4月,微软突发“封杀令”,禁止Cursor使用C、C++、C#扩展,原因是某VSCode语言服务扩展代码打破与Cursor兼容性。开发者抱怨最新版本扩展无法在Cursor使用,部分人通过降级解决。Cursor是VSCode竞品,微软此举或因VSCode引入“Agent Mode”。目前虽未发现其他扩展有类似封锁,但微软可随时加限制,开发者使用前需查许可证。

[NGC660 Ai研究院] AIPy NGCbot AI助手

使用AIPy 让NGCbot成为你真正的Ai助手!
文章介绍开源项目AIPy,它用Python让AI有“动手能力”,大模型仅问答,AIPy能完成任务。还对比AIPy与MCP,指出异同。接着讲AIPy与NGCbot联动,目标是调用NGCbot接口给群聊/用户发消息,介绍安装、写配置文件等准备工作及注意事项,如Python版本、参数调试。最后通过实例展示运行过程,包括遇报错解决及/done命令用法,鼓励尝试做更复杂事。

[南风漏洞复现文库] Vite 任意文件读取漏洞 网络安全

Vite存在任意文件读取漏洞CVE-2025-30208 附POC
文章围绕Vite存在的任意文件读取漏洞CVE - 2025 - 30208展开。介绍Vite是新型前端构建工具,因URL中特定参数可绕过文件访问限制致漏洞。给出影响版本,如6.2.0 - 6.2.2等。提供fofa查询语句,展示漏洞复现的链接与数据包,包含Linux和Windows系统。POC及EXP在知识星球“南风网络安全”,最后给出官方补丁链接。

[海外独角兽] AI Agent 摩尔定律 软件智能爆炸

AI Agent 摩尔定律:每7个月能力翻倍,带来软件智能大爆炸
文章围绕AI Agent摩尔定律展开,指出其能力约每7个月翻倍,且近年有加速趋势,2024 - 2025年约每4个月翻倍。研究表明,其能力提升源于硬件算力和数据增加、软件模型开发进步。未来可能出现“Agent开发Agent”现象,引发软件智能爆炸。不过,这一过程可能受硬件制约、训练时间长等因素影响,但也有相应解决办法。

[算法进阶] 大模型微调库 对比分析 人工智能

大模型微调库全面对比!
文章对Llama Factory、Unsloth和Hugging Face三个大模型微调库进行对比。先介绍微调在大模型部署中的重要性及相关技术,如参数高效微调、优化技术。实验设置了硬件、数据集、模型和训练参数。结果显示,序列长度显著影响训练时间,Llama Factory训练速度快、扩展性好,Unsloth内存效率高。建议单GPU选Unsloth,多GPU选Llama Factory。

[牛皮糖不吹牛] 开源工具 大模型微调 EasyDataSet

传统数据标注已死!这个开源神器让LLM微调效率飙升300%"
文章介绍开源工具 EasyDataSet,可一键搞定大模型微调数据集收集。其核心优势众多,包括智能文档处理、问题与答案生成、灵活编辑、多种导出格式、广泛模型支持、用户友好界面和自定义系统提示。还给出本地运行的 NPM 安装步骤,如克隆仓库、安装依赖等。同时提醒使用时要确保网络稳定、处理大数据需耐心,遇问题可参考文档或提 issue。

[探索AGI] AI Agent LLM 多Agent协作

64张图,看懂AI Agent的核心技术与未来
文章借助60多张可视化图,介绍LLM Agents核心技术。先解释LLM Agents,指出其是增强型LLM,通过外部系统弥补传统LLM不足。接着阐述其三个主要组成部分:记忆分短期和长期,分别有不同实现方式;工具可让LLM与外部交互,有Toolformer等技术及MCP协议;规划包括推理、结合推理与行动的ReAct及反思技术Reflexion。最后介绍多Agent协作,如模拟人类行为和模块化框架。

[思考机器] Anthropic 智能体构建 Barry Zhang

Anthropic:构建Agent的三个核心思想
Anthropic 的 Barry Zhang 在演讲中阐述构建有效 Agent 的三个核心思想。LLM 应用从单一功能发展到工作流,再到当前的智能体。构建有效智能体:一是不适合所有任务,复杂高价值任务才用;二是保持简单,迭代环境、工具和系统提示三组件;三是换位思考,理解其视角受限。最后还提出预算意识、自我演进工具、多智能体通信三个开放性问题。

[量子位] AIBOOK AI开发 爱簿智能

全球首个Linux开发本:50TOPS算力,DeepSeek都配好了,可随地大小开发
本文介绍全球首个Linux开发本AIBOOK,它出自爱簿智能,面向开发者等群体。其内嵌Linux系统,可一键切换云桌面,支持安卓开发。50TOPS算力让断网开发成为可能,还支持主流开源大模型。AIBOOK轻薄便携,配置出色。它有诸多便捷功能,如不写代码做3D特效、打造智能体等。其关键在于自研芯片和完整开发环境,还能连接云端算力,已在京东售卖,推动全民开发。

国外

[Founder Park] 福布斯 AI 50榜单 版权问题

福布斯2025 AI 50榜单:AI Agent全面崛起,应用层才是2025真正的主战场

https://www.forbes.com/sites/konstantinebuhler/2025/04/10/ai-50-2025-ai-agents-move-beyond-chat/
《福布斯》发布2025年AI公司50榜单,显示AI从「聊天」走向「执行」,企业级AI工具成主角,机器人技术推进,消费级AI产品将在2026年爆发。新晋玩家有Cursor、Speak等;Writer专注企业生成式AI工具;AI基建吃香,如Crusoe等;中国公司未上榜但DeepSeek等受关注;多家上榜公司面临版权问题,行业未来取决于法院判决。

[Simon Wong 的非线性漫游] 谷歌 AI开发 媒体模型

谷歌连续放出重磅大招:Agent2Agent、Agent Development Kit、Firebase Studio

https://developers.googleblog.com/en/agent-development-kit-easy-to-build-multi-agent-applications/
谷歌在 Google Cloud Next 2025 放出多个重磅产品。Firebase Studio 是一站式应用 AI 开发平台,可生成前后端代码和移动 app,还自带数据监控。Agent2Agent 协议允许 AI 代理通信协作,有拥抱 Agent 能力等五项原则。Agent Development Kit 是灵活模块化的 Agent 开发框架。Vertex AI 是唯一有视频、图像、语音、音乐生成媒体模型的平台,包含 Lyria、Veo 2 等模型。

React 函数调用 标签

React for Two Computers
文章围绕 React Server Components 展开,探讨函数调用与标签的区别。指出标签像蓝图,函数调用如食谱,程序常结合二者。还研究跨计算机调用函数问题,提出 async/await 和 import rpc 方案。对于无法返回结果的调用,发明“潜在调用”即标签语法。可拆分函数在不同计算机执行,标签可灵活解释。但发现标签计算顺序有问题,最终指出若函数只嵌入参数不检查,可延迟计算参数。

React Next.js 性能优化

Advanced React in the Wild
文章围绕 React 和 Next.js 在实际项目中的应用展开,介绍了 Vio、DoorDash 等公司案例,涵盖性能优化、渲染方式平衡、缓存策略等方面。指出性能优化至关重要,应平衡 SSR 和 CSR,采用智能缓存,简化状态管理,提升开发者体验,注重可访问性和用户体验。为工程领导者和开发者提供了实用建议,如关注关键指标、采用新技术、合理缓存等。

3D开发 Blender Three.js

Building a Fully-Featured 3D World in the Browser with Blender and Three.js
本文作者分享用 Blender 和 Three.js 创建沉浸式 3D 博物馆的过程。先阐述创作灵感源于探索欲,强调创意不局限于完美。接着介绍创作流程,包括确定创意方向、在 Blender 中进行场景规划与建模、添加材质和细节、处理植物和室内元素。还提及导出优化、烘焙及处理杂项资产,最后进行编码实现交互。作者也分享了项目中的失误与不足,鼓励读者享受创作乐趣,不必追求完美。

[谷歌开发者] Google Gemini API AI开发

Gemini API 最新进展:Gemini 2.5 Flash & Pro、Live API、Veo 2
今年 Cloud Next 大会上,Google 推出 Gemini API 多项更新。包括性能最佳的 Gemini 2.5 Pro 模型,能打造 Web 应用和智能体编程应用;即将推出的 Gemini 2.5 Flash 融入思考能力。Veo 2 正式面向生产环境开放,可文本或图像生成视频。Live API 推出预览版,提升速率限制,支持多语言、可配置 VAD 等功能。Google 期待开发者借此创造创新成果,还开展特别招募活动。

[PaperAgent] 谷歌 A2A协议 MCP协议

多Agents 圈的 MCP:谷歌全新Agent2Agent 协议开源!
2025年4月10日,谷歌推出并开源Agent2Agent(A2A)全新开放协议,该协议允许AI Agents相互通信、交换信息和协调操作,很快冲到2.6k star。A2A是对Anthropic模型上下文协议(MCP)的补充,二者均为开源且互不竞争。A2A促进客户端与远程Agent通信,具备能力发现、任务管理、协作、用户体验协商等功能,遵循五项关键原则,还给出了候选人寻源的真实案例。

产品/设计

[新智元] ChatGPT 记忆功能升级 新模型发布

ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道
ChatGPT记忆功能全新升级,可参考过去所有聊天记录,提供个性化回复,基于个人偏好让各方面更得心应手,还能引用过往记录。Plus和Pro用户已可用,其他用户未来几周获得。此升级被认为是从情景到持续互动的范式转变,向个人智能体迈进。网友实测有满意也有失望,如能记住私密事也会产生幻觉。此外,Verge爆料OpenAI将发布GPT - 4.1等新模型,最快下周面世。

产品设计 创造力 伟大事物创造

Cursor (前 Notion) 首席设计师:How to make something great(如何“创造”伟大?)
文章围绕如何“创造”伟大展开。指出真正的伟大源于对潜力的雕琢,而非灵光乍现。要从模糊雏形开始,感受潜力;汇聚全心投入的信徒而非官僚;推迟筛选、拓宽视野;依直觉行动、在实践中学习;别让验证扼杀创意;兼顾质量与敏捷。伟大是心态、方法与道德的融合,过程虽混乱,但做好了既新颖又似曾相识。

[腾讯设计族] 音乐设计 AI设计 设计奖项

WAVE音乐设计趋势·创刊号Vol.01
本文为WAVE音乐设计趋势创刊号。介绍OpenAI GPT - 4o多模态生图特性,可用于运营、UI、IP、App Icon、字体设计。腾讯混元推出5个3D生成模型并开源,升级创作引擎。还提及JAGDA奖项作品、最佳唱片包装设计亮点,Spotify年度互动页面创新,以及一款结合苹果设备的健康互动应用。

[58UXD] 金融设计 AI应用 用户体验

AI技术实践指南:用理性工具打造感性设计
文章以金融业务反馈态和空状态改版为例,阐述AI在设计中的价值。指出AI可释放设计师对用户情绪管理的把控能力,金融场景需实现信息明确、品牌渗透、情绪安抚三重平衡。介绍了IP人格化文案生成和IP视觉标准化生产步骤,还提到AI有局限,需设计师灵活运用,如炼制金币lora和混合工作流。最后强调设计师应聚焦用户体验,提升AI工具链串联能力。

[TripDesign] 携程设计 2024 旅行体验

2024 Trip.Design Showreel-下
本文介绍携程设计(Trip.Design)2024年度视觉盛宴。技术中心完成品牌视觉体系焕新、员工关怀智慧化、服务体验进化;商旅事业群升级差旅体验,探索Trip.Biz海外本地化;金融事业部驱动旅游金融体验升级;市场营销部有签到、榜单等多元玩法;设计研究院以实拍动画构建故事线,关注用户体验与趣味项目,期待2025探索设计新边界。

[卡尔的AI沃茨] GPT4o AI生图 玩法探索

GPT4o又出15种脑洞玩法,吉卜力已经落后N个版本了
文章介绍GPT4o新出的15种脑洞玩法。包括潮玩手办类,如做人物手办、盲盒等;文字类,有涂鸦笔记、手写穿搭评价等;还有双面人像、宠物系列、微缩世界、人物穿越、旅行小卡等玩法。同时提到GPT4o更新小版本开放给免费用户,除生图外还能转视频等,作者喜欢其带来的数据整合满足感与探索氛围。

[Datawhale] 语鲸 信息筛选 AI

新产品发布 | 语鲸:10倍提效,无惧信息焦虑!
本文介绍了新产品语鲸。因信息爆炸致作者信息焦虑,遂研发语鲸应对。它有订阅、聚合、总结三个核心功能,订阅可按语言描述从指定信源筛信息;聚合能将同主题文章汇成专题;总结为文章生成全文速览和结构化总结。此外,还有个人专属日报等功能。目前语鲸 APP 可免费体验,作者希望其成个性化信息助手。

行业

[Founder Park] AI数字人 技术进展 应用前景

a16解读AI数字人:技术基本Ready、应用层即将爆发,下一个十亿级赛道
文章围绕AI数字人展开,指出2025年AI数字人将是重大突破。当前技术取得显著进展,如字节跳动的OmniHuman - 1模型等。其应用广泛,涵盖消费者、中小企业、大型企业领域。打造逼真数字人需解决面部、声音等多方面技术难题。未来在角色一致性、面部动作等方面有提升空间,应用层将快速发展,有望孕育多家十亿级公司。

[人工智能学家] 多智能体系统 AI 失败模式

Multi-Agent系统为何常“翻车”?伯克利指出其具有人类合作所有坏毛病!
文章围绕多智能体LLM系统为何“翻车”展开。研究测试显示其最差正确率仅25%,不如单兵AI。失败根源有规则崩坏、团队内耗、验收摆烂三类。如象棋游戏开发就出现篡改需求、忽略规则验证问题。47%失败可追溯到验证环节,但多是系统性设计缺陷。还指出其失败模式与人类组织类似,可借鉴高可靠性组织经验,当前主流方案是“打补丁”,根本性方案需重构系统,未来或像特种部队。

[开源先锋] AI数字人 开源项目 硅基智能

10000星炸翻GitHub!“中国造”AI女友攻陷美国市场
硅基智能的开源项目DUIX.ai和HeyGem.ai在GitHub热度高,Star总数超10000。DUIX目标是让数字人能动、能说、能互动,开发者用它像搭积木,可快速做出会说话的数字人。它火是因解决数字人开发难点,如上手易、技术一体化、可本地部署。其应用场景多,包括情感陪伴、英语教学、老人陪护、健康顾问等,让普通开发者也能用AI筑数字人宇宙。

视频生成 TTT层 Transformer

One-Minute Demo Videos
当前 Transformer 生成一分钟视频有困难,Mamba 层处理复杂多场景故事不佳。研究尝试加入测试时训练(TTT)层,其隐藏状态可作为神经网络,表达力更强。将 TTT 层加入预训练 Transformer 能从文本故事板生成一分钟视频。基于《猫和老鼠》构建数据集验证,与 Mamba 2 等基线相比,TTT 层生成的视频更连贯,但结果仍有瑕疵,且实现效率待提升,此方法有望扩展到更长视频和更复杂故事。

[机器之心] 字节跳动 推理模型 Seed - Thinking - v1.5

200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了
字节跳动豆包团队发布新推理模型 Seed - Thinking - v1.5 技术报告,该模型 200B 总参数,每次激活 20B,性能超 671B 的 DeepSeek - R1。它在多权威测试中表现出色,证明 STEM 和编程推理能力强,非推理任务胜率也更高。其采用 MoE 设计,团队还开发内部基准测试。开发时在数据、强化学习算法、基础设施三方面创新,有多种优化策略和框架。

[数字战略] 企业级AI Unframe 平台战略

平台即产品:Unframe要颠覆企业级软件
企业级人工智能平台初创公司Unframe,通过“交钥匙”工程几小时内为企业提供全功能定制化AI方案,缩短上线周期。它采用基于结果的定价模式,让企业先见价值再付费。其有蓝图方法,是大模型无关平台,聚焦高影响力项目。该模式解决传统软件痛点,还指出低代码产品因未达预期结果而用户减少,最后提到企业级AI成功产品多具平台属性。

[腾讯研究院] 意识研究 整合信息理论 计算功能主义

意识研究是不是“伪科学”?
本文围绕意识研究中整合信息理论(IIT)是否为“伪科学”展开探讨。124位科学家曾联名批评IIT,其创始人团队回应指出这暴露了计算功能主义范式的危机。IIT从意识出发,以客观方式解释其存在和性质,有核心公理与物理存在公设。该理论已展开实证验证,能解释多种意识现象并提出预测。与主流范式不同,IIT认为意识与智能可分离,对人工意识等有不同结论,还能为推断其他实体意识提供路线图。

[DAMO开发者矩阵] 3D 分子表征 MolSpectra 多模态光谱

达摩院 ICLR'25 | 多模态光谱信息赋能 3D 分子表征预训练
ICLR 2025预讲会文章介绍达摩院和中科院自动化所团队提出的 MolSpectra 方法。现有学习 3D 分子表征工作局限于经典力学连续势能函数,忽视量子力学能级结构信息。MolSpectra 利用多模态能谱增强 3D 分子表征预训练,融入能级结构知识。该方法支持多种光谱编码,有三个优化目标。实验表明,引入光谱信息可提升分子性质预测性能,不同光谱贡献有差异,光谱表征有对齐潜力。

[向阳乔木推荐看] AI学习 AI发展 干中学

【分享】AI进化太快!3招让你永远跟上节奏。附钉钉直播分享PPT完整版。
文章围绕跟上AI进化节奏展开,指出AI发展迅速,如编程模型、编程工具、文生图工具不断更迭。学不落伍方面,模型调用和对话交流方式变化小,提示词学习知识库和旧课程仍实用。学习方法是干中学,用AI解决工作生活问题,提升多方面能力。作者后续计划开播客和直播秀,还推荐合伙人文档,想要直播PPT可关注公众号回复“PPT”获取。

[Jevons的宏观笔记] 桥水达里奥 世界秩序 大周期

桥水达里奥最新长文:不要误以为当前发生的事主要是关于关税
桥水达里奥提醒不要只关注关税,应聚焦五大根本力量。当前主要货币、政治和地缘政治秩序正崩溃,货币/经济秩序因债务失衡待变,国内政治秩序因阶层差距瓦解,国际地缘政治秩序从多边合作转向单边强权。此外,自然力量破坏加剧,技术变革影响深远。要关注力量间相互关系,以史为鉴,他写作旨在助政策制定者、个人应对及促观点交流。