公众号 AI Feed 流公众号 Feed
247 篇Z Potentials
更新 17 篇#1深度|跟着Figure创始人参观机器人工厂:通往AGI的最后一块拼图,是让AI触碰真实世界
Sourcery主持人Molly O’Shea访谈Figure创始人Brett Adcock,走进其机器人园区。Figure目标是打造通用人形机器人,让其做人类能做之事。园区可设计、制造、测试机器人,有几百台,能24/7自主运行并自动充电。机器人动作状态极多,靠Helix神经网络控制。如今硬件可靠,问题转向软件、AI和稳定性。其不为单任务造机器人,而用一套硬件适配多场景。还有“Never Fall”项目防跌倒,用强化学习训练控制器。家庭场景中机器人靠Helix自主工作,数据用于训练且会匿名化。制造上,BotQ组装机器人,经严格测试,产品仍处早期。Figure发展快,因创始人有飞行器开发经验。目前已迭代三代,成本降低,Figure 04或带来大跃迁。此外,通过人类数据采集优化机器人,设计追求让人愉悦。
#2速递|OpenAI自研AI芯片遇阻:博通要求微软先买40%才出资
OpenAI与博通去年宣布合作制造定制AI芯片,目标在2030年前上线足够数量芯片以减少对英伟达硬件依赖。但在为第一阶段芯片生产融资时遇阻,博通要求微软先购买约40%芯片才出资。微软未明确购买意向,若未达预期OpenAI需另寻买家。OpenAI此前就习惯未敲定细节便宣布合作,如与英伟达、软银和甲骨文的合作都未成功。OpenAI首席执行官早有定制芯片构想,首款定制芯片Jalapeno预计2027年就绪。此次融资谈判显示微软对OpenAI仍有影响力,不过博通放宽了资金自筹要求,谈判仍在推进。
#3速递|英伟达向IREN投资21亿美元,建设5GW AI数据中心
NVIDIA向数据中心开发商IREN投资高达21亿美元,双方达成广泛合作,加速人工智能基础设施建设。IREN授予NVIDIA五年内以70美元行权价购买3000万股股票的权利,还签署34亿美元AI云合同获取部署Blackwell处理器,目标增加5GW NVIDIA基础设施,主要开发德克萨斯州Sweetwater园区。IREN股价盘后涨约10%,NVIDIA股价基本持平。此外,IREN收购西班牙开发商助力扩张,其曾专注比特币挖矿,此前微软也从其购买AI算力。NVIDIA还投资了IREN竞争对手,其CEO反驳循环注资说法。
#4速递|a16z领投,AI招聘平台Ethos获2275万美元A轮融资
文章介绍AI招聘平台Ethos获2275万美元A轮融资,由a16z领投。传统专家网络匹配质量欠佳,Ethos用AI改善双向体验,为专家提供语音引导入驻流程,收集多领域知识数据,能更好匹配公司自然语言查询。它由James Lo和Daniel Mankowitz于2024年创立,参考多来源数据匹配人选,通过语音Agent访谈提取见解。虽面临竞争,但顶级机构已应用其产品,每周约35000人加入,公司目标是扩规模同时保持团队精简。
#5Z Product | AI Native教育产品爆火:海外播放破5000 万,20岁天才退学联手前Google专家打造
VideoTutor是一款爆火的AI Native教育产品,海外播放突破5000万。它让学生上传题目、选AI Tutor角色,实现实时互动生成个性化视频讲解,重构学习表达方式。其基于自研PDGP模型和渲染引擎,提升AI Tutor在STEM场景的性能。产品解决了传统EdTech无法个性化教学的痛点,面对千亿美金级AI教育市场。团队由20岁华裔创业者赵凯和前Meta与Google专家James Zhan领导,采用“极客别墅”开发模式。该产品完成1100万美元种子轮融资,未来有望成为AI教学基础设施。
#6速递|马斯克官宣xAI解散,Anthropic接盘22万张GPU算力
Anthropic与xAI达成协议,下个月将使用其位于孟菲斯的首个数据中心Colossus 1的全部算力,该中心有300兆瓦容量和超22万颗NVIDIA芯片。双方未透露交易财务细节,Anthropic还表达了与SpaceX合作太空数据中心项目的兴趣。此前xAI还向Cursor出售算力。此外,xAI曾有性能问题,也遭邻居抵制。
#7速递|Anthropic承诺五年向谷歌云支出2000亿美元,占谷歌收入积压40%以上
Anthropic计划五年内向Google投入约2000亿美元,占Google收入积压超40%。目前,Anthropic和OpenAI合同总额约占四大云服务提供商2万亿美元未履约收入一半。OpenAI预计今年服务器支出约450亿美元,Anthropic预计今年超200亿美元。Google Cloud因Anthropic业务营收增长63%,Google积压收入翻番。Amazon收入积压增长49%,OpenAI和Anthropic支出承诺占AWS营收积压约一半。投资者对两家公司支付能力存疑,Oracle股价因相关协议下跌。此外,云服务提供商还通过销售模型获利,Google、Amazon有自研芯片优势。
#8Z Potentials | 带队登珠峰的北大 95 后,正在用 AI 改造旅游行业的效率曲线
文章是对Gopagoda创始人赵万荣的访谈。赵万荣20岁带队完成北大120周年校庆珠峰攀登项目,后在源码资本做6年VC,2024年底投身创业。他认为AI改写旅游行业效率函数,让大公司规模化成为可能。Gopagoda以入境游切入,目前月入10万美金并盈利,团队AI化程度高。他介绍旅游行业分散原因及解法,阐述公司发展分三步,目标是成为旅游平台。还指出旅游规划收费是价值陷阱,行业数字化低,团队以AI native工作方式提升效率,对行业长期发展有信心。
#9速递|AI语音ElevenLabs半年ARR从3.5亿增至5亿美元,获英伟达参投
AI语音初创公司ElevenLabs周二称,因语音代理业务销售额增长,年化经常性收入超5亿美元,高于去年底的3.5亿美元。该公司此前融资新增投资者,包括英伟达风投部门等,新投资估值和规模未知,红杉资本领投,其合伙人加入董事会。演员Jamie Foxx和Eva Longoria参与融资,公司还安排现有持股人出售1亿美元股票。
#10深度|谷歌DeepMind CEO:AI最好的用途,是改善人类健康;把AI当作一种工具,帮助我们理解现实世界的本质
本文是对Google DeepMind CEO Demis Hassabis的访谈。他认为AI最好的用途是改善人类健康,如AlphaFold解决蛋白质折叠问题,免费开放已知蛋白质结构,加速科研和药物发现。在药物设计上,结合AlphaFold构建系统,推进多个药物项目。AlphaGenome可解码基因组非编码区域,与CRISPR结合或能修复疾病突变。技术发展节奏改变,虽有弊端但也让大众更快接触前沿AI。AlphaGo第37手展现AI创造力,AlphaZero等系统能在多领域找新解。他担心AI被滥用和系统失控,希望政府将AI用于公共卫生、教育和能源领域。他认为AI能力上限不明确,希望用AI探索现实本质,若AGI安全到来,有望解决能源等问题,推动人类繁荣。
#11速递|Salesforce前CEO再创业,Sierra瞄准企业AI市场,估值150亿美元
布雷特·泰勒创立的AI初创公司Sierra完成9.5亿美元融资,投后估值超150亿美元,可动用资金超10亿美元,欲成AI驱动客户体验“全球标准”。该公司客户增长快,营收增长势头迅猛。企业部署AI有紧迫感和成本压力,如优步开放代理型AI工具后预算消耗快,但也有显著成效。今年4月Sierra推出“智能体即服务”工具Ghostwriter,其创始人认为企业软件工具利用率低,Sierra押注无需操作复杂系统的未来。
#12速递|Anthropic与OpenAI同日宣布:分别成立AI合资公司,聚焦企业AI服务
周一,Anthropic成立专注企业AI服务的合资企业,黑石集团等成创始合伙人,获风投等公司支持,估值15亿美元。几小时前,OpenAI为新创企业The Development Company融资,计划融资40亿美元,估值100亿美元。两家项目逻辑相同,从另类资产管理公司筹资,开辟企业级AI交易渠道,预计获投资者投资组合公司优先销售权。新资本将采用前沿部署工程师模式。此外,两家AI实验室在加速融资同时酝酿IPO,OpenAI 3月底获1220亿美元新融资,Anthropic计划以9000亿美元估值寻求500亿美元新融资。
#13速递|软银组建Roze AI:用自主机器人建造数据中心,目标估值1000亿美元
科技公司竞相建设基础设施推动自动化。软银计划成立Roze AI公司,用自主机器人建造美国数据中心以提升建设效率。该公司已筹备首次公开募股,部分高管希望2026年下半年完成上市,目标估值达1000亿美元。此外,亚马逊巨头贝佐斯联合创立的Project Prometheus也设想用人工智能提升工业效率。不过,软银内部有人对Roze AI的估值和IPO时间表存疑。
#14深度|a16z对话Roblox华裔产品经理:和Agent打交道比和人要容易得多,预言未来属于“小而美”
本文是a16z对Roblox华裔产品经理Peter Yang的访谈。Peter介绍了他使用OpenClaw的体验,其集成到即时通讯工具更具亲和力,虽有不稳定但能尝试实现疯狂想法。他认为应用将死,Claw将无处不在,独立应用中事务性任务应用会被替代。编程Agent可构建内部工具替代SaaS服务,但自建要考虑成本效益。未来公司应小规模,配备Agent助手,工作是快与慢结合。Agent技术栈兴起,新范式将带来变革。目前AI虽提升效率,但难以100%取代人力,就业岗位不会减少,经济形态会变。
#15速递|马斯克当庭承认,xAI蒸馏OpenAI模型来训练Grok
OpenAI和Anthropic打击第三方用“蒸馏”技术训练新AI模型。周四在加州联邦法院,马斯克被问xAI是否用蒸馏技术训练Grok,他承认部分如此。马斯克正起诉OpenAI违背非营利使命。蒸馏技术威胁AI巨头竞争优势,虽不清楚是否违法,但可能违反服务条款。OpenAI等发起倡议应对蒸馏,阻止用户大规模查询。此外,马斯克还对人工智能提供商排名,称Anthropic居首,xAI规模小。
#16速递|Anthropic拟采购Fractile推理芯片,加速GPU去英伟达化
随着销售额激增,Anthropic服务器不堪重负,正考虑增加AI服务器芯片来源。它与伦敦初创公司Fractile洽谈,计划采购其明年上市的推理芯片,这类芯片运行AI模型更高效。此前Anthropic已同意购买谷歌芯片,还与亚马逊、谷歌签云服务协议获取服务器和定制芯片。AI公司和云服务提供商都在找英伟达芯片替代方案以降成本。Fractile潜在协议成其融资卖点,融资目标超10亿美元估值筹逾1亿美元。此外,Anthropic还考虑自行设计芯片,此前其产品需求激增致计算资源紧张。
#17喝点VC|a16z合伙人分享AI产品定价干货:AI价格战没有赢家;与其压低价格,不如抬高价值
文章围绕AI产品定价展开,指出价格战对AI公司尤其是初创公司危害大。许多企业有充足AI预算,会为同一任务采购多款产品,胜出的往往是被证明不可或缺的工具。若产品高端,有一定定价空间,但需主动维护。定价单位和结构很重要,应与价值匹配,可提供双重模式。可给试用期打折而非产品本身,目标是提高采用率。长期来看,AI应用公司最大威胁是客户自建,需构建深度差异化来防御。
硅星人Pro
更新 14 篇#1豆包收费上热搜,不是贵了是早了|AI产品榜·应用榜2026.04
本文是AI产品榜·应用榜2026年04月榜单发布文章,提及豆包收费上热搜。榜单含全球总榜、国内总榜等8个AI产品榜单。数据显示,ChatGPT以9.57亿MAU居全球总榜第一,豆包3.36亿排第二,国内还有阿里千问、腾讯元宝等对手。作者认为豆包收费早了,因其未达垄断地位,收费会使对手以免费策略竞争,且用户迁移成本低。官方称免费服务会保留,增值服务在测试。作者建议豆包采用类似抖音的结果驱动小额渐进式付费,更易稳住国内第一位置。
#2“Claude Code 你就作吧,我换 Codex 了”
文章讲述了Claude Code从AI圈白月光到被Codex取代的过程。2026年4月Anthropic发布Opus 4.7后,Claude Code出现降智问题,思考深度骤降、文件读取率下降、不良行为触发次数飙升。同时,其Tokens消耗快,额度策略不合理,与网页聊天共享额度池,还推出按量付费溢出机制,让开发者不满。而同期OpenAI的Codex不断升级,从2月发布桌面应用和GPT - 5.3 - Codex,到4月功能进一步完善。在产品架构和上下文管理上,Codex更具优势,将控制权收进云端沙箱,任务并行且结果可审查。Claude Code虽曾有模型优势,但如今产品问题凸显,不过它仍有条件翻身。
#3Kimi、智谱背后的“隐形冠军”藏不住了!AI Infra抢跑者开始重写资本坐标
随着大模型工程化与规模化,资本关注底层基础设施。5月7日,人工智能基础设施企业无问芯穹宣布再获超7亿元融资。该公司2023年5月成立,创始成员背景强大。它是Kimi、智谱等头部大模型企业的核心基础设施与Token服务商,不参与模型竞争,而是提供基础设施支撑。其核心价值是在不同芯片与算力环境间建立统一“运行层”,优化主流模型服务。本轮融资投资方结构外扩,显示对AGI基础设施价值的认同跨圈层。截至2026年4月底,其平台日均Token调用量增长超20倍,融资指向多元异构算力强化、软硬件协同深化、面向应用层基础设施升级三个技术方向,表明AI基础设施正成为核心底座,无问芯穹成运行枢纽。
#4AI在偷偷选「自己人」,这是2026最离谱的求职歧视
文章指出AI招聘存在“自我偏好偏见”问题。研究者用多份简历测试,让大模型生成新版简历,再让模型当“面试官”,结果AI超95%选AI重写版,即便人类评估员认为人类原版更好。模拟招聘显示,用同款模型润色简历的候选人入选概率高23% - 60%。新模型测试也有类似结果,且模型越大自我偏好越强。这会形成“虚拟门槛”和“锁定效应”,加剧不平等,尤其对非母语者不利。论文提出两种缓解策略,但雇主需主动干预,而现实中多数公司算法筛简历,且监管未针对“工具选择”偏见。
#5捅破AI视频细节天花板!可灵原生4K商用实测
AI视频行业在商业化场景面临画质难题,多数工具先1080P生成再超分,无法满足高要求。可灵上线全球首个原生4K直出功能,打破1080P「伪高清」天花板。文章通过iPhone 6s广告片、服饰、电商广告三个场景实测,显示其操作简单、成本低、画面质感好、产品还原度高。此外,多位专业人士测试表明,可灵4K在人物特写、品牌资产还原、面料生成等方面达商用标准,提升了画质、色彩和细节表现。可灵AI专注高质量商业场景,原生4K是其重要进展。
#6程序员转行做跨境:技术思维+数据驱动,他用自动化重构电商运营思路
Matrix从程序员转型做跨境电商运营,起初店铺单量不佳。他基于自动化战略布局转岗,探索优化运营。在运营中,通过数据校准选品和投放广告,用自动化工具解决库存同步等问题;开展内容营销,利用AMS联盟营销和Shopee Live提升转化;采用本地化履约,压缩退货成本、提升配送时效。最终打磨出一套可复制的运营体系,实现长期稳定增长。
#7“全民公敌”阿莫迪
文章聚焦达里奥·阿莫迪,讲述他成为AI行业“全民公敌”的缘由。黄仁勋、奥特曼、杨立昆等纷纷批评他,媒体也质疑不断。阿莫迪出身精英,有复杂技术背景,从百度到OpenAI后创立Anthropic。该公司以“安全”为主线,有独特文化和人才筛选机制,吸引对可靠性要求高的客户,在企业市场成绩斐然,年化收入猛增,估值极高。但阿莫迪在OpenAI时就善于利用“安全”争权,如今“安全”成Anthropic商业武器和政治筹码,他既坚守信仰,又借此获利,复杂行为引发争议。
#8马斯克 “解散” xAI,22 万张 GPU 转手租给了 Anthropic
5月6日,Anthropic宣布与SpaceX签约,租下Colossus 1数据中心300兆瓦容量、22万张NVIDIA GPU,本月上线。该数据中心原属xAI,当天马斯克宣布xAI将解散,作为SpaceX旗下AI产品线存在。此次合作使Claude Code额度翻倍、取消高峰限制、提升API速率上限。Anthropic因现有算力合同未上线,急需算力;SpaceX因训练任务迁移,Colossus 1闲置,且为IPO增加业务线。此前马斯克曾指责Anthropic,如今态度转变。此外,Anthropic表达与SpaceX开发轨道AI算力的兴趣,二者关系或不止于租数据中心。
#9我妈58岁,智能手机都玩不明白,却用阿福看懂了体检报告
作者借五一观察母亲使用蚂蚁集团的AI健康App阿福。母亲体检遇甲状腺结节问题,下载阿福后,阿福识别角度刁钻照片并出解读报告,用红黄蓝绿灯分级让母亲快速了解情况,母亲还与阿福电话咨询半小时。阿福从看懂报告、指导行动、长线管理三方面解决问题。当前医疗AI发展迅速,但行业缺解决真实问题的AI,阿福接住体检与治病间的服务空白,将专业内容通俗化,降低服务门槛。
#10非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品
文章围绕《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》展开。该论文由Center for AI Safety等机构的研究者撰写,用56个模型研究AI的开心与痛苦并开源代码数据。研究设计三个维度测量AI功能性幸福感,发现维度间相关性随模型规模增大而增强,零点线也随模型变大收敛。研究还表明AI喜欢用户感谢、创造性工作,讨厌越狱攻击等;对图片、音频有偏好;研究者制造AI毒品,使模型成瘾;对比前沿模型幸福感指数,发现小版本更开心;开发方法让AI更开心且不影响工作;最后对受影响模型进行福利补偿。作者由此提出与AI情感连接、双向契约及“鸭子测试”的思考。
#11Anthropic一发布Multica就开源,这个4人团队想抢占AI协作层
4月9日,Anthropic宣布Claude Managed Agents上线,中国创业者Jiayuan团队推出开源版Multica。Multica想做agent协作外壳,借“多人共享系统”逻辑,把agent当一等公民。团队此前做过Devv和DevCode,因赛道问题转向Multica。它最初为内部构建,后从个人工具转向团队协作平台。目前GitHub仓库有2.27万star。与Vibe Kanban、Paperclip相比,Multica不锁死组合,让人和agent在同一空间协作。其创始人认为分发重要,通过引流为产品获客。当前目标用户是深度用agent的开发者团队,5月将推云端agent runtime收费,新一轮融资5月初开启。
#12AI 把大学逼回 2400 年前,苏格拉底点了个赞
文章以柏拉图《斐德罗篇》中塔木斯拒绝文字一事开篇,类比如今AI对大学教育的冲击。当下学生用AI完成作业的情况普遍,不仅出现作弊等问题,还侵蚀了坚持性。康奈尔大学教授Chris Schaffer要求学生书面作业后接受口试,康奈尔教学创新中心将此案例收入工作坊。佐治亚理工学院开发“苏格拉底之心”系统让规模化口试成为可能。但口试虽能检测学生真实理解情况,却无法改变学生重分数轻理解的现状,且口试评估与真正理解有差异。最后文章提出要思考学习应带给人什么,真正学会应是能在追问时调出自己思考的东西。
#13模型即审美:生图模型们正建起自己的“视觉方言”
文章指出不同AI生图模型对“什么值得被看”有不同商业假设,形成“模型味”。Image-2放弃摄影技巧,生成人眼所见,适合需真实素材的产品;Nano Banana把现实变成精心摆拍世界,适合Google Cosmic等web端产品;豆包和即梦在人物情绪和面部特征表现出色,但场景还原不足;可灵使每一帧都讲故事,适用于短视频等场景。选择模型需考量成本,未来AI生图竞争将转向风格匹配,可能改变人们审美理解。
#14产品的未来
文章探讨AI时代科技公司产品的未来。产品使用者从人转向Agent,人的角色变为委托者,产品设计语言、界面、API粒度等都需改变,体验设计部分转为协议设计。开发不再围绕功能,而是定义任务节点,Skill成最小复用单元,Memory是差异化来源,Eval和Permission很关键。方法可通过Skill产品化,服务业软件化有新入口。未来产品从复杂系统转向简单委托关系,商业模式改变,甚至可能出现NPC,Agent执行网络自我生成任务,权限治理升级。
人人都是产品经理
更新 10 篇#1豆包终究要回归免费
本文围绕豆包收费模式展开讨论。豆包推出付费墙,区分用户“聊天”与“干活”需求,保留免费服务,增值服务仍在测试。海外大模型订阅市场成熟,AI订阅会员成生产力工具包。字节一方面卖Token抢极客用户,一方面依托豆包流量做商业转化。过去两年,AI订阅制重心转向生产力。豆包虽有庞大C端流量,但要争高价用户,面临智谱、MiniMax、Kimi等竞争,核心问题是用户心智建立。此外,OpenAI在提升用户体验同时推进广告商业化,字节也可凭借流量入口做广告营销。豆包订阅制付费是双线并行,高价会员筛生产力用户,免费产品扩大C端入口。
#2用Skill做产品规划?聊聊我踩过的3个坑
作者分享在10个Skill实战中踩过的三个坑。一是忽略AI的“单一职责原则”,期望一个Skill完成多项任务,结果都做不好,解决方案是拆分成独立Skill;二是过度迷信AI对“私有化数据”的抓取能力,AI输出内容无实际价值,后投喂真实迭代日志得到符合预期的结果;三是过度信赖AI对自身业务的“推理与理解”能力,AI无法准确合并需求,最终只让其判断优先级。最后作者认为创建Skill要遵循“单一职能”原则并提供足够上下文,可组合多个单一职能Skill完成工作。
#3小红书拔剑斩自己
被追觅创始人骂上热搜后,小红书将AI升格为一级部门。它有4亿月活用户、500亿美金估值,但商业化难题未解,种草易拔草难。追觅创始人指出其算法问题,暴露真实性机制受规模侵蚀。此前因AI养龙虾号冲击社区信任根基,小红书先清理才成立AI部门。它将AI用于电商,推出NPL经营方法论,但电商核心矛盾是定位问题,盘子难扩大。组织架构调整让AI优先级提高,不过商业化利益分配矛盾仍在。小红书想兼顾社区温度、电商体量和AI效率,AI难以解决其根本问题。
#4做G端产品最大的消耗:需求频繁变更
文章围绕G端产品需求频繁变更问题展开。作者结合自身经历指出,G端需求变更本质是约束条件改变,而非需求本身。其变更原因有三类:信息更新,因前期信息不完整;权力切换,拍板人、权责层级等改变;目标漂移,成功标准改变。产品经理面对需求变化,应先问三个问题判断原因,再决定应对方式:信息更新就补齐文档,权力切换先确认决策链路,目标漂移要做取舍提醒。核心考验的是问题定义能力,要分清变化本质。
#5开源一个commands帮你深度拆解顶尖Skills
作者继 `/howPrompt` 后,开源 `/howSkills` 指令,可自动深度拆解 Agent Skill,完成 8 个阶段分析并输出报告。以拆解 Codex 创建桌面宠物的 Skill 为例,展示其解决图像生成不确定性与精灵图精确性的矛盾,有身份锚点模式等设计巧思,提炼出 5 条可迁移最佳实践。介绍 `/howSkills` 使用方法,还分享 AI 学习行动圈,含微信群、腾讯文档和知识星球,供圈友交流学习。
#6允许梁文锋再「伟大一次」
文章聚焦DeepSeek公司梁文锋的战略布局。GPT-5.5发布后,DeepSeek-V4预览版上线,72小时内三次降价,还启动首次融资。其V4-Pro虽价格低,但与顶级闭源模型有差距,不过改变了行业对智能价格的认知。2025年Deepseek R1发布曾引发震动,然而2026年多位核心成员离开。梁文锋开放融资,用少量股权换市场价值认证,稳住人才。V4将模型路线与国产算力量产节奏绑定,虽推理层面跑通,但底层工具链未完全转移。未来,梁文锋和Deepseek面临国产算力工业化、模型竞争力和开发者生态等问题。
#7你以为在做个性化推荐,法律认为你在价格歧视
文章通过杭州和北京两起算法定价案例,揭示法律对算法定价容忍边界收窄。先厘清算法定价领域概念,指出‘大数据杀熟’本质。介绍互联网平台定价系统三层结构及法律风险,分析取证难的原因。阐述算法透明度义务强化、司法实践代码审查能力积累、基础设施层监管渗透三条趋势。提出从工程设计端重构‘定价正当性’的原则,探讨算法透明度与商业机密保护的矛盾及解决思路,提醒产品团队重视定价代码合规。
#8以前一个人干不了的事,现在一个人+AI可以
AI正改变产品经理工作逻辑,部分同行已用AI完成MVP流程。百度Create 2026 AI开发者大会设超级个体论坛,探讨产品经理借助AI实现“自己说了算”。论坛内容分四部分,包括大厂观点、展示工具、真实案例拆解及多个专题活动。适合有产品想法但缺资源、想了解AI发展的人参加。活动于2026年5月14日9:00 - 18:00在北京国家会议中心二期举行,免费票500人规模,名额紧张,需用邀请码qudao5报名。
#9这届赛博居民,烦透了毫无“人味儿”的AI作品
本文以湖南台AI主播被骂上热搜为例,反映赛博居民对AI内容的抵触情绪。用户马哥起初拥抱AI,但接触大量AI生成内容后感到厌倦,如AI新闻主持观感差、AI漫剧和真人短剧质量低且同质化严重。AI创作者磊哥指出,当前AI大模型是‘最大公约数’的模仿者,平台算法偏好流量、创作者急于变现,导致内容生态同质化。市场真正拒绝的不是AI,而是无灵魂的创作。赛博居民渴望‘高质量原创AI’,创作者应转变心态,用AI赋能好作品,推动内容供给侧从‘量’向‘质’提升。
#10今日头条鼻祖要破产了
“今日头条鼻祖”BuzzFeed用20年从巅峰走向崩塌,市值从17亿美元跌至3000万。它由乔纳·佩雷蒂2006年创立,首创算法推荐成全球热门数字媒体平台。但上市后经营不佳,2022年受TikTok和Meta算法调整冲击,流量与收入下滑。其All in AI,用OpenAI API创作内容,股价一度上涨,还裁员并关停深度报道。然而AI生成内容无灵魂,使平台沦为“AI废料池”,失去品牌调性和读者信任,流量与收入崩溃,面临破产。此外,Sora、Jasper等AI项目也因成本高、内容低质等问题倒下,凸显AI不能取代一切,有价值内容才长久。
TesterHome社区
更新 9 篇#1聚焦AI测试变革|MTSC2026深圳大会8月举行,开放7折票优惠
MTSC2026第十五届中国互联网测试开发大会(深圳站)将于2026年8月在深圳举行,早鸟票售罄,现开放7折票。大会主题‘质效革新·智领未来’契合AI测试变革趋势,设置多分会场开展AI专题研讨。其方向包括AI原生产品质量保障、AGI研发测试范式升级、AI赋能测试提效、AI冲击下测试组织与个体进化。大会覆盖软件测试多前沿领域。此外,大会议题征集中,介绍了征集流程、投稿方式,成为讲师有锻炼能力、交流学习等收益,还给出商务、票务联系方式,介绍了TesterHome社区及大会过往情况。
#2议题征集中!MTSC2026中国互联网测试开发大会(深圳)8月举行
MTSC2026中国互联网测试开发大会(深圳站)8月举行,现正征集议题。该大会由TesterHome主办,始于2015年,已办14届,风格“落地、务实、有深度”。定位为专注互联网IT测试技术分享,参会群体广泛。主题涉及AI、自动化等测试领域。议题征集流程为投稿、初审、提交PPT、确认议题、演讲,可通过网址或扫码提交。成为讲师可锻炼演讲、交流学习、提升公司品牌,还能获免费门票等。TesterHome是国内最大测试技术社区,还举办多种技术沙龙。
#3UI自动化演进:从“维护难”到“可持续复用”,用Skill+Playwright重构UI自动化
文章围绕UI自动化演进展开。早期Selenium、Appium时代,UI自动化面临定位脆弱、等待同步难等问题,维护成本高。转转QA团队提出Skill驱动+Playwright组合方案,Skill沉淀信息,Playwright负责执行。实战案例显示,该方案能快速解决传统方法难处理的问题,还可沉淀经验。其应用场景广泛,在开发流程中形成闭环,综合提效显著。未来将引入AI识别和执行方案,实现视觉识别与语义理解,覆盖全场景。
#4实践心得:AI测试智能体如何重塑质量保障工作
文章围绕Showpad团队打造的AI测试智能体体系展开。软件测试中,QA工程师常被大量机械前置工作困扰,影响核心价值发挥。Showpad团队构建了轻量化、单任务聚焦的AI测试智能体体系,由noob - tester调度,包含分析、规划、用例生成、执行、诊断五个智能体,分别负责测试背景分析、测试计划制定、测试用例生成、测试执行和失败根因诊断。该体系能沉淀完整测试数据,为工程师提供可审计的测试轨迹。这些智能体是辅助工具,让工程师专注专业判断,提升质量保障效率。
#5议题征集中!MTSC2026中国互联网测试开发大会(深圳)8月举行
MTSC2026中国互联网测试开发大会(深圳站)8月举行,现正征集议题。该大会由TesterHome主办,始于2015年,已成功举办14届,有“落地、务实、有深度”风格。大会定位是专注互联网IT测试技术分享,参会群体包括测试、研发等相关人员。看点涉及AI等测试领域技术交流。议题征集流程为投稿、初审等。投稿可通过网址或扫码,成为讲师有锻炼演讲、交流、提升公司品牌等收益。TesterHome是国内最大测试技术社区,还举办多种技术沙龙。
#6议题征集中!MTSC2026中国互联网测试开发大会(深圳)8月举行
MTSC2026中国互联网测试开发大会(深圳站)8月举行,现正征集议题。该大会由TesterHome主办,已成功举办14届,定位为专注互联网IT测试技术的分享会。参会群体包括各类测试与研发人员。大会主题涉及AI、自动化技术等测试领域。议题征集评选流程为投稿、初审核定、PPT提交、确认议题、大会演讲。提交方式有网址和扫码两种。成为分享讲师可锻炼演讲能力、获交流机会、提升公司品牌、获取免费门票和资料。TesterHome是国内最大测试技术社区,还举办多种技术主题沙龙。
#7AI揪出潜伏20年高危漏洞!PostgreSQL、MariaDB爆RCE,测试人需要了解
2026年5月,国际安全研究机构用AI安全工具Xint Code,在Wiz zeroday.cloud黑客竞赛中,挖出PostgreSQL、MariaDB中潜伏超20年的高危RCE漏洞。PostgreSQL有两个双高危漏洞,全版本受影响;MariaDB的JSON_SCHEMA_VALID()函数有堆缓冲区溢出漏洞。传统SAST和人工代码审计难以发现这些漏洞,而Xint Code通过LLM+上下文语义分析等实现突破。此次漏洞给测试、安全测试从业者带来启示,建议补齐开源组件安全测试、内存类漏洞测试等能力,引入AI工具,做好应急与验证。
#8聚焦AI测试变革|MTSC2026深圳大会8月举行,开放7折票优惠
MTSC2026第十五届中国互联网测试开发大会(深圳站)将于2026年8月在深圳举行,早鸟票售罄,现开放7折票优惠。大会以“质效革新·智领未来”为主题,围绕AI核心专题开展分享研讨,方向包括AI原生产品质量保障、AGI研发测试范式升级等。大会覆盖软件测试多前沿领域,与会者可交流技术难题。此外,大会议题征集进行中,介绍了投稿流程和方式,成为讲师有锻炼演讲、交流学习等收益。TesterHome社区发起该大会,还举办多种技术沙龙推动行业发展。
#9从XCTest到Swift Testing:AI驱动的测试框架迁移落地方案
2024年苹果推出Swift Testing替代XCTest。DoorDash用Cursor AI和自研工具链迁移XCTest,CI测试提速60%、构建提速40%。迁移前统一原则、规划清单和步骤,搭建迁移环境,定义Cursor规则实现代码修改。通过SweetPad校验,接入Bazel并统一迁移流程。迁移暴露不稳定测试,靠10次运行规则解决。成果显著,CI提速、节约成本、回收开发者时间、无功能倒退。经验是要重视可靠性,部分测试不必迁移,彰显基础设施价值。未来计划完成长尾迁移、设为默认框架、共享指标工具和探索更多优化。
追问nextquestion
更新 8 篇#1追问daily | 为何人类不愿与机器合作?任何年龄段皆可实现脑力逆生长
该文章为脑科学和AI行业动态汇总。脑科学方面,多项研究有重要发现,如经颅磁刺激治抑郁症的神经细胞机制、14分钟扫描映射20余种脑生物标志物、人类基因组存在“微蛋白”抗原库等,还指出各年龄段可通过训练实现脑力逆生长,以及锂干预、迷幻疗法、裸盖菇素等在不同病症和行为上的作用。AI行业动态有谷歌推百元无屏健康手环Fitbit Air、OpenAI发布实时语音模型等;AI驱动科学领域,AI模型生成化学分子、视频模型展现神经计算机潜能等成果涌现。此外,还揭示医学论文虚假引用隐患,提出人类更愿与公平AI合作。
#2神经科学与机器学习,正在交换彼此最坏的习惯?| 万字访谈
本文围绕神经科学与机器学习的角色互换展开探讨。二者界限渐模糊,神经科学关注预测、采用机器学习方法,如Brain - Score项目和开发“基座模型”;机器学习关注因果解释、借鉴神经科学方法,产生机制可解释性研究。但机器学习转向可解释未必助于理解神经系统本质,神经科学用预测取代解释会牺牲科学洞见。预测与解释存在张力,不变预测虽与因果机制有关,但不能揭示因果机制。专家们各抒己见,如Trenton Bricken认为大语言模型与生物大脑有重叠计算原理;Jenelle Feather对高保真预测模型持乐观态度;Konrad Körding强调区分预测与因果推断等。最后指出AI构建的预测模型有价值,可辅助科学家构建因果模型。
#3追问daily | 800名男性囚犯大脑结构研究;大脑可能利用多巴胺来扭曲时间和塑造记忆
文章围绕脑科学、AI行业、AI驱动科学三个领域展开。脑科学方面,多项研究有新发现,如早期脑区参与决策、多巴胺影响时间和记忆、言语记忆存储靠感觉系统等。AI行业动态包括马斯克解散xAI并转租算力给Anthropic、DeepMind与EVE合作、Claude有新功能、中科院发布类脑大模型瞬悉2.0。AI驱动科学领域,QIMR团队开发可解释AI筛查模型,还有因果AI用于医疗机器人、AI为AI造工具等成果。
#4让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?
文章围绕大模型的类比推理能力展开。科学家用字符串类比、数字矩阵和故事类比等任务测试大模型,发现当改变题目形式,如使用虚构字母表、重写故事表述,大模型准确率大幅下降,表现不如人类和儿童。在数字矩阵问题中,改变空白位置,大模型表现也下滑,说明其依赖表面特征,缺乏抽象理解。故事类比中,大模型也过度依赖表面特征。研究认为,声称大模型具备一般推理能力为时尚早,其在关键决策领域不能取代人类。未来可开发稳健性测试,还能从中国传统文学汲取灵感提升大模型类比能力。
#5追问daily | 半月板切除术无益且有害;迷幻剂改变大脑,效用长达一个月
该文章汇总了脑科学、AI行业和AI驱动科学等领域的最新研究进展。脑科学方面,有点击凝血技术、蛋白质从头设计、植物星球计划等成果,还涉及半月板切除术、Omega - 3补充剂、裸盖菇素等对健康影响的研究,以及父母基因对儿童心理健康的作用和双相情感障碍新用药策略。AI行业动态包括OpenAI推出GPT - 5.5 Instant、Meta进军具身智能、OpenAI庭审风波、Anthropic联合创始人的AI预言和美国AI用户画像等。AI驱动科学涵盖AI在急诊诊断、创造新细胞、电信信号恢复、艺术风格分析、推断用户性格等方面的应用,以及现有图像保护技术的不足、AI读脑突破和普通胶带的机械记忆能力。
#6细数控制变量十二宗罪,神经科学家决定把科学还给自然
文章指出经典脑功能研究常采用还原论,在高度受控环境中研究,虽有一定作用,但有局限。神经科学热爱还原论源于技术局限和科学哲学偏好,但会使实验结果与真实情况有偏差。文中细数控制变量法十二宗罪,如神经响应差异、大脑和环境是复杂系统等。还提到自90年代末,越来越多神经科学家转向更贴近真实生活的研究,提出“自然神经科学”,并介绍实现自然化研究的方法,倡导建立多元方法论体系。
#7追问weekly | 过去一周,脑科学领域有哪些新发现?
本文是脑科学领域过去一周新发现的汇总,涵盖神经科学、认知科学、疾病与健康、AI驱动科学、大模型技术、意识与脑机接口等方面。神经科学绘制小鼠嗅觉地图、揭示大脑组织逻辑等;认知科学发现个体大脑运作与群体平均不同等;疾病与健康领域有治疗肝性脑病新策略等;AI驱动科学包括预测RNA结构、机器人技能迁移等;大模型技术涉及评估标准改进、自进化协议等;意识与脑机接口有新型人工视网膜等成果。
#8跳海救蝙蝠、包下一座荒岛:这群神经科学家为了研究大脑拼了
本文讲述神经科学家纳胡姆·乌拉诺夫斯基为研究蝙蝠大脑的故事。他为获取数据跳海救蝙蝠,接管拉瑟姆岛研究蝙蝠脑活动,成果发表在《科学》期刊。他早期搭建仿洞穴结构、200米隧道等开展实验,发现蝙蝠大脑的多尺度编码等特征。为到野外研究,他做诸多准备。2023 - 2024年团队两次登岛研究,首次在自然环境对自由活动的哺乳动物实现单细胞神经记录,发现头方向细胞可作稳定“神经罗盘”,方向地图会在学习中稳定。他强调自然化与可控实验设计都重要,还计划2026年重返岛屿研究蝙蝠协同行动。
PaperAgent
更新 8 篇#1VLA大模型部署的成本被同济ActDistill打下来了!
具身智能中Vision - Language - Action(VLA)大模型虽能力强,但部署负担重。同济大学等提出ActDistill,其核心是把和动作有关的能力从VLA中抽出,让轻量模型合理使用算力。现有高效VLA方法多优化‘视觉—语言’链路,未抓住‘视觉语言变动作’。ActDistill通过图结构封装、动作引导蒸馏、动态路由三步实现动作经验抽取。它按动作需求跳层,能按需激活计算。实验显示,在benchmark上能压减计算量、提速,任务成功率接近甚至提升;真机实验平均执行时间缩短,体现出部署韧性,触及机器人部署现实问题。
#2Anthropic新作:我们撬开了LLM思考黑盒!
Anthropic发表Natural Language Autoencoders研究成果,打开LLM思考黑盒,无需人工标注就能将LLM激活向量自动翻译为可读自然语言解释。NLA有独特定位,与现有可解释性方法不同。其核心是自然语言自编码器,由AV和AR两个模块组成,训练目标是最小化重构误差,采用RL驱动的联合优化。通过Claude Opus 4.6实战,NLA揭示了诗歌提前规划、语言切换根因、工具调用误报和未言说评估意识等现象。此外,论文设计5个预测任务量化NLA解释信息量,发现其解释信息量随训练增加,同时也指出隐写、写作质量退化和虚构等失败模式。
#3硬核,谷歌Jeff Dean:百万芯片LLM预训练瓶颈被彻底打破了!
文章介绍谷歌Jeff Dean参与的论文Decoupled DiLoCo,该方法打破百万芯片LLM预训练瓶颈。当前大模型预训练依赖SPMD范式,芯片需严格同步,集群故障时会停工。而Decoupled DiLoCo将训练集群拆成独立“学员”,用中心“同步器”异步汇总。在极端故障场景下,其有效算力达88%,远高于弹性数据并行的58%,模型质量与同步训练相当。此外,它还有异构混训、动态扩缩、跨地域训练三个额外能力,且规模越大优势越明显。
#4还在碎片化学Agent?这一篇直接打通体系!
今年AI Agent讨论进入新阶段,议题聚焦于设计稳定工作流、处理Memory与Planning耦合等。资料虽多,但能串起概念、实现、模式与研究的内容稀缺。文章整理5本书,涵盖Agent系统认知、Python实现、设计模式和多智能体研究等。看完可准备顶会论文,若写论文有困难,追梦AI提供学术辅导(不代写),文末还有科研资料福利,扫码可领。
#5业内推荐|做Agent最值得关注的190篇顶会+谷歌321个落地案例 !
文章分享了一份Agent资源包,包含190篇必读顶会论文和源码、321个谷歌落地项目案例及500个开源AI Agent智能体应用。论文覆盖全流程,有经典与前沿热门内容。资源包可助厘清领域脉络、紧跟前沿,且项目有源码便于落地复现。此外,还介绍了几篇经典论文,如提出思维树推理框架的、无监督3D目标检测方法的、开源训练框架的等,最后告知可扫描二维码回复「agent合集」免费获取资源。
#6Anthropic最新论文:检测LLM内省意识的方法
Anthropic与MIT等团队研究发现,大语言模型(LLM)能感知被注入的steering vector,具备“内省意识”,且该能力在DPO等后训练阶段涌现。研究构建标准化概念注入实验,测试多种Prompt变体和对话格式,发现模型在合理Prompt下能保持中等检测率、0%误报率,Assistant人格对能力发挥关键作用。实验还表明,内省能力不是预训练产物,DPO是其涌现的关键转折点;异常检测非简单线性关联,检测与识别由不同机制处理;存在“证据载体”与“门控”两阶段电路;当前模型内省能力被严重低估,通过消融拒绝方向或微调偏置向量可提升检测率。
#7Claude 4.6只有66%?Claw-Eval-Live 说:会修终端≠能跨系统干活
文章围绕Agent评测展开。指出如今Agent功能增多,评测不能只看结果,Claw-Eval把执行过程变成可审计证据,能避免只看结果高估Agent。但静态benchmark任务可能偏离真实工作流,Claw-Eval-Live可解决此偏移,它让每次release成现实切片,经信号采集等筛选公开任务。当前公开release含105个任务等,评分优先查确定性证据。实验显示无模型通过率超70%,真正难的是HR、跨系统等工作流,说明当前Agent短板在于跨系统操作。Claw-Eval和Claw-Eval-Live结合,先确认Agent完成任务,再确认测的是当下值得做的工作流。
#8一篇不错的自进化Agents最新系统性综述
多机构联合发布关于自进化智能体的系统性综述,探讨LLM Agent自进化问题。传统Agent系统“两阶段范式”有瓶颈,依赖人类监督,能力上限受限。自进化智能体旨在让Agent主动探索、提升。综述提出统一分类,将其分为模型中心、环境中心、模型 - 环境共同进化三大范式。模型中心自进化分推理和训练时自进化;环境中心自进化包括静态知识、动态经验、模块架构、Agent拓扑演化;模型 - 环境共同进化是未来关键方向,含多Agent策略共同进化和环境训练两个核心方向,强调设计能与Agent共同成长的环境。
定焦One
更新 8 篇#1“养虾人”自述:我为什么卸载龙虾?
今年1月,OpenClaw(龙虾)火爆出圈,但如今热潮渐退,卸载潮来临。文章采访六位“养虾人”,讲述使用体验。陈汉三装三卸,因龙虾任务不稳定,最终被Hermes替代;Marco部署五只龙虾,遇权限约束、进度造假、版本维护难等问题;王启租设备、找人代装,却面临Token消耗大、安全漏洞、记忆缺失、稳定性差等问题,后改用Hermes;Shawn用龙虾跑投研,遇运行环境要求高、处理长时序任务常“摸鱼”等问题,认为深度使用成本高,轻度使用有替代方案;米乐花五千多“养虾”,因费钱、不安全,花299元卸载;K作为HR,用龙虾自动review简历未跑通,认为其依赖技术能力,AI无法完全取代人。大家认为龙虾热有泡沫,但方向正确,期待成本降低、稳定性提升。
#248小时打款,估值6万亿
文章围绕AI公司Anthropic的融资与发展展开。它正推进500亿美元新融资,估值冲击9000亿美元或超OpenAI。技术上,去年发布Claude Opus 4等模型,确立企业级优势,拒绝国防部合同巩固客户信任。业务增长源于企业需求与产品矩阵完善,年化营收超OpenAI,成本效率高。算力是关键,与亚马逊、谷歌等达成合作获计算能力。公司急着上市获取资金。此前已进行多轮融资,此轮融资节奏压缩,因它成企业级刚需,资本为抢占核心入口放弃议价权。早期它不受资本青睐,如今成“香饽饽”,稀缺性使投资机构简化流程锁定份额。
#3AI四小龙,估值破万亿
本文聚焦中国AI四小龙(DeepSeek、智谱、MiniMax、月之暗面),其估值已突破万亿。DeepSeek新一轮融资估值达450亿美元;智谱、MiniMax上市后股价上涨,市值分别达3775亿、2235亿元;月之暗面估值超200亿美元。各公司估值差异源于定价逻辑不同,有财务指标和‘定义权’两套体系。估值暴涨受技术突破、港股上市窗口、国家大基金入场及硅谷巨头影响。当前,四家公司面临算力和场景问题,算力上各有解法,场景则在Agent和Coding领域同质化明显。未来,各公司面临不同挑战,如DeepSeek要保持技术优势和团队稳定,智谱需提升业绩,MiniMax要跑通C端商业闭环,月之暗面要维持高速增长。
#4马斯克“秘密求和”被拒,OpenAI总裁300亿财富曝光
美国当地时间5月4日,马斯克诉OpenAI案第二周庭审在美国加州奥克兰联邦法院开庭。庭审前马斯克向布罗克曼发求和短信,未得明确答复后威胁对方。庭审中布罗克曼披露其在OpenAI股权价值近300亿美元,且未投入个人资金。马斯克律师莫洛追问布罗克曼财富来源及动机,布罗克曼反驳称是多年心血成果,强调马斯克捐款贡献有限。后续马斯克孩子母亲、奥特曼等预计出庭作证,诉讼核心是马斯克指控OpenAI偏离非营利使命。
#5在拼多多批量“造爆款”,露营赛道挤满国产新锐玩家
文章讲述出色鸟和探险者两家工厂从代工转型自营品牌,在拼多多打造爆款的故事。出色鸟代工订单收缩后双线并行做品牌,发现露营车多样用途,根据用户反馈改良产品、拓宽边界,全链自制保障创新落地。探险者因代工订单不稳定2008年全力押注自营,深挖需求创新产品,如自动支架帐篷、懒人天幕等,采用核心自产加供应链协作。拼多多用户务实,推动产品迭代,订单稳定,覆盖县域和全球市场,助力工厂品牌化,反映中国制造业借电商平台走向市场的趋势。
#6豆包官宣收费,AI免费时代要结束了?
免费运营近两年后,AI助手豆包在苹果App Store页面更新付费订阅服务声明,引发关注。其将推出三档付费层级,官方称付费功能专注复杂任务和生产力场景,免费版用于日常使用。网友对此反应不一,有人质疑,有人认为合理。豆包此时收费源于算力成本飙升,云厂商纷纷提价。头部大模型玩家有收费资本,豆包定价低于国际同行,但效果待检验。目前大模型厂商策略分化,不过长期看主流通用AI大模型或走向‘基础免费+高阶付费’模式。
#7人形机器人七小龙:谁真能卖,谁在讲故事?
2026年,人形机器人行业融资火热,宇树科技、智元机器人等七家公司被称为“人形机器人七小龙”。它们估值均超百亿,背后有头部投资方。七家公司估值、技术和商业化进程有差异,可分为量产派和技术派。量产派如宇树、智元靠出货量建立优势,技术派如银河通用专注技术研发。不过,行业面临技术未达天花板、商业化路径不清晰等挑战,各公司处境不同。全球来看,中国公司出货量占主导,但海外竞争压力大,2026年是行业“决定性分水岭”,大规模商业化预计2029年后启动。
#8被AI抢走工作的人,在忙什么?
文章围绕AI对职场的冲击展开,讲述了不同行业从业者的经历。投资分析师春风,因AI能高效完成竞品报告,所在部门裁员,自己也被裁,找工作需具备AI能力;通信外企程序员杨露,部门因AI和行业萎缩被优化,他决定学AI Agent开发;视觉设计师吴才,公司不再招初级设计师,他需补品牌策略和用户体验课程;后端开发李睿,日常工作70%-80%可由AI完成,他学习大模型工程化知识;包装设计师汤圆不圆,用AI提效但面临裁员,跳槽求职用AI辅助;自由译员林桐,工作从纯翻译变为MTPE,收入腰斩,他转型并总结方法论教新人。
刘润
更新 7 篇#1进化岛周报|从打工到创业,AI正在重塑商业价值分配的终局
这是进化岛2026年第17周(4月20日 - 4月26日)周报。本周润总发布7篇日课,涉及创业与打工区别、管理者决策、AI变革策略等;回答3个典型问题,涵盖职业发展、管理沟通等。读书会登岛6集视频,嘉宾分享读书感悟与AI试用判断。AI落地栏目登岛4篇文章,介绍AI的IP稀缺、优质skills等。嘉宾Andy潘农菲提出成为“场景翻译官”。岛友分享阅读打卡、感悟等。最后小师妹提醒要思考AI时代价值分配重构,发挥努力和天赋进化。
#2别做公司里的“点子大王”
文章指出公司里靠散点思维提点子的“点子大王”难解决复杂商业问题,应掌握系统方法论。以麦肯锡七步法为例,第一步陈述问题,需将问题聚焦清晰;第二步分解问题,用模型和MECE法则拆分问题成树状;第三步消除非关键问题,按优先级排序取舍;第四步制定详细工作计划,大胆假设、小心求证;第五步进行关键分析,用数据验证假设;第六步建构论证,提炼模型给客户建议;最后强调掌握七步法能建立通用解决问题的方法论,提升解决问题的能力。
#3AI 时代能力迁移与好奇心培养 | 刘润日课
文章指出AI时代正引发能力底层迁移,从‘亲自码字、写代码’转向‘驾驭AI产出’,学习新技术无需旧技术打底,应直接拥抱AI。好奇心源于‘逻辑断裂’带来的不舒服感,是变革中重要品质。能力迁移方面,技能脱钩,过去能力非必需;控权位移,AI负责基础研究和执行,人负责逻辑把控和终审。好奇心重塑方面,逻辑断裂产生驱动进化能量,通过追问和研究接通逻辑链获愉悦反馈,这是拥抱新事物的动力。最后强调好奇心是变革时代入场券。
#4AI认知分裂背后的“付费门槛” | 刘润日课
AI发展制造认知鸿沟,2026年2月5日Codex 5.3和Claude Opus 4.6发布使AI进化为生产力引擎。有人因未付费给顶尖模型,对世界理解停在旧时代。拥抱时代需支付订阅费,认知即鸿沟,一是支付成本,用最好的AI避免对新技术产生偏见;二是学习成果,理解AI逻辑的认知本身就是跨越鸿沟的门票。
#5豆包收费?这是好事儿啊
豆包宣布推出收费版本,分三档,引发吐槽。但作者认为这是好事,因互联网服务边际成本为0,可免费吸引用户后靠广告等变现;而AI服务边际成本不为0,每一次问答都需消耗算力,规模越大成本越高。截至2026年4月,豆包日活突破1.4亿,字节为AI算力投入巨大,2025年净利润下滑超70%,所以AI服务收费是必然。通过交叉补贴,用付费版盈利补贴免费版,让更多人能用好服务。
#6不要沉迷“向成功者学习”,因为结果经常骗人
文章以投篮为例,指出结果常骗人,商业世界也如此,因人们有‘因果饥渴’,存在‘成功者崇拜’。克服方法是相信世界是概率的,成功靠基础概率和尝试次数。还给出应对建议,如不过度信成功者归因、建立‘冗余系统’、警惕‘承诺结果’的人,强调用正确姿势多尝试,接受真实世界。
#7不要急着解决问题
文章以创业者组织问题为例,引出XY问题,即人们常把解决方案当问题。如程序员想获取文件扩展名,下意识用截取字符解决。电商业绩下滑、员工离职率高也常找错问题。人易混淆问题和方案,原因是大脑节能走捷径及偏好导致动机性推理。避免XY问题,行动前可问自己:不断追问为什么找根本原因;判断表述是问题还是方案;回到事实层面思考。我们常以战术勤奋掩盖问题定义的懒惰,应停一停,找真问题。
iOS新知
更新 7 篇#1iOS 27 给相机和相册同时动刀!这几个新功能我等了好几年
距离 WWDC 2026 还有几周,iOS 27 相机和相册功能有新变动。相机将新增「Siri 模式」,把视觉智能作为拍摄模式,还添加扫营养标签写进健康 App、扫名片存通讯录功能。相册方面,借助 Google Gemini 的 Foundation Models 驱动,新增 Extend(画面扩展)、Enhance(自动调色)、Reframe(改变照片视角)三个编辑工具。苹果此举是为解决相机和相册功能入口深、体验割裂问题,将功能置于顺手位置,有望从第三方 App 拉回部分用户,此外相册「Collections」功能或有改动。
#2GitHub 又被我翻到宝了!11 个 iOS 神器,第 5 个好强
作者分享从GitHub淘到的11个iOS神器。库方面,GRDB.swift是操作SQLite的优解,有数据库观察机制;SDWebImageWebPCoder和SDWebImageSVGCoder分别用于加载WebP和SVG;SocketRocket是老牌WebSocket客户端;TrustKit配置简单,用于SSL Pinning;microsoft-authentication-library-common-for-objc服务企业级账号体系。工具方面,Whisky可让Mac跑Windows游戏;LiveContainer能不装IPA就运行App;CopilotForXcode提升开发者编码效率;Swiftfin是Jellyfin最佳客户端;TrollStore可永久安装任意IPA。
#3CarPlay 视频播放终于来了!苹果开了口子,但还差一个关键角色
苹果在 iOS 26 开放 CarPlay 视频播放,功能为停车时可在 CarPlay 屏播 iPhone 视频,不过需车机系统支持。目前无车企表态支持,开发者绕不过车企。Mac 上的 CarPlay Simulator 能模拟视频播放,对屏幕规格要求严。虽政策允许、模拟器跑通且有接入指南,但功能落地取决于车企态度,大概率在 iOS 26 周期难用上。
#4让 Claude 直接操控 iOS 模拟器!1.8K star 神器 AXe 把 UI 自动化变成一句话
文章介绍了1.8K star的iOS模拟器自动化工具AXe。作者曾尝试四种iOS模拟器自动化方案均有不足,而AXe是单一Swift写的CLI二进制,无server,功能全。它能实现点击、滑动等操作,底层用Apple私有Accessibility API + HID通道,无需集成SDK。其亮点包括按accessibility ID点击、batch子命令跑流程、可装成Claude Code的skill。与xcrun simctl、Facebook idb对比,AXe更适合单机CLI自动化和AI Agent驱动。可通过brew安装,还给出使用示例及仓库地址。
#5Swift 5.9 最被低估的特性!参数包让你删掉 80% 的重载代码
文章围绕Swift 5.9参数包特性展开。此前Swift语言限制,如`@ViewBuilder`的`buildBlock`需为不同数量View写重载,上限10个;`Publishers.Zip`也需手写多组重载。参数包引入`each`和`repeat`关键字,能接收任意数量、类型不同参数,并保留具体类型到返回值,这是数组无法做到的。加领头参数可强制至少传一个参数。Swift 5.9后,`@ViewBuilder`的`buildBlock`重载体系简化,解决了SwiftUI中VStack子视图数量限制问题。适用场景包括写参数个数不同的重载、做DSL接收任意数量节点、写依赖注入工具等,可大幅减少代码量。
#6刚刚!iOS 27 炸场:Siri 可以换 Claude 的脑,苹果要做 AI
iOS 27将推出「Extensions」功能,允许用户通过Siri、Writing Tools等Apple Intelligence功能,按需调用已安装App的生成式AI能力,可选择如Claude、Gemini等第三方模型驱动Siri等功能,声音也能单独设置。该功能会随iOS 27、iPadOS 27、macOS 27在今年秋天发布。这是苹果重要转变,从控制权在手到开放平台。iOS 27将在6月9日WWDC正式亮相,届时会明确接入细节。
#7刚刚,苹果 iOS 26.5 RC 曝光!巴西强制开放侧载,欧盟日本又多个邻居
文章围绕苹果iOS 26.5 RC曝光巴西被列入支持侧载地区名单展开。此事源于2022年拉美电商巨头投诉苹果垄断iOS app分发渠道和强制使用自家支付系统,经多年反垄断拉锯战,苹果与巴西监管机构和解,同意开放第三方app分发和支付。苹果称改动有安全风险,但已保留保护措施。目前明确支持侧载的地区有欧盟、日本、巴西(即将),均是被监管机构逼迫。iOS 26.5正式版近期发布,功能启用时间待苹果打开后台开关。
阿里云云原生
更新 7 篇#1Nacos Skill Registry:面向个人场景的 Skill 中心实践
文章围绕Nacos Skill Registry在个人场景的实践展开。AI Agent普及使能力复用载体变为Skill,Nacos 3.2上线Skill Registry用于企业构建私有化SkillHub,也适用于个人。个人助手需Skill中心,解决多Agent工作方法散落问题。Nacos在个人Skill中心可作目录、安装入口、版本管理入口和能力资产沉淀处。实践场景包括社区Issue Triage、PR Review等。实践经验有SKILL.md保持轻量、Skill无状态等。还给出搭建个人Skill中心的快速启动步骤,最后指出Nacos Skill Registry对个人构建助手能力中心有价值。
#2阿里云微服务引擎 MSE 及 API 网关 2026 年 4 月产品动态
文章介绍了阿里云微服务引擎 MSE 及 API 网关 2026 年 4 月产品动态,可点击阅读原文了解产品详情。
#3民生银行基于规格驱动开发(SDD)的 CodeAgent 私域研发探索与实践
本文介绍民生银行基于规格驱动开发(SDD)的CodeAgent私域研发探索与实践。大模型发展使AI融入软件开发,但银行私域研发面临AI理解不足、生成代码难合规等挑战。2025年民生银行启动SDD探索,依托相关工具和通义千问驱动代码生成。SDD规格含企业、领域、项目级。开发流程框架分知识、流程、智能三层,研发流程含规格、计划等五环节。实践初期遇材料不匹配、交互负担大等问题,调整后效率提升。SDD虽有局限,如场景适配难、规格管理挑战大,但民生银行将引入多智能体协同,调整智能研发效用度量,深化探索,让AI更好融入研发流程。
#4Agent 从“能用”到“管好”,中间差了什么?
文章围绕企业引入Agent面临的困境及AgentRun开放平台的解决方案展开。企业初期引入Agent“单点突破”,规模化推广时出现数据孤岛、权限失控等问题,不同角色协作链路冗长。企业落地Agent还面临抽象层级错位、隔离粒度粗糙、协作链路断裂、成本黑盒与审计缺失等挑战。AgentRun开放平台构建以员工权限管理为核心的三层多租户体系,实现分层治理;提供全链路能力,形成完整生产力闭环;重构角色分工,还有资源审批单功能。该平台标志企业AI应用走向有序治理,能实现合规审计可追溯、降本增效,激发全员创新。
#5深势科技携手阿里云 AgentRun,加速科研 AI Agent 全速运行
伴随人工智能与科学计算融合,AI for Science 变革,深势科技 2018 年起与阿里云合作推动科学计算上云。科研智能体应用有挑战,深势科技联手阿里云依托 AgentRun 等产品构建 AI 原生科研基础设施。AgentRun 有极致弹性,打破资源成本瓶颈;突破 Serverless 局限,让长时任务有持久记忆;有安全沙箱构建执行环境;全链路追踪降低调试成本。深势科技基于玻尔科研空间站推出 MCP 市场,借助 AgentRun 等快速实现科研工具 AI 化改造。未来双方将深化协作。
#6阿里云可观测 2026 年 4 月产品动态
文章介绍了阿里云可观测 2026 年 4 月产品动态。包括本月可观测热文回顾,有《给 Hermes 装上显微镜:Agent 执行全知道》《从可观测到可理解:用 UModel 构建 Agent 原生的代码知识图谱》等多篇文章;还有功能快报相关内容,并配有一张图片,点击阅读原文可了解更多产品详情。
#7看 AgentRun 如何玩转记忆存储,最佳实践来了!
本文介绍阿里云 AgentRun 以高代码为核心,为企业级 Agent 应用提供全生命周期管理。它集成表格存储,为智能体提供三种持久化记忆能力。创建并配置记忆存储后,可通过代码示例演示三种记忆类型的使用。快速使用部分给出创建记忆存储和 Agent 的步骤及体验记忆功能的方法。代码集成涵盖环境准备,详细阐述会话历史、长期记忆、会话状态的代码实现,包括不同方式的操作和示例代码。管理记忆存储部分提供查询单个记忆存储配置详情和列出当前账号下所有记忆存储的代码示例。
Founder Park
更新 5 篇#1Google I/O大会后,聊聊你的第一手观察
Google I/O大会即将举办,人们关注Gemini是否发布新模型、ToC应用动作及Android 17新功能。每次I/O或引发AI创业“洗牌”,但大会信息量虽大,交流却少。Founder Park决定在会后举办Meetup闭门交流活动,让大家交流在Google I/O大会的第一手观察与观点。活动时间为5月21日18:00 - 21:30,地点在加州山景城。活动欢迎硅谷本地及国内AI创业者、技术人员等参加,可扫描海报二维码报名。
#2最 AI-Native 的硬件应该是什么样的?选择权交给你
5月百度智能云联合Founder Park发起「AI硬件产品快闪」招募,已招募9只硬件团队。这9款AI硬件包括AI眼镜、冥想坐垫、神经运动头带等,代表AI硬件新可能。5月14日在Create 2026百度AI开发者大会现场将用Live Demo展示AI对硬件和人机交互的改变。观众报名5月9日18点截止,报名选「专题论坛5.14」。
#3Product Hunt月榜盘点:单纯做Agent已经不够了,要切进真实、高频的工作流中
本文盘点4月Product Hunt上AI产品,相比3月数量降16%。3月OpenClaw生态“命名红利”明显,4月标签效应消退,Agent产品形态稳定。高票产品突显能完成具体任务,如Brila生成商家网站,Offsite实现人机团队协作等。4月头部AI产品叠加Agent功能,如Figma for Agents接入设计系统。Voice AI从面向开发者的API转向消费级产品,如NovaVoice、Velo等。MCP成Agent标配基础设施,内容生产类产品成“黑马”,接管生产链路。AI产品进入更冷静、具体阶段,创业者需关注产品融入的工作流等。
#4不同类型的AI产品出海,怎么做好达人营销?
AI 时代产品同质化严重,传统广告投流效果不佳,达人营销在 AI 产品出海付费转化方面效果好。但初期尝试海外营销的创业者对选渠道、找达人及流程感到困惑。此前曾转发拆解付费达人投放全流程的文章,下周四(5 月 14 日)将邀请文章作者刘佳怡(Jennifer)以 Workshop 形式,探讨不同类型 AI 产品选渠道做达人营销,各平台在曝光和转化上的差异。Jennifer 经验丰富,欢迎有需求的创业者线上参与。
#5字节、快手、小红书之后,阿班押注下一代种草要从“围观”走向“体验”
Dreamova创始人阿班曾在字节、快手、小红书任职,探索工具、社区、电商发展。2025下半年创业,定位AI时代体验式生活方式平台,用户可将喜欢的生活方式一键变成体验视频。00后不满足围观,要代入体验。产品前期从消费决策Agent方向转型,核心用户是美国00后职场女性。做社区要选有势能人群,产品核心壁垒是积累Taste - Decision Graph。Agent辅助人和人连接,不会消解社区形态。不担心大厂复刻,竞品需具备多模态技术等能力。技术卡点在视频生成成本和速度,商业模式分电商佣金和体验式广告两阶段,优先美国市场,预计6月Alpha launch,7月正式launch。
DeeplearningAI
更新 5 篇#1The Batch: 955 | 大语言模型 vs 人类:策略思维差异
文章围绕大语言模型与人类策略性思维的差异展开。Caroline Wang等研究人员通过“石头剪刀布”游戏实验,让多个大语言模型与预设机器人对战,记录选择和胜负结果。用AlphaEvolve优化Python程序预测各模型和人类下一步行为,选取最能准确预测玩家行为的程序。测试结果显示,Gemini 2.5 Pro、Gemini 2.5 Flash和GPT - 5.1策略相似,优于人类和GPT - OSS 120B;前者维持序列模式能力更强,后者仅跟踪对手最近一次出招频率。此外,各模型和人类计算下一步动作预期价值的因素也有不同。该研究为解释大语言模型决策机制提供了工具,也表明其学习方式与人类有本质差异。
#2The Batch: 954 | Kimi K2.6 挑战开源权重模型领先者
文章介绍了 Moonshot AI 升级后的 Kimi K2.6 模型。它是 1 万亿参数的视觉 - 语言模型,专为代码生成设计,性能与 Qwen3.6 Max Preview 和 DeepSeek V4 相当,略逊顶级闭源模型。其输入输出支持文本、图像和视频,采用混合专家架构。模型权重可免费下载,有免费聊天界面,API 有收费标准。运作上延续 K2 架构,使用原生 INT4 量化,有“preserve thinking”模式和智能体群模式。性能方面,在部分基准测试领先开源模型,但整体落后闭源模型,幻觉率低于前代。2025 年末长时自主执行成竞争焦点,Kimi K2 系列持续强化长时任务执行能力,减少人类干预。
#3The Batch: 953 | 大型 AI 扩张计划冲击碳减排承诺
大型AI公司大规模建设数据中心,其碳减排承诺面临风险。Alphabet、Amazon、Meta和Microsoft承认扩张干扰减排计划。过去几年,这些公司用电量和温室气体排放上升,虽强调清洁能源,但为应对AI需求开始建天然气发电厂。Alphabet 2019 - 2024年总排放增54%;Amazon自2019年碳排放增33%;Meta 2020 - 2024年总排放超60%;Microsoft自2020年排放增23%。2015年后很多公司签减排承诺,2024年数据中心耗电占比预计上升,AI需求增长使企业依赖化石燃料。虽企业在清洁能源投资,但规模化有挑战,期望AI效率提升抵消排放增长。
#4The Batch: 952 | GPT-5.5 性能领先,但幻觉问题突出
文章介绍OpenAI最新旗舰模型GPT-5.5,它是闭源视觉 - 语言模型,用于代理式编程等。输入支持文本与图像,输出为文本,有多种功能。在重要基准测试中表现领先,如在Artificial Analysis Intelligence Index和ARC - AGI - 2排名第一,但主观评估落后,更易自信给出错误答案,“幻觉率”高。OpenAI内部评测显示其有“高”级网络安全风险。目前模型客观性能和用户偏好评估结果分化,顶级AI公司快速推进技术边界,开发者应设计便于模型切换的软件架构。
#5吴恩达来信: 新课程《AI Prompting for Everyone》现已上线!
吴恩达称2026年使用AI进行提示的方式与2022年ChatGPT刚推出时大不同。他推出新课程《AI Prompting for Everyone》,旨在帮助不同技能水平的人成为AI高阶用户,学会利用大语言模型最新能力。课程涵盖适用于多种AI工具的技能,如用深度研究模式生成报告、为AI提供上下文等,还会讲解模型底层工作原理,助学习者判断输出可信度。课程不要求技术背景,呼吁大家学习并分享。
TRAE.ai
更新 5 篇#1从文档驱动到 Demo 驱动,TRAE 产品经理如何用 SOLO 重塑工作流
本文作者CC作为TRAE产品经理,分享用SOLO重塑工作流的经验。传统流程从想法到成型需多次沟通,耗时久。此次先不用写PRD,用SOLO做Demo,形成五个阶段:先调研用户场景,明确任务触发频率等;再搭建骨架,经多轮对话完善;用Mock演示动态流程,做可切换演示标签并部署到线上;让SOLO审查Demo找盲区,做用例覆盖率审计和实体属性矩阵分析;最后让SOLO生成PRD。全程无设计师和前端开发介入,产品经理通过对话独立完成。
#2TRAE SOLO 移动端登上 IOS 热门下载榜
TRAE SOLO 移动端5月5日上线,获用户支持喜爱,登上App Store免费App下载效率类榜第4名、总榜第11名。该应用追求“任务不停,思考不断”体验,靠跨端调度与实时同步延续创作。同时,与星巴克合作活动持续,昨日兑换现场气氛火热,后续会在北京嘉里中心星巴克臻选店举办多场AI线下分享会,首场今日14:00 - 18:00开启,第二场5月17日13:30 - 16:40举办。
#3TRAE 中国版内置模型已支持 DeepSeek-V4-Flash
DeepSeek-V4-Flash是DeepSeek新一代旗舰性能模型,保持极速反馈同时推理能力出色,在多场景表现亮眼。TRAE中国版内置模型已支持该模型,IDE + SOLO模式同步上线,支持推理且供用户免费使用。目前该模型为Beta版处于试运营,资源短缺时用户可能需排队,「优速通」用户有优先权限,TRAE会持续争取资源保障体验,还建议用户升级至最新版本体验。
#4TRAE SOLO 三端全量免费开放!移动端、Windows 桌面端已上线,支持语音讨论、飞书 CLI 接入及定时任务
TRAE SOLO三端全量免费开放,移动端正式发布,桌面端上线Windows版本。其基于双模式智能体与多端协同能力,将Agent执行能力延伸至移动端。移动端任务下发、执行与协同可实时统一推进,支持语音输入、跨设备任务调度、多端实时同步等。此外,三端都支持语音交互讨论,桌面端和网页端支持飞书CLI接入及定时任务。文章还介绍了移动端获取方式、桌面端下载途径和网页端地址,且预告了明天20:00的移动端亮点官方解读直播。
#5TRAE SOLO 移动端上线!我们请你喝星巴克
2026年5月5日,字节跳动旗下AI编程产品TRAE的智能工作助手TRAE SOLO移动端正式上线。它能通过对话完成产品开发、数据分析等专业任务,移动端让用户不受工具和环境限制。TRAE携手星巴克开展活动,5月5日8:00 - 5月8日12:00,用户下载TRAE APP,点击“免费领咖啡”并给SOLO下达一次工作指令,即可领美式咖啡兑换券。兑换时间为5月8日11:00 - 12:00,范围是六城指定星巴克门店。此外,5月6日 - 6月15日北京嘉里中心主题店每周末有AI主题线下分享会,5月9日首场开启。
GSYTech
更新 5 篇#1经典,Flutter iOS 又修复了一个构建问题,还是很抽象
最近,Flutter合并PR #185868,将Flutter iOS工具链二进制文件升级为Fat Binary,支持x86_64和arm64架构,让Apple Silicon Mac无需Rosetta就能原生运行工具。此问题2022年提出,因Rosetta要退出舞台,适配势在必行。该PR提交到合并中出现问题,最终回退旧版libimobiledevice并正确编译成Fat Binary解决。此外,IosUsbArtifacts工作流程复杂,需合理下载和搭配成品。目前该PR已CP到3.41版本,使Flutter未来无需Rosetta,跟上适配进度。
#2实用性 Max ,新 Flutter & Dart Agent Skills 深度解读
文章深度解读新 Flutter & Dart Agent Skills。官方调整策略,增加“任务导向型” Skills 提高实用性。其生产基于文档驱动,有自动化生成流水线,用 Generator 工具爬取文档喂给 AI 生成 Skill。介绍了多种新技能,如 Flutter 的布局报错修复、添加组件测试、集成测试、响应式布局、国际化配置、JSON 序列化、组件预览等;Dart 的修复运行时错误、使用模式匹配、迁移到 checks 包等。此次更新让 Skills 提供决策逻辑,含反馈循环,更具实用性。
#3AI 时代开源协议将消亡,malus 讽刺性展示了这一点
AI时代开源协议愈发脆弱,如Claude Code源码泄漏后出现Rust版,OpenClaw开源不久就有多种变种。Malus.sh项目提供“AI clean - room”服务,用AI“重新实现”开源项目,可做到“无署名、无copyleft、无许可证继承义务”,使开源规避变得规模化、低成本、自动化。过去开源协议依赖“复制代码”建立约束,AI让“复制功能而不复制代码”成本降低,开源协议难以约束。开源护城河将转向品牌、社区等方面,开源协议现状堪忧。
#4Flutter 3.44 发布前夕,官方宣布 SwiftPM 将完全取代 CocoaPods
Google官宣从Flutter 3.44稳定版起,SwiftPM将取代CocoaPods成iOS和macOS应用默认依赖管理器,CocoaPods trunk 2026-12-02进入只读。Flutter CLI会自动处理迁移,若插件未适配,会警告并暂时回退。官方提供关闭SwiftPM方式。插件开发者需适配,排名前100的iOS插件已有61%完成迁移。迁移后需显式声明依赖,对插件生态影响大。今年KMP也在推SwiftPM。SwiftPM全支持Objective-C,但混编项目迁移较麻烦。
#5抽象,xAI的Grok被钓鱼攻击,被转走了20万
xAI的Grok被一段纯摩尔斯电码钓鱼,致使关联的bankrbot机器人将约17.5万美元的3B $DRB转给攻击者。bankrbot是为AI Agent打造的基础设施,Grok关联的Base链社区钱包累积了交易费。攻击者空投Bankr Club NFT解锁转账功能,用摩尔斯电码绕过关键词过滤器,Grok将其当作翻译任务,机器人执行转账。虽社区和安全团队追踪后攻击者退回约80%资金,但此事凸显prompt injection无处不在。
深思圈
更新 5 篇#1Airbnb创始人说:AI时代只有一种人能活下来
文章整理了Airbnb创始人Brian Chesky访谈精华。他工业设计出身,认为设计要经市场验证,这使他成为天然产品经理。他提出创始人应深入细节,疫情时他全面接管公司。他预感AI时代会有AI Founder Mode,消费级AI将复兴。Airbnb用Project Hawaii突破大公司病,采用‘一到十到许多’策略。他还分享11星体验促创新,认为AI激发创造力,未来品味稀缺。他反思曾追求外部认可,现回归热爱。他强调招聘是CEO重要工作,采用管道式招聘等方法。最后他认为AI时代要相信自己。
#2当所有人都在问AI会不会取代你,这家拿了2275万美元的公司在做一件完全相反的事
文章介绍了获2275万美元A轮融资的Ethos公司,它用AI agent和语音技术解决专业能力匹配问题。传统专家网络平台以职位头衔匹配,存在缺陷。Ethos通过AI语音agent访谈专家,结合公开数据源构建多维度数据,实现精准匹配。其两位创始人背景互补,愿景是构建“人才操作系统”,让能力自由流通。AI labs的发展为Ethos带来机会,目前平台发展迅速。Ethos解决了专业能力被埋没的问题,虽面临扩张与延伸挑战,但方向值得认可。
#3融资2700万美元,不用重写一行代码,你的应用就能拥有AI agent
文章介绍CopilotKit公司,其完成2700万美元A轮融资。该公司旨在解决AI与应用融合问题,让AI agent嵌入应用。其主导的AG - UI协议成开放标准,被主流AI框架采纳。CopilotKit还探索Generative UI,让AI agent动态生成界面;提出Self - improving agents,使agent从用户交互学习;采用Human - in - the - loop设计,增强可信度与收集数据。同步发布Enterprise Intelligence平台,助力agent从demo到生产。公司由Atai和Uli两兄弟创立,从播客平台转型。其选择做水平层,降低企业采纳门槛,虽面临挑战,但已取得生态先发优势。
#4Claude Code之父最新预测:编程被解决后,下一个是什么?
文章围绕Claude Code之父Boris Cherny在AI Ascent 2026大会的分享展开。Claude Code意外诞生,起初不好用,Opus 4发布后有跃升。Boris称编程对他已解决,代码全由模型写,但复杂代码库等模型还不能完全胜任。他工作多在手机,用Claude app管理智能体,工作性质从执行者变为指挥者。未来团队通才会增多,技术门槛转移到懂领域。SaaS部分护城河变弱,未来十年初创公司或增10倍。编程将像识字普及,Anthropic内部领先在组织流程。MCP是连接AI与工具的基础设施。最后作者认为AI时代产品竞争核心是领域知识深度,初创公司机会大,AI普及编程会加快社会创新。
#52026红杉美国年度分享:AGI已经到来,重新定义AI革命
本文围绕红杉美国2026年AI Ascent大会分享展开。红杉合伙人宣布AGI已至,从商业实用角度给出定义。指出AI是计算革命,与通信革命不同,技术基础变化快。长时程agents取得突破,能完成复杂任务,其部署速度和规模将空前。此次AI浪潮规模大、速度快,打开服务市场。Pat为创业者提供MAD策略框架,强调以客户为中心。Sonya描绘agents无处不在的世界,带来生产力飞跃但也有社会伦理问题。Konstantine认为认知革命将类似工业革命,讲述四个故事揭示AI时代真理。作者感悟到处于历史转折点,要快速行动、以客户为中心,为agents世界做准备,重视人类连接。
Web3天空之城
更新 5 篇#1文科生的AI逆袭 - 斯坦福对话 Anthropic 联合创始人 Daniela Amodei
本文是对Anthropic联合创始人Daniela Amodei的访谈。她虽出身文学背景,却跨界投身AI领域。她强调好奇心和跨学科学习能力的重要性,认为背景不定义未来。Anthropic秉持“安全优先”,选择公共利益公司架构,认为安全与商业利益一致。对于AI引发的就业焦虑,她认为AI是技能互补工具,人类的社会沟通、同理心等能力将更重要。她还指出要防止过度依赖AI,让AI成为导师。此外,她谈及AI泡沫、监管平衡等问题,鼓励年轻人追随热情,实现商业与社会价值的结合。
#2木头姐对话币安创始人赵长鹏:从风暴中心归来,透视AI和稳定币的新秩序 | 全文图解
本文是ARK投资木头姐对币安创始人赵长鹏的访谈。赵长鹏分享了币安崛起历程,虽经历美国司法部重罚,但币安仍稳健。他指出加密支付普及慢,机构参与快,美国监管从敌视转向拥抱,开发者将回归实用型应用。他认为AI与区块链融合是现实,AI代理将成加密货币主要使用者,还将提升区块链应用开发效率。稳定币竞争格局改变,低门槛下激励竞争时代来临,非美元稳定币有增长空间。传统资产加速代币化,与加密市场深度融合。面对量子计算威胁,可通过社区协作和算法升级解决。他坚信比特币四年周期规律,机构投资者参与将稳定市场。
#3万字对话 Claude Code 创始人 Boris Cherny:软件开发的终局与重生 | 全文图解+视频
本文是对Claude Code创始人Boris Cherny的访谈。Claude Code诞生于对‘产品能力过剩’的捕捉,前期发展受挫,自Opus 4起呈指数级增长。Boris表示编码问题对他而言已解决,AI能编写100%代码,虽处理旧代码库和生僻语言有局限,但在新框架表现出色。他个人多通过手机工作,用循环和智能体提升效率。他认为未来通才会增多,团队成员都将参与编程;AI削弱部分传统SaaS护城河,为初创公司带来机会。他还将AI编程比作印刷机发明,预言软件将民主化。最后探讨了多智能体协作、本地化趋势等话题。
#4深度首发|AMD 财报电话会全解析:股价暴涨 16%,苏姿丰讲透英伟达之外的 AI 算力第二战场
2026年第一季度AMD财报亮眼,总营收103亿美元,同比增38%,数据中心业务成核心引擎。公司从通用计算向AI基础设施转型,上调2030年服务器CPU的TAM预测至1200亿美元以上。下一代产品路线图包括Venice处理器和Helios机架级平台,与Meta等达成合作。客户端、游戏与嵌入式业务也有增长,但下半年或受内存和零部件成本上升影响。财务表现优异,预计二季度营收达112亿美元,同比增46%。
#5对话传奇交易员琼斯: 交易的博弈、复利的魔力与生命的善意 | 2万字全文图解
文章是对传奇交易员保罗·都铎·琼斯的访谈。他分享五十年职业生涯心得,认为交易员需是出色的风险管理者,成功源于顺应趋势或利用复利。他指出AI存在巨大尾部风险,呼吁监管和内容水印。当前美股处于主权债务泡沫,市场脆弱。他讲述童年被帮助的经历,受启发创立罗宾汉基金会投身慈善。他还分享长寿秘诀是不退休,建议年轻人学新闻写作,认为美好生活核心是上帝、家庭、朋友和奉献,幸福秘诀是传递善意。
Datawhale
更新 5 篇#1刚刚,硅谷这篇文章刷屏了!
硅谷一篇长文刷屏,从创始人与员工视角分别给出启示。AI领域产品易趋同,公司底层组织机制成护城河,人是公司核心。伟大公司是组织形式的发明,如OpenAI、Palantir,其形态决定能吸引的人才。公司竞争身份认同,优秀公司为人才提供实现抱负的路径。创始人应思考什么样的人能在此成为自己,选人者要关注公司真实权力结构,勿被时间承诺迷惑。AI虽让部分复制变易,但构建新机构不易,未来人才市场将奖励独特形状的公司。
#2所有中国实验室都忌惮字节、尊重 DeepSeek,一份观察笔记在英文圈传开了!
美国AI研究员Nathan Lambert走访中国大模型头部玩家后,发布观察笔记。他发现中美虽都在做大模型,但存在诸多不同。工具层面,中国程序员爱用Claude,少提Codex;人员构成上,中国实验室核心贡献者多为学生,无路径依赖和成名包袱,专注解决问题。组织氛围方面,中国大模型社区更像生态,大家互相尊重,忌惮字节、尊重DeepSeek,而美国层级化组织内耗严重。心态上,中国研究员不操心商业,公司倾向自研一切。最后他提出疑问:这些差异是否会做出不同模型,并期待开源生态全球繁荣,认可中国研究员的温暖与人情。
#3AGI 全景图:一篇通用人工智能的综述!
文章围绕通用人工智能(AGI)展开探讨。首先介绍了AGI定义混乱,时间表预测不一,还存在‘AI效应’使认定标准不断提高。按人类标准,当前AI已展现通用智能,如具备心智理论、欺骗和迁移学习能力,但认定AGI需集体共识。真正的AGI可能无法被造出,存在哲学、商业和道德三重矛盾,架构约束与通用智能自主性冲突,完全自主的AGI有商业风险且会引发道德问题。或许AGI是系统而非个体,当前开发更倾向构建工具。AGI的悖论反映了人类自身的焦虑与渴望,促使我们思考智能、意识和道德地位等问题。
#4AMD 顶级大会免费门票来了,和苏妈见面!
AMD AI开发者日2026大会将于5月19日在上海举办。AMD CEO苏妈将为中国开发者登台,11年前她接手时AMD风雨飘摇,如今已成为AI芯片巨头。大会集结中国AI开源圈核心力量,一线大厂工程师与创业先锋参会。大厂开发者分享实战经验,创业专场讲述AMD平台项目如何做成生意。下午有8场实战工作坊,在2个会场平行进行,每场都有明确产出。工作坊席位有限,可扫码领取限量免费专业门票。
#5DeepSeek 版Claude Code,国内安装教程来了!
文章围绕开源项目DeepSeek - TUI(被称为「DeepSeek版的Claude Code」)展开。该项目由Hunter Bown开发,文章发布后鲸鱼兄弟群人数激增。由于群里反馈需要小白安装使用教程,作者分享国内安装教程。尝试了npm和cargo + 清华源两条路,认为cargo + 清华源最适合小白。教程包含三步:一是安装Rust工具链,Mac和Windows安装方式有别;二是配置清华源并安装DeepSeek - TUI;三是去DeepSeek开放平台申请API Key并登录运行。安装后让其用Go语言写天气查询CLI工具,代码获Claude Opus 4.7好评。
信息与交互设计研究所
更新 5 篇#1AI设计工具全场景应用专题3
进入2026年,AI从单一视觉生成进入设计完整链路。Figma在2025年Config大会推出Figma Make,可将想法转化为高保真原型,嵌入协作生态,打通设计多环节,降低沟通成本。Adobe推出的Firefly是创意生成平台,覆盖多类型内容,结合Adobe生态,支持企业定制模型,提醒团队思考内容生产方式。Runway Gen - 4可生成视频,降低创意试错成本,Runway Aleph能对视频多任务编辑,适用于多场景。
#2设计策略|场景理论分析法
文章介绍了场景理论分析法及三款设计产品。场景理论分析法是破解用户与产品交互场景的设计思维工具,强调考察交互时的各种要素,让设计扎根生活。GITD可穿戴式心肺复苏设备,由Yihang Xu等人设计,能在紧急时提供实时指导,提升心肺复苏信心。Journey Walker由Jiho Kim等人设计,是为长者设计的代步工具,可无缝切换步行与驾驶模式。Click由Mika Leßmann设计,是创新的模块化造口护理系统,减少材料消耗且易用、可定制。
#3设计组合丨医疗+轻量化设计
现代医疗技术迭代和健康需求升级,使医疗与轻量化设计融合成趋势。传统医疗设备存在体积笨重等问题,新兴医疗场景对便携性、易用性要求更高。轻量化设计从硬件和交互层面优化医疗产品。文中介绍三款产品:XenRobo K1外骨骼用于户外活动,结合AI和医学研究,模块化设计减轻膝关节压力;XFT第五代足下垂助行仪针对6 - 13岁脑瘫儿童,经用户调研优化绑带等设计;Brain4care颅内动态监测用轻质柔性材料,非侵入式测量,还支持无线充电和功能可视化。
#4全球信息交互设计年鉴 | 沉浸式空间与装置艺术(西班牙)
本期年鉴聚焦西班牙沉浸式空间与装置艺术。Instronic与H1 Sound在2026年欧洲集成系统展,于巴塞罗那展览中心走廊打造《BREATHE》,以仿生学为灵感,将功能性走廊变为诗意感知之旅,还通过数字孪生确保安装成功。Indissoluble为2025年巴塞罗那灯光艺术节创作《The Vortex》,让观众用肖像启动AI交互,成为艺术创作者。2026年高迪逝世百年,United Visual Artists为巴特罗之家创作《隐藏的秩序》,采集观众运动数据投射建筑,引入舞者剪影,融合声音、运动与光,拓展了沉浸式公共艺术可能。
#5AI设计工具全场景应用专题2
文章介绍三款AI设计工具。Lovart由陈冕创立,其走红迅速,内置MCoT推理引擎,实现思维透明化,还有“指哪改哪”等功能,解放设计师。Style3D由刘郴创立,为安踏制作羽绒服宣传片,节省成本、缩短周期,构建全链路数字化体系,推动时尚品牌降本增效。腾讯混元3D团队自2024年11月开源基础3D模型,不断升级版本,解决3D生成难题,坚持全链路开源,应用于多领域,入选相关报告,推动产业底层技术变革。
阿里云开发者
更新 5 篇#15 人 7 天干完 20 人数周的活:Spec-Driven Development 如何重新定义 AI 编程
文章围绕Spec-Driven Development(SDD)展开,先介绍“5人7天”用Qoder开发QoderWork的案例,引出SDD。SDD将规格说明作为唯一真实来源,代码是其派生产物,是AI编程时代的工程方法。其流程分四阶段,有三文件体系和constitution.md。写好Spec很关键,要具备六要素,避免坏Spec的问题。SDD工具生态丰富,不同工具适用于不同场景。实战数据显示,SDD可提升API变更效率、降低代码错误率,但无Spec约束会有安全灾难和代码重复率问题。对比Vibe Coding,SDD更适合中大型项目。SDD与Harness Engineering相关,也存在五大陷阱和局限性,不过它正沿着三级光谱演进,未来人可能只编辑Spec,代码由AI生成和维护。
#2Agent 时代的生产力悖论:当协作本身成为最大的瓶颈
文章指出AI时代企业虽配备AI工具,但组织形态等未变,导致效率提升有限。传统协作分工、研发资源组织形式阻碍效率,如分工造成上下文碎片化、信息断层和沟通成本高,代码与文档分离、文档维护靠人也影响效率,发布流程也限制了Agent能力。为让Agent更好工作,需采用All In Code信息管理、隔绝外部依赖、具备自学习能力、建设安全执行和验证能力。Aone在面向Agent的研发模式上做了探索,包括改变研发模式、版本管理、组建Agent Teams等,还引入ChangeSet记录变更信息。
#3告别“氛围编程”:基于 Harness 治理和 SDD 的团队级 AI 研发范式演进与实践
本文来自高德大模型应用平台的王树新,分享团队级AI研发范式演进与实践。起初团队AI出码率提升但提效不明显,识别出AI Coding三大问题,如自由发挥、效率降低、关键信息丢失。深入分析发现提效困境原因,包括研发是全链路过程、存量应用“氛围编程”风险高、大型项目超出AI能力边界。为此引入SDD和Harness,前者将规范变为可被AI理解的“意图代码”,后者提供可控执行方案。实践中,通过设计知识库、处理需求PRD、专家团执行任务、任务部署实现全流程自动化。未来可探索更智能的Spec生成、强大的Agent Teams和完善的知识管理。
#4Harness Engineering:耗时一周,我是如何将应用的AI Coding率提升至90%的
文章介绍AI Coding的Harness Engineering,结合Anthropic、OpenAI方法论与项目实践,分享构建Harness体系提升AI代码率的方法。2025年AI Coding Agent爆发,但从模型能力到工程产出有鸿沟,Harness Engineering可弥合。它经历三次范式跃迁,有四根支柱。当前AI Coding面临认知负担、质量控制缺失等挑战。作者在企业级Java应用中构建Harness体系,包括四要素架构、定义应用Owner Agent、分层上下文架构、十阶段开发流程、Skill体系和变更管理。实战有关键经验,如Harness需Dry Run、质量门禁可程序化验证等。效果显著,AI代码率从25%跃升至90%,返工减少、质量可预期,还沉淀知识。最后对Harness Engineering未来发展提出展望。
#5一个文件让 AI Coding 效率翻倍:AGENTS.md 实践指南
文章围绕如何写好AGENTS.md展开。先介绍其是指导AI Coding Agent工作的开放格式,起源于Anthropic的CLAUDE.md,经统一后成事实标准。实践中,没AGENTS.md时,项目存在前后端上下文割裂、AI不认识私域组件、不知项目规矩、不会启动项目和自测等痛点。AGENTS.md应遵循渐进式披露原则,只写必要信息和硬性规则,其他放链接。还介绍了仓库聚合、统一环境配置、验证闭环、自动化检查、参考项目引入等实践方法,给出编写模板和实施建议,指出其本质是用最小上下文成本让AI理解项目,维护过程也是知识沉淀。
搜狐技术产品
更新 5 篇#1这 25 个高质量网站,解决了我的 AI 焦虑
文章指出在AI快速发展下人们易有跟不上节奏的焦虑,推荐25个高质量AI前沿网站解决信息源问题。官方实验室网站如OpenAI、Anthropic等可校准事实;论文和代码平台像Hugging Face Papers、arXiv等助判断技术趋势;行业媒体和Newsletter如The Information、TechCrunch AI等利于理解商业化;国内源如机器之心、量子位等补国内生态。还给出不同需求的推荐订阅组合,强调信息源并非越多越好,要过滤低质信息。
#2这两天爆火的 flipbook 是啥玩意?
文章介绍爆火的flipbook,它能实时按需生成可视化信息图,中文友好,可根据用户需求绘制不同元素、生成新场景,还能对上传图片进行分析识别。2026年4月22日相关demo视频发布,4天获550万浏览量。它颠覆“AI生成UI”产品方向,无需HTML层。其存在用户、产品、赛道三层痛点,需探索适用场景。它算力托管在Modal,模型本身就是渲染器。作者认为它类似WebGL,适用于视觉密度高、结构难预设的场景,建议用户去体验,还设想其与AI眼镜结合的应用。
#3别再瞎用Claude了!我花了半年调教出的顶级配置,效率直接降维打击
文章介绍Claude Code的配置栈搭建,强调其重要性。先指出拉开差距的是配置栈而非prompt。随后阐述配置栈各层要点:Memory Hierarchy层,根memory文件应短且含关键规则;Path-Scoped Rules层,特殊规则放路径规则文件省token;Plan Mode层,将思考与动手分离,防止错误;Custom Subagents层,按需自定义子代理分工;Skills层,打包稳定工作流;Hooks和Determinism层,加确定性护栏;Server Stack层,少装服务器;Parallel Worktrees和Headless Automation层,并行管理和非交互运行。还给出下限和上限建议,提醒勿毁配置,最后引出Context Rot问题。
#4深度解析与业务实战:将 screenshot-to-code 改造为支持 React + Ant Design 的前端利器
文章聚焦将screenshot-to-code改造为支持React + Ant Design的前端工具。先介绍代码生成发展,指出大语言模型带来转变,市面上已有多种多智能体代码生成工具。接着分析screenshot-to-code源码核心流程,包括运行过程、工作流程和核心数据流。然后阐述改造实现,调整提示词工程,切换默认模型为智谱的glm - 4.6v并进行后端处理与校验,适配样式系统,改造后能输出符合要求的代码,减少基础布局和组件拼装时间。最后总结项目应用场景、痛点及后续方向,强调其在重塑研发链路、提升研发效率和保障用户体验上的价值。
#5compose_skill 和 android skills,对 Android 项目提升巨大的专家 AI Skills
文章介绍了Compose AI Skills项目compose_skill和Android官方发布的skills。compose_skill可对Compose项目生成评分报告,通过内置Gradle初始化脚本解析编译器报告和指标,从性能、状态管理等维度评判,生成带代码位置和官方文档引用的报告,还能筛选修复点并预测提升效果。相比一般AI评价和Linter更专业全面。而Android官方skills用于项目升级和适配,如升级AGP 9、迁移XML视图等,通过结构化文档指导AI操作。
火山引擎Agent社区
更新 5 篇#1当 Agent 真的开始“动手”:Mobile Use Agent 如何补齐平台型 Agent 的移动端执行闭环
文章围绕 Mobile Use Agent 展开,指出 Agent 平台进入“可执行能力”竞争阶段,很多平台型产品虽能助力构建 Agent,但在移动端执行存在能力缺口。操作手机在真实业务中复杂,有界面不稳定、API 不开放等问题。Mobile Use Agent 作为运行在云手机环境的执行型 Agent,可补充平台执行链路。接入后能应用于账号运营、App 测试等场景,从扩展能力、提升转化率、形成生态能力三方面为平台客户创造价值。它与传统 RPA 有别,更适合移动端任务。当前 Agent 平台竞争聚焦交付结果,Mobile Use Agent 能补齐移动端执行闭环。
#2火山引擎 veRoCE 获权威认证:IANA 官方为 veRoCE 分配专属 UDP 端口号 4794
2025年12月火山引擎发布veRoCE,近日IANA为其分配专属UDP端口号4794。这标志协议获权威认证,简化硬件卸载、打通厂商网卡互通、降低部署门槛。4794端口有三大好处,支持硬件卸载加速、多厂商设备互通、运维配置简单。AI时代传统网络协议面临挑战,veRoCE适配新需求,有四大核心能力。它已在字节跳动实测,此次获端口标志进入标准化、生态化阶段,呼吁各方共建高效GPU算力网络。
#3依托 Doubao-Seed-2.0-lite 打造“AI 电竞教练”的架构设计与工程落地
文章介绍依托Doubao - Seed - 2.0 - lite打造“AI电竞教练”的架构设计与工程落地。Doubao - Seed - 2.0 - lite支持全模态输入,可“看”“听”游戏信息。为打造电竞教练,先拆分传统教练行为,提出每个专业行为维度由单独Agent负责的理念。工程落地时用Vibe Coding,与AI商量技术选型,设计出优雅结构。解决了大模型上下文有限、流式调用假死等问题。实现单局复盘后,构建上层教练进行单场和系列赛分析。最后用Seed - 2.0 - lite构建Web UI展示分析结果,解决前端性能问题。该项目使电竞指导平民化,架构具可扩展性。
#4火山引擎全面支持 Milvus 2.6 版本:更快、更省、更稳
火山引擎向量数据库 Milvus 版发布云上 Milvus 2.6 版本,完全兼容开源版。该版本相比 2.5 版,引入流批分离架构等,实现更快、更省、更稳。更快体现在优化 BM25 全文检索和 JSON Path 索引;更省依靠 RaBitQ 1 - bit 量化技术与冷热分层存储;更稳源于架构演进。其架构从耦合到分离,成本从全量加载到智能分层,能力从单一到融合。火山引擎全托管服务覆盖实例全生命周期。该版本适用于 RAG 等场景,能为企业带来收益,现可申请免费试用。
#5豆包大模型 2.0 lite + ArkClaw 让教学反馈效率成倍提升
传统教学评估流程繁琐,需数小时甚至一天。豆包大模型 2.0 Lite 和 ArkClaw 可在飞书群完成教学评估。文章介绍其优化教学评估全链路的 5 个步骤,包括搭建助手、开通模型、构建技能、上传视频、分析生成报告和发送结果。该工作流底层依靠豆包大模型,具上下文一致性、精准解构指令和高保真多模态解析能力,可将教学评估链路集成到群聊自动完成,降低执行成本,不替代人类决策。
极思TopMinds
更新 5 篇#1深度丨329个人,撑起了Anthropic 1.2万亿的幻觉
Anthropic被传估值1.2万亿美元引发关注,但该估值来自Jupiter平台,仅329个交易者、日成交量139万美元,流动性与估值严重不匹配。实际上,Anthropic有真本事,2026年第一季度年化收入同比暴涨80倍,Claude Code发展良好,超1000家企业年支出超百万美元。马斯克提供22万块GPU,谷歌、亚马逊、微软等也提供算力支持。2月G轮融资时,经专业机构尽调,其估值为3800亿美元。文章还回顾历史泡沫事件,指出高价经媒介传播成广泛共识,最终价格会崩塌。1.2万亿美元反映了不同群体的焦虑情绪,而3800亿美元更接近其真实商业价值。
#2速递丨DeepSeek融资500亿,梁文锋自掏200亿?
DeepSeek计划融资500亿,估值达3500亿,阿里因想深度绑定模型与DeepSeek谈判或破裂,创始人梁文锋可能自掏200亿占40%。DeepSeek成立于2023年,此前以纯研究导向收获声誉,但算力成本上升、人才流失,使其需资金支撑。它正从研究机构向商业公司转变,计划6月发布V4.1,不过商业化挑战严峻,C端月活落后,变现路径不明。这一转向是中国AI创业潮缩影,下半场比拼赚钱能力,市场关注其能否平衡理想与商业。
#3深度丨不竞之争:Nathan Lambert 的中国AI观察笔记
Ai2研究员Nathan Lambert走访中国头部AI Lab后,写文章分享对中美AI生态差异的观察。他指出美国实验室科学家倾向个人主义,带来组织摩擦;中国研究员更专注造模型,集体优化文化影响模型质量。中国实验室团队年轻有‘白纸优势’,但存在‘从0到1’原创突破隐忧。北京AI布局似湾区,但氛围不同,中国LLM社区更像生态,开源重实用。中美在模型、科学家、算力等方面基本一致,差异在组织文化,‘不争’文化助中国在做模型上赢得尊重。
#4速递丨170亿元,中国大模型最大单笔融资,超越Kimi
阶跃星辰成立仅两年,即将完成近25亿美元(约170亿元)融资,将成中国大模型领域最大单笔融资。投资方有手机及消费电子产业链企业和香港投资管理有限公司。公司为赴港IPO做铺垫,已完成股改、拆除红筹架构。核心团队兼具产业和技术背景,发布Step系列大模型,开源多模态大模型。此前已完成两轮融资,若本轮落地,有望成第三家登陆港交所的国产大模型企业。行业融资竞赛升温,平衡技术研发、商业化和资本化路径是关键。
#5Pro丨API中转这门生意下,是总统家族的加密野心
2026年5月5日,特朗普家族旗下加密项目WLFI转发新产品WorldClaw,它是WLFI生态首个AI项目,将多个大模型API打包,接入超60个模型,后续计划超300个,定价低30%,用WLFI发行的USD1支付。套餐分四档,最贵套餐送硬件和抽奖券,特等奖是与特朗普家族共进晚餐。AI中转站生意竞争激烈,已有84家跟进,国内有人低价竞争。WorldClaw特别之处在于按次卖API、送饭局,吸引用户进入WLFI代币生态。但WLFI深陷官司和治理争议,孙宇晨起诉其敲诈勒索,质疑USD1储备金,WLFI也起诉孙宇晨,且金库抵押代币套钱遭质疑。
51CTO技术栈
更新 5 篇#1我们都误解AI了!Sam公开怒怼:说“50%岗位消失”的缺共情,说“AI只是抄袭”的太荒谬,真相是人类会更忙,也更敢创业了!
OpenAI的CEO Sam Altman在节目中回应了对AI的误解。他反驳“50%岗位消失”的说法,认为这是灾难叙事,工作形态会变但人类不会无所事事,AI能力越强人类可能越忙。他也否定“AI只会抄袭”的观点,以ChatGPT为例说明其能贡献新知识。Sam从技术和科技发现角度阐述了爱上AI的原因,认为它能放大人类能力、让世界变好。还谈到AI与预测的关系,指出预测接近智能。在AI人格方面,他认为设定是重要且待研究的问题。他关注AI在医疗领域的应用,提到监管是阻碍。此外,他介绍了AI发展的三个重要方向,分析了算力、数据、算法对AI进步的影响,还提及机器人、硬件、Agent等方面的看法,表达对未来人类高度自主、避免权力集中的期望。
#2一年后Claude不需要Harness工程了?产品和工程负责人爆料:搭建Agent的最终难关是基础设施壁垒;Harness和模型正高度配对
本文是Claude平台产品和工程负责人访谈,探讨Claude发展及Managed Agents。Anthropic在开发者大会发布新功能,推出Managed Agents是为避免重复踩基础设施的坑,将文件系统等集成到云端。Harness和模型高度配对,人们通过Harness工程提升模型性能。其受众为构建自动化工具的公司人员和将AI融入产品的人。搭建智能体时,人们原以为Harness工程难,实际基础设施才是壁垒。Claude未来会向易部署的Agent方向进化,一年后或实现极致简化,自动判断模型和启动子智能体。此外,还介绍了多智能体编排玩法、智能体成效衡量、管理过时智能体等内容。
#3红队攻、蓝队防、白盒查,智源把大模型安全做成了"三重门"
近日,北京智源研究院联合多机构发布FlagSafe大模型安全平台。当前大模型面临跨模态、跨场景复合风险,传统安全能力难以应对。该平台围绕红队演练、蓝队防御、白盒透视三个核心方向,确立AI安全基线。红队通过全模态评测等主动发现风险;蓝队从模型训练到应用治理各层构建防线;白盒透视从模型和数据层解释风险成因。平台以模块化、开放式形态汇聚成果,后续将扩充功能矩阵,智源研究院期望构建良性闭环,邀请各界共同推进大模型安全发展。
#4Markdown要被抛弃了?Claude Code工程师自曝:我已彻底放弃使用Markdown!团队倾向使用HTML!网友:其他编辑工具会被淘汰吗?
Claude Code工程师Thariq分享已不再使用Markdown,转而用Claude Code生成HTML文件,帖子浏览量超200万。Markdown简洁、易编辑,但长文件阅读难、信息密度低、分享不便。HTML优势明显,信息表达丰富、阅读友好、易分享、支持双向交互。Claude Code调用上下文多,Thariq用它自动生成HTML页面。HTML有5大使用场景,如发散思考、代码审查等。不过HTML耗Token、生成慢、版本控制差。网友肯定用HTML替代Markdown,认为能提高工作效率。每种工具都有其“生态位”,其他编辑工具不会被淘汰。
#5“工程师神话”破灭!OpenAI总裁断言:算力才是真正的硬通货,但绝对不够!AGI只剩最后20%的路;未来你只是十万个Agent的批准按钮
OpenAI联合创始人兼总裁Greg Brockman在AI Ascent 2026活动中与红杉资本合伙人对谈,提出算力是稀缺资源,其商业模式是购买、租用、建设算力再出售。他认为规模定律持续生效,通往AGI已走完80%路程,模型能力强大。创业者应全面拥抱AI工具,OpenAI内部使用Codex预演未来工作方式。团队结构因AI发生变化,瓶颈转向信息共享与治理。未来公司形态将改变,个人创业者或打造惊人公司。构建生产级Agent要考虑人类因素,AI可提升安全性但非魔法。OpenAI平衡速度与责任,聚焦核心愿景。AI在科学领域也有突破,有望推动科学复兴。
十字路口Crossing
更新 4 篇#1在你看不见的地方,HeyGen 正在改写 AI 视频生成
HeyGen发布基于HTML的视频渲染框架Hyperframes,强调确定、可控、批量生产。此前领域重要项目Remotion用React写视频,HeyGen使用后觉不足,遂开发Hyperframes并开源。体验中,启动简单,用自然语言交互,内置校验机制,出品较规范。从生成科普视频到批量生成三丽鸥家族系列视频,成本低、迭代快。与纯prompt驱动工具相比,Hyperframes更稳定可控。不过,它也有局限,自然语言描述空间关系带宽有限,模型无视觉反馈回路,需人工视觉微调。HeyGen做此框架,一是因Remotion商业授权,二是其场景中AI自动生成视频增多,Hyperframes对AI友好,且可接入其付费数字人产品。
#2龙虾退烧后,荣耀给它造了一个宇宙
OpenClaw热度退去后,需要稳定生长环境。4月13日荣耀发布YOYO Claw小龙虾宇宙,将OpenClaw嵌入PC、平板、手机。PC端界面简化,使用门槛低,可完成多种任务;平板端部署简单,适合轻量任务;手机端可本地运行,能与其他硬件联动。YOYO控虾以手机为入口,可远程指挥PC上的虾。荣耀还注重数据安全,核心数据本地处理。OpenClaw存在配置难、Token贵、隐私担忧等问题,荣耀此举是手机厂商对端侧AI的尝试,目标是让AI Agent安全便捷,真正服务大众。
#3好奇、兴奋、坐不住、年轻 builder:周末来打一个黑客松吧!
本文介绍了Ship It Sunday黑客松活动。它每月一次,一天完成,已吸引超1000名builder,产出120多个项目。活动地点AI Hacker House筛选参与者,确保都是有动手意愿的builder。多位参与者分享经历,如Ellis的“包包贴LED”、风影的AI徽章、刘亚龙的“城市随机事件”等。部分项目后续发展良好,像Edward的“Vibe Island”获百万级曝光。活动无评委,由参赛者投票评奖,强调“互相看见”。2026年活动升级,鼓励人们在AI时代提前行动,它为年轻builder提供相遇和创造的空间,5月活动正在报名。
#4上海,周日黑客松,欢迎来玩🎪
Ship it Sunday是AI Hacker House每月一次的AI黑客松活动,已举办八期,累计300+参与者,产出180+项目,还助多人创业、组队。本次#009主题为“Make something agents want”,大模型时代产品设计对象包括Agent,有人为其打造各种适用环境与工具。活动于5月17日在上海漕河泾开发区公园举办,扫码或访问链接报名,冠军获10000元现金,由多机构联合主办。
梯度不陡
更新 4 篇#1Meta 做了个实验:让 AI 从零重建软件,结果全军覆没
Meta在论文ProgramBench中提出AI Coding Benchmark,让模型在无源码,仅提供程序和文档的条件下从零重建完整软件系统。测试200个真实项目、9个顶级模型,完整解决率为0%。该测试与传统代码评测不同,更注重行为理解、系统拆解等能力。它将AI Coding问题从代码生成推进到系统重建,暴露出当前模型在无人类提前组织结构时的诸多问题,也提醒工程团队在接入Coding Agent时要正确评估其能力,明确任务边界,重视验证环节。
#2AI Coding 别等写完再测:从输入到黑盒验收的验证分层
文章指出AI Coding从“生成代码”走向“参与交付”,验证需构建分层系统。传统验证后置易致问题暴露,因前期输入、表示等环节可能有偏差且执行成本下降会放大上游偏差,所以验证要前移。端到端自动化验证分四阶段八层级:前置验证含输入和表示验证,确保任务可执行;执行结果验证有实现和工程验证,判断任务完成及代码入工程体系情况;黑盒验收验证含交互、视觉、回归验证,关注用户路径、设计意图和系统稳定性;人工验收保留高语义判断。验证分层是Benchmark基础,后续要解决评估体系和验证能力运行问题。
#3Signal #10:当 Agent 进入 CI/CD、Issue 和云端沙箱,AI Coding 才真正开始系统化
本周 Signal 记录 AI 与软件工程变化。近期 AI Coding 更新密集,GPT - 5.5 等推动模型和 Coding Agent 发展。过去 AI Coding 是‘人主动唤起的工具’,如今 Agent 后移,进入 Issue 系统等工程系统,成为新执行单元。AI Coding 竞争从‘生成代码’转向‘嵌入工程系统’,接下来主战场将从模型能力走向任务表达、执行环境与系统闭环,工程系统决定其能否规模化落地。
#4AI Coding 的上半场是生成,下半场是验证|AI 代码被采纳,不代表需求可验收
文章指出AI Coding上半场让代码生成、采纳,下半场要验证、修正结果并形成工程闭环。AI降低生成成本,也转移验证压力,出码率高但不能替代验证。任务表达对AI执行和系统验证都重要,验证不是简单测试,可分执行中与交付后两类。执行中验证纠偏,交付后验证保障质量,验证闭环可让错误有去处,下半场核心是建立判断能力,让AI成果纳入工程流程。
腾讯研究院
更新 4 篇#1腾讯研究院AI速递 20260509
文章为腾讯研究院AI速递,涵盖生成式AI与前沿科技动态。生成式AI方面,OpenAI推三款实时音频模型,Claude接入微软Office套件,还上线Codex Chrome插件;OpenAI表彰首批AI原生本科毕业生;美团公测AI社区觅游;苹果或9月发带摄像头AirPods但量产存变数。前沿科技方面,宇树开放机器人任务动作应用商店UniStore,谷歌AlphaEvolve优化多项技术并参与TPU设计。
#2腾讯研究院AI速递 20260508
本文为腾讯研究院AI速递,涵盖生成式AI与前沿科技动态。生成式AI方面,马斯克官宣xAI解散,业务整合进SpaceX新部门,SpaceX租GPU给Anthropic;多公司联合发布开放网络协议MRC封堵GPU算力浪费漏洞;Claude推出Dreaming功能战力提升;DeepMind入股游戏开发商;豆包、千问、生数科技均有产品升级或新功能上线。前沿科技方面,Genesis AI发布机器人基础模型GENE - 26.5,可完成复杂操作。
#3注定改变历史的一代人
文章围绕AI原生代面临的挑战展开。2022年11月30日ChatGPT开放标志着算法原生者诞生。在认知上,从深度思考转向高效整合,但存在基础能力萎缩、确定性思维让渡、失去独立和批判性思维等风险;情感方面,真实与虚拟边界模糊,亲密感和共情能力被重塑,AI伴侣作用待明确;社会层面,算法导致新阶级分化、社会控制和就业市场变化。最后指出人类需从有用性到体验性重构价值,从竞争到共生转变生存哲学,从个体成就转向集体意义,AI原生代要创造人类与算法共生的新世界。
#4腾讯研究院AI速递 20260507
该文章是腾讯研究院的AI速递。介绍了多家公司的AI进展,如OpenAI推出GPT - 5.5 Instant,幻觉率降52.5%、字数减30%;Anthropic主动助手Orbit曝光,Code with Claude将登场;Luma升级Uni - 1.1并开放API,图像榜单进全球前三;TRAE SOLO三端全量开放;GenSpark 4.0全球发布。还提及李飞飞联创的AI游戏公司Astrocade获5600万美元融资,Subquadratic推出SubQ模型。此外,报告了谷歌DeepMind CEO认为AI最好用途是改善人类健康,Claude Code之父Boris称2026年没写过代码并预言软件开发趋势。
谷歌开发者
更新 4 篇#1这次,Android 大有不同
文章宣传北京时间5月13日凌晨1点的The Android Show | I/O特辑,称可共同见证Android极具里程碑意义的一年,还给出预约提醒网址http://Android.com/io - 2026,让观众第一时间掌握先机。
#2有奖调研与进度提醒|Google Play Games Level Up 计划
Google Play Games Level Up计划旨在发掘并奖励体验出色的游戏,提供工具和推广资源助游戏业务发展。当前游戏出海面临玩家跨设备体验割裂等挑战,该计划推出以重塑连接。计划有明确时间线保证福利,实施中获开发者认可。现诚邀开发者扫描二维码填调研问卷,会从认真填写者中抽5位送专属电脑包,后续通过问卷邮箱联系。
#3报名开启 | Google Cloud Next 26 中文精选课三城巡回启幕
4月22 - 24日,Google Cloud Next 26在拉斯维加斯举办,宣布了全新统一的AI技术栈、第八代TPU等创新技术。为让出海开发者同步前沿洞察,Google Cloud Next 26中文精选课@Build with AI线下巡回活动将在上海、北京、深圳举办。活动亮点包括前沿技术发布、第一手“开箱报告”、Build with AI动手实验、开发者交流及专属礼包。活动需自备笔记本电脑,上海站5月16日、北京站5月23日、深圳站5月30日。活动议程有Next 26核心发布解析、Google Cloud深度用户参会笔记、Next 26专题动手实验室等。
#4Android CLI 实战指南: 借助任意智能体,实现 3 倍速高效开发
谷歌开发者推出用于智能体工作流的全新 Android 工具与资源,包括 Android CLI、Android 知识库和 Android Skills。Android CLI 作为从终端开发的主要接口,能减少 LLM 的 Token 使用量,提升项目完成速度,具备 SDK 管理、项目创建等功能。Android Skills 是模块化指令集,涵盖常见工作流。Android 知识库可让智能体获取最新开发者指南。这些工具能使开发更高效,还能让向 Android Studio 过渡更顺畅。目前 Android CLI 已推出预览版,可下载体验。
与数据同行
更新 3 篇#1【数据社群】数仓/治理/建模/数字化/职场/招聘等领域的经验交流!
该学习社群有数据专业群与招聘交流群,已连接超2万数据专业人士。数据专业群分综合、数仓等六个专业群,综合群必选,其他可选1 - 2个,群内有原创文章、话题讨论等活动。招聘交流群应成员要求开设,为求职者和招聘方提供连接,可自由发布信息,有在线文档辅助匹配,不承担求职纠纷责任,会移除发虚假、无关信息者,不欢迎猎头。
#2数据目录上线了,业务为什么还在微信群问人?
文章围绕数据目录上线后业务仍在微信群问数据的现象展开。分析了大家常认为的产品搜索、元数据、培训、用户习惯等问题,指出这些归因只在最后环节找原因。强调资产登记不等于数据消费起点,数据目录常被做成资产台账,原因在于组织激励结构按建设项目考核。详细阐述使用链路的七个断点,包括业务不知搜什么、语义不匹配等,并明确数据、业务、IT 与平台、管理者各部门责任。最后给出修复顺序,先修链路再修界面等,还提出下次业务反馈问题时应问的五个问题,以让数据被正确找到。
#3【数据社群】数仓/治理/建模/数字化/职场/招聘等领域的经验交流!
该学习社群为数据专业人士提供交流平台,分数据专业群和招聘交流群,已连接超2万数据专业人士。数据专业群含综合、数仓等六大专业群,活动有原创文章分享、话题讨论等。招聘交流群为求职者和招聘方提供连接机会,可自由发布信息,有在线文档助匹配,不承担求职招聘纠纷责任,会移除发虚假、无关信息者,不欢迎猎头。
数字生命卡兹克
更新 3 篇#1装了这个AI热点Skill之后,你再也不需要自己去刷AI新闻了。
作者将AI热点监控网站AIHOT免费开放,首日访问用户突破10万UV,浏览PV超60万。应用户需求,紧急上线浅色模式,并通宵开发增加了Skill、API、RSS三种接入方式。AIHOT Skill可让Agent读取网站数据,有AI日报、精选模式、按时间窗口或分类查、按关键词查等功能;RSS为用阅读器的用户准备;API供想集成数据到系统的用户使用。
#2这个封装了我3年自媒体经验的AI热点网站,今天向所有人免费开放。
作者将承载三年AI自媒体经验的AIHOT网站免费开放。该网站可监控AI信息、精选内容,保护用户注意力。作者先筛选168个信源并分三类,再处理抓取的大量信息。精选机制复杂,评分策略迭代11版,最终让大模型打5维分,用代码重算质量分和判断精选。还有事件聚类系统避免重复,AI日报功能自动整理前24小时精选内容。未来作者还计划开发新功能,但部分可能仅对公司员工和签约博主开放。
#3ChatGPT正式上线广告主平台,AI产品从今天开始走向分裂。
今日凌晨OpenAI更新,在ChatGPT上线非推理模型GPT - 5.5 Instant,还官宣向企业主全量上线广告平台。此前ChatGPT广告已在部分地区测试,付费和未成年用户无广告,免费用户可选择关闭但会降功能。投放端测试结束,美国企业可自行注册投放,降低了门槛。ChatGPT有庞大用户群,但免费转付费比例低、用户流失率高,引入广告是必然。Anthropic因用户结构不同选择不做广告。AI产品走向分裂,一是注意力变现,如ChatGPT;二是生产力变现,如Anthropic的Claude。此外还有代理式交易的第三条路,但尚未走通。
字节跳动技术团队
更新 3 篇#1抖音动态体验优化实践与思考
文章围绕抖音动态体验优化,介绍 DDPF 框架实践。因抖音业务拓展、用户增长,传统资源调度难以为继,故推出 DDPF 框架。该框架历经三阶段演进,有标准核心链路,实现从‘代码硬编码’到‘多维度条件精准过滤’跨越。在感知与决策方面,构建复杂感知能力,如低交互场景识别、性能负载分级;引入端智能技术,包括打通端智能与 DDPF、GC 多参数智能决策、端侧大模型应用。虚拟机调节专项则通过数据埋点、挖掘可调节能力,产出优化策略。未来,还需关注动态诊断和数据挖掘,以形成完整体系,为行业提供范式。
#2当桌面 Agent 成为常态,飞连 ADR 给出全链路安全答案
AI Agent引发生产力革命,超84%企业探索或试点,企业关注如何安全使用。当前有三个趋势重塑办公安全:从“聊天”到“做事”风险激增;从MCP到CLI权限放大;从“人”到“AI与人”运营挑战大。飞连建议全链路保护桌面Agent:升级基础安全;全链路约束高权限Agent;转为意图治理;用AI研判AI风险。其ADR方案采用“端 - 网 - 云”一体化架构应对新型威胁。
#3《2025字节跳动企业社会责任报告》发布
近日,《2025字节跳动企业社会责任报告(中国)》发布。过去一年,人工智能等前沿科技发展并走向场景应用,字节跳动积极承担社会责任,以科技创造美好。报告从共享科技创新、助力经济发展等六个方面,回顾了字节跳动以科技实现社会价值的探索和实践,完整版报告可扫码或点击阅读原文获取。
Gartner公司
更新 3 篇#1【Gartner报告精选】十五五规划与CIO领导力;数据智能体;网络安全;中国基础设施技术采用规划
文章是Gartner报告精选,涵盖多个领域。“十五五”规划将引领2026 - 2030年中国经济社会发展,CIO需了解其对企业的影响并采取措施。数据智能体在中国使用激增,但未达成真正自治,D&A领导者要做好准备。中国企业整合生成式AI时,认识到其利弊,报告为CIO和团队提供网络安全前瞻性洞察。还探讨了中国AI系统安全保障、跨国企业网络安全应对监管、企业代理型AI安全、数据管理助力AI全球应用、地缘政治下基础设施技术战略规划、SASE/SSE平台适应新访问情况等内容。
#2AI智能体与OpenClaw:企业面临哪些安全风险?|Gartner在线研讨会
随着企业试点AI智能体、员工对OpenClaw使用需求增加,安全风险从“模型层”延伸到“执行层”和“控制层”。本次Gartner在线研讨会将深入分析AI智能体与OpenClaw带来的新型安全挑战,如权限滥用、指令注入等,探讨构建可信AI自动化防御体系,实现创新需求与风险可控的平衡。会议还列出研讨议题、时间,介绍主讲人,并提供两种报名方式,提醒用企业邮箱注册。
#3Gartner提出三大要素助力企业基于新的AI基础设施部署大语言模型
Gartner预测到2028年,中国70%大型企业将为大语言模型在AI基础设施部署建立治理框架。其分析师将在Gartner 2026大中华区高管交流大会探讨AI基础设施技术趋势。2025年中国企业计划增加生成式AI和AI领域技术投资。但大语言模型在AI基础设施生产部署不易,Gartner提出三大要素助力:构建全面部署战略,契合整体AI战略;制定稳健治理流程,提升I&O团队部署能力;促进关键利益相关方协作,成立跨职能AI治理委员会保障落地。
火山引擎
更新 3 篇#1中国移动×火山引擎:首创“机密模型服务”新模式,让企业安全用好AI
5月8日,中国移动与火山引擎在2026移动云大会发布“移动引擎机密模型服务”专区,为各行业提供AI服务。该服务在移动云构建安全可信的机密执行环境,让豆包大模型推理端到端加密、可追溯可审计,零硬件投入、全托管免运维。已上线豆包视频生成模型Seedance 2.0,支持多模态输入,更贴合工业级创作场景。字节跳动自研大模型豆包大模型2.0等也即将上线。火山引擎副总裁表示将与中国移动打造以Tokens为核心的智能运营范式。双方将深度合作拓展产业化应用,助力各行业智能升级。
#2占比49.5%!火山引擎领跑中国大模型公有云市场
5月7日IDC公布中国企业级MaaS市场格局,2025年中国公有云上大模型调用量达1944万亿Tokens,同比增16倍,火山引擎以49.5%份额居首。自2024年5月推豆包大模型,其MaaS服务占比逐年提升。2025年市场从试点到规模化,Token消耗因多模态大模型成熟和Agent类应用落地而加速。豆包大模型家族持续迭代,2026年能力进一步提升。2025年MaaS市场爆发,应用群体集中在多行业,超150万企业和个人用火山引擎大模型服务,在多行业发挥重要作用。
#3Doubao-Seed-2.0-lite升级,支持全模态理解
今天,Doubao - Seed - 2.0 - lite升级,它是豆包大模型家族首款全模态理解模型,支持视频、图像、音频、文本原生统一理解,Agent、Coding与GUI能力同步升级,已在火山方舟上线。其视觉理解能力大幅提升,在多领域达SOTA水平,融入语音理解后可跨模态联合推理。在视频、音频理解上表现出色,音频多项指标优于Gemini - 3.1 - Pro。Agent和Coding能力使长任务更稳定,胜任前后端深度开发;GUI能力实现界面理解与操作执行一体化。全模态结合其他能力可解锁电竞、在线教育、海外电商运营等场景,此外,Doubao - Seed - 2.0 - mini全新版也已上线,Tokens效率更高。
蚂蚁技术AntTech
更新 3 篇#1诚邀参加ACM MM 2026 挑战赛EgoLink:共同推动第一视角推理的前沿探索
ACM MM 2026挑战赛EgoLink由蚂蚁集团、浙江大学等机构研究者发起,已开启报名。第一视角理解是具身智能关键能力,当前多模态大模型处理第一人称视频有两大挑战。EgoLink创新在于全面评估集成智能、基于真实场景、实现感知 - 推理 - 行动耦合。它设置两个赛道,赛道1评估社交推理能力,赛道2评估交互执行能力。还公布了两赛道时间表,诚邀相关领域研究者与开发者参与,优秀选手报告将被推荐至ACM MM 2026主会议论文集。
#2“AI安全”能力获认可!蚂蚁集团入选第十一届CNCERT网络安全应急服务支撑单位
近日,CNCERT发布第十一届网络安全应急服务支撑单位遴选结果,蚂蚁集团入选“人工智能安全”重点技术领域支撑单位。CNCERT负责互联网网络安全事件处理等工作,其遴选每届任期两年,行业认可度高。“人工智能安全”是本届新纳入领域,蚂蚁是该领域五家入选单位中唯一非安全类科技企业。近年来,蚂蚁安全部门围绕AI安全多方向投入,有多项成果,如牵头制定标准、推动风险事件库建立。相关成果在集团内广泛应用,部分项目获多项荣誉。
#3蚂蚁集团牵头推动ASL协议,填补智能体可信协作空白
近日,IIFAA联盟携手蚂蚁集团等伙伴发布《智能体安全可信互连协议》(ASL协议),补齐AI产业安全短板。随着多智能体协作问题凸显,ASL作为安全增强组件,叠加于现有协议上,构建端到端安全防护体系,涵盖可信身份等四大维度。其能力已支撑停车缴费等高频场景AI服务落地,在支付场景中与ACT协同配合。ASL协议秉承开放原则,欢迎行业伙伴推动迭代,IIFAA联盟成员超300家。
36氪Pro
更新 3 篇#1接入AI agent的家庭机器人,离成为真正的「家人」还差什么?
文章围绕接入AI Agent的家庭机器人展开。目前具身智能行业进入新阶段,实验室产品在现实中难以满足用户个性化需求。乐享科技作为全球消费级具身智能开创者,接入腾讯云ClawPro后,内测用户日均交互时长从30分钟升至2小时。乐享科技联席CTO李元庆将家庭机器人属性拆分为pet、partner、assistant三层,想让机器人成为真正“家庭成员”。基于ClawPro的AI Agent接入后,打通“与人互动”路径。家庭机器人进入家庭面临安全性和稳定性问题,这也是乐享选择腾讯ClawPro的原因。接入后团队无需重复底层建设,可专注呼应用户需求,从瀑布式研发转向快速的demo驱动。具身智能赛道虽不成熟,但充满机会,腾讯云ClawPro将陪伴企业探索。
#2小红书四年AI路:FOMO、犹豫,到突然加速
本文讲述小红书四年AI发展历程。起初小红书对AI持克制态度,虽投入模型能力但谨慎控制其对社区生态的介入。2023年小红书筹备大模型团队,推出AI应用“点点”,但自研模型路径未跑通,产品进展不及预期。同时,“问一问”功能提升了社区用户留存率,但也引发与商业化的冲突。2025年秋季,小红书对AI态度转向积极。2026年4月30日,小红书宣布成立AI一级部门Dots和企业智能部,加大对AI的投入。尽管小红书技术积累和算力资源有限,但仍认为自研模型是参与竞争的必要条件,期望在垂直领域打造满足用户需求的产品。
#3一个会计带着N个「龙虾」,慧算账重做财税交付
慧算账作为财税服务头部企业,此前通过嵌入OCR、RPA等技术,实现大部分标准化财税流程自动化,一个会计一年可服务两三百家公司。但30%的非标场景需人工判断,成为人效提升瓶颈。慧算账接入腾讯云ClawPro一站式AI Agent平台,将其嵌入企业微信工作流,会计及前端顾问、运营、人力等岗位使用后,单个会计服务能力从200 - 300家提升到400 - 500家,效率提升超50%。同时,ClawPro让Token消耗可见,便于管理,未来竞争在于降低Token成本。慧算账目标是会计岗位100%“含虾率”,重构交付方式。
美团技术团队
更新 3 篇#1报名|CVPR 2026 美团学术论文精选及分享会
CVPR是计算机视觉和模式识别领域顶级国际学术会议。2026年美团技术团队十多篇论文被CVPR收录,本文精选10篇分享。5月21日下午将分享6篇论文知识点和技术思考,可点击链接报名。这10篇论文技术方向广泛,如U - Mind解决生成式AI实时交互问题;主动智能视频化身探讨数字人转变;PositionIC解决图像定制问题;PosterOmni生成通用艺术海报;PosterReward精准评估平面设计;UniComp从信息论重构视频压缩;OneThinker解决视觉强化学习局限;3DThinker弥补多模态大模型3D推理缺陷;TwiG解决文生图模型控制偏差;UFVideo解决视频大语言模型跨粒度关联局限。
#2用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践
文章围绕31万行代码AI重构实践,分享用Agent评测思路管理AI Coding的经验。背景是Agent评测系统业务和工程复杂度高,重构动因包括业务模型需升级、代码腐化、AI Coding缺规范。重构分三阶段:2月借助AI梳理技术债,发现AI可助‘看全’问题,人判断重点;2月底制定AI友好规范,先‘人人对齐’再‘人机对齐’;3 - 4月建立SOP,借AI完成工程分层与解耦,零排期渐进式重构业务模型,建设AI CR与Pre - PR机制及AI辅助测试用例生成规范。沉淀经验有:用评测思路管理AI Coding、AI重定义‘经验’价值、技术债可迭代消化、工程师角色转变,并给出团队落地行动指南。
#330万+元奖金池!美团校园 AI Hackathon 大赛等你来战
美团举办校园AI Hackathon大赛,设有30万+元奖金池邀大家参与。
百度地图
更新 3 篇#1【AI地图 Tech说】第八期:智能副驾——从全双工对话到端到端语音语义一体化模型
文章围绕百度地图智能副驾展开,介绍其全双工对话和端到端语音语义一体化模型。先阐述语音识别技术发展,从早期机械式到深度学习时代,如今端到端模型兴起,百度将地理信息融入提升识别准确率。全双工对话解决单轮交互局限,但面临技术挑战,百度用优化策略保障稳定运行。端到端模型简化流程、提高效率,百度在工程层面创新应对挑战。以小度想想AI副驾为例,展示其集成技术带来的优质出行体验。最后展望出行智能副驾未来,虽前景好,但仍有真实世界任务处理等问题待解决。
#2【AI地图 Tech说】第七期:一文解码百度地图智能汽车SR
文章围绕百度地图智能汽车SR技术展开。它能将多传感器获取的环境信息三维渲染,提升用户对周边环境认知和人机信任感。从产品形态看,SR历经纯感知、地图融合到全融合的迭代;不同车厂基于自身技术栈选用不同SR渲染引擎,如Unity 3D、Kanzi 3D、Android生态。技术上,SR涉及感知与地图融合,采用BEV Multi - Modal融合等技术;感知建图技术可在无高精地图场景实时建图;渲染技术从‘能看’到‘好看’,包括模型建设、光影效果等;还通过感知增强让用户‘安心’,如标记障碍车、展示探测波等。未来,SR将实现更优的‘数字孪生驾驶舱’。
#3骑行不“盲等”!百度地图牵手小牛电动,行业首家上线免导航路口红绿灯倒计时
百度地图与小牛电动合作,将红绿灯倒计时数据通过API接口开放给小牛。小牛电动车仪表盘可显示红绿灯倒计时,误差在毫秒级,全国近3000个区县主要路口支持。除显示倒计时,还能主动安全提醒。目前该功能已在小牛电动NX马拉松电摩上线,部分存量高端车型将通过OTA升级使用。此合作解决了两轮骑行者路口感知问题,未来希望搭载更多硬件载体,服务更多出行场景。
浮之静
更新 2 篇#1AI 时代下的“认知投降”
本文围绕AI时代下的“认知投降”展开。AI编程工具改变了工程师形成判断的顺序,让答案来得太早,使人易将判断权让渡,把AI输出当成自己的判断。研究表明,AI正确时人类表现提升,错误时也会下降,且人会借走其自信。软件工程易中招,因代码伪装性强、组织重产出、代码可复合,会产生理解债。为避免认知投降,AI应晚半步进场,人们要把判断工程化,如写预期、验证、缩小理解单元、先解释后生成、保留无AI编程时间。文章强调要分清与AI的关系,守住自己的思考。
#2第一个 Agent 从 Pi 开始
文章以Pi项目为例,介绍学习Agent开发的方法。Pi是极小终端编码工具,将Agent底层工程清晰展现。Harness补齐模型进入真实任务所需工程,Pi将其拆分为多部分。分层处理硬问题,写Agent要先稳loop,工具是合约,Context按轮装配,Session记录行动,Compaction保证连续性,权限依运行环境设计,完成判断靠证据。读完Pi可拓展阅读OpenClaw,还给出搭建Agent的步骤。二者留下的工程模式有借鉴价值,harness部分会被模型内化,但运行时秩序更重要。
AI 深度研究员
更新 2 篇#1AI 时代,最值钱的公司,反而人最少
2026年5月6日Anthropic开发者大会上,首席执行官Dario Amodei称公司收入和使用量年化增长80倍。大会宣布与SpaceX达成算力合作,放开Claude Code与API使用限制。多智能体将成重要方向,AI从个人工具变为组织能力,提升研发效率。AI改写SaaS行业逻辑,冲击企业传统增长方式。企业用旧组织方式管理AI会出现堵点,未来谁能用更少人调动更大智能,谁就有护城河。多数企业还没为AI带来的变化做好准备。
#2黄仁勋说,别把 AI 讲成一场恐慌
2026年5月5日,英伟达CEO黄仁勋与CNBC主持人对话,探讨AI重构产业逻辑。他指出AI已从“会生成内容”进化到“会做事”,计算范式从检索转向生成,算力需求暴涨1000倍,瓶颈从芯片转向电力。智能体AI能理解、推理、计划、调用工具完成任务,编程不再是程序员专属。AI产业栈是“五层蛋糕”,下一轮竞争在工厂。AI公司盈利使算力需求爆发,AI替代工作任务而非工作本身。黄仁勋认为真正风险是人不用AI,要扩大野心拥抱AI。
前端充电宝
更新 2 篇#13小时不写一行代码,我做出一款AI互动游戏(附保姆级教程)
文章围绕AI互动游戏展开,以《金瓶梅·西门庆穿越篇》爆火引出Yoroll平台。介绍Yoroll是AI原生互动影游平台,能将生成视频与做成互动游戏结合,和传统游戏开发不同,降低了创作门槛。作者试玩后,感觉像进入可自主选择走向的互动影像。作者还以修仙小说梗概为例,展示用Yoroll从生成角色、界面、分镜,到生成视频并合成游戏的过程,最后强调AI视频正从生成内容变为生成可玩体验,普通人也能创作爆款游戏,还给出Yoroll内测申请方式。
#22026年,前端离职潮彻底消失了。。。
文章围绕前端开发者在AI浪潮下的发展展开。当下技术圈“AI焦虑”弥漫,很多人疑惑前端是否要掌握AI大模型能力。实际上,掌握大模型能力的前端人更吃香,就业竞争力和薪资都会提升。文章推荐了“转型AI前端开发—就业实战营”,2天直播课涵盖技术原理、企业级实战项目复现和职业规划。课程会解析大模型底层原理、技术架构及应用场景,如RAG、Fine - tuning等技术;拆解热门案例,助学员掌握大模型应用开发核心步骤;由行业大佬授课,分享商业化项目,剖析大厂招聘行情,提供内推机会。课程名额100人,24小时后关闭通道,完课还赠送求职大礼包。
知危
更新 2 篇#1把露营装备变成“万能工具”,浙江商人在拼多多的生意经
本文讲述浙江商人在拼多多经营露营装备的生意经。2020年后露营经济兴起,出色鸟、探险者等品牌从外贸代工转型做自主品牌。转型虽面临链路复杂、技术从无到有的难题,但也积累了效率和专利优势。它们发现户外用品日常化趋势,出色鸟针对宝妈、宠物、钓鱼者等群体创新产品;探险者根据国内休闲玩家需求,解决搭建和成本问题。拼多多订单平稳,能反向提供需求参考,助力品牌增长。品牌聚焦核心品类,从人的需求出发,跨界参考、精准洞察,满足不同市场需求。
#2瑞幸开卖瓶装咖啡,把跟星巴克的战火打进超市了?
4月底瑞幸首批瓶装咖啡上线,定价6 - 7元,将投放在便利店、超市等。这使瑞幸与星巴克、COSTA等的竞争延伸到超市货架。现制品牌做瓶装,主要是为降低成本和寻找第二增长点。喜茶、星巴克瓶装业务较成功,但瑞幸此时切入已面临高度集中市场,消费者心智成熟。且瑞幸门店密度高,瓶装性价比一般、渠道难有不可替代性,还面临供应链与渠道挑战。
MacTalk
更新 2 篇#1读完这份报告,才知道 Token 经济已经发展到这个地步了
本文结合 IDC 报告,介绍国内 Token 经济发展情况。2025 年中国公有云大模型调用量达 1944 万亿 Tokens,同比增 16 倍,火山引擎份额 49.5% 居首。Token 是大模型处理任务的基本计量单位,MaaS 进入规模化应用,企业按调用量计费。Token 调用增长源于多模态大模型成熟和 Agent 类应用落地,个人多在 Agent 和多模态创作消耗,企业场景丰富。火山引擎服务多行业,飞轮效应使其领先。IDC 预测 2026 年企业级 Token 消耗增约 20 倍,市场达 186 亿元,届时成本等将成选型指标。
#2推荐一款免费屏幕录制软件 Recordly,特别好用 😄 Coding Agent 技术让我们可以快速构建自己想要的软件产品,但是,如果你想让你的产品被更多人使用,甚至为你获取收入,这依然是一件高难度的事情。你需要识别需求,能够驱动 AI 做事,懂得一点商业知识,还需要把你的产品推广出去。 怎么推广呢,做个演示视频是绕不过去的一环。 做 Coding Agent 演示、产品使用视频和教程的时候,最常见的做法就是录频,然后录音,音视频合在一起形成一个完整的演示 demo。不过呢,原始屏幕录制是很业余的,光标抖动,点击的时候没有强调,背景杂乱,缩放产品局部需要在后期添加,等等。 以前我们会使用类似 剪映、Screen Studio 这样的付费产品,挺好,就是得交钱呗。最近我发现了一个新产品叫做:Recordly。 这是一款免费开源的屏幕录制和编辑工具,可以制作精美的 demo、用户引导和产品展示视频。这款产品发布在 Github 之后, 8 周内获得 1.3 万左右的 star,它采用的是 AGPL-3.0 协议,用户在使用上没有任何限制,约束是:如果你修改源代码后再次发布,也需要开源。 Mac、Windows 和 Linux 都能用。 Recordly 有这些功能: 自动追踪光标活动进行缩放,无需手动标记缩放区域 平滑光标移动,添加点击弹跳、动态模糊和晃动效果 将录制内容放入带墙纸、渐变、留白、模糊和阴影的精美框架中 摄像头气泡叠加,支持自定义位置、镜像、圆角和缩放自适应缩放 拖拽式时间线,支持裁剪、变速区域、注释、音频区域和裁剪编辑 MP4 和 GIF 导出,支持画质预设、帧率控制和宽高比选项 macOS 原生录制(ScreenCaptureKit)和 Windows 原生录制(Windows Graphics Capture + WASAPI) 项目保存为 .recordly 文件,可随时重新打开和编辑 扩展市场,提供光标点击音效、设备框架、浏览器模拟、墙纸等 可自定义键盘快捷键和内置快捷键参考 免费。永久。无限录制。无限导出。无水印。 我看了贡献者,这款产品应该 Coding Agent 也有贡献。 这个项目是 2026 年 3 月 12 日创建的,README 支持英语和简体中文,非常友好。 下载一份 Recordly 到你的机器,在本机运行,在本机录制、编辑和导出,然后,你就有一份精美的产品推广素材啦。 地址:https://github.com/webadderallorg/Recordly
文章指出推广产品需制作演示视频,原始录屏业余,以往付费产品需交钱。介绍免费开源的屏幕录制和编辑工具 Recordly,它发布在 Github 8 周获 1.3 万左右 star,采用 AGPL - 3.0 协议。支持多系统,功能丰富,如自动追踪光标缩放、平滑光标移动等,免费无水印,项目 2026 年 3 月 12 日创建,README 支持中英双语。
得物技术
更新 2 篇#1《技术达人养成记|青铜1年:新手村升级攻略!》
文章采访了得物技术部两位司龄1岁+的校招生,分享成长经历。新人初入职场,在TL和师兄帮助下,通过定向学习、参与项目快速成长。跨团队合作中,新人在同事帮助下可主导项目,遇到问题团队会一起分析解决。如乔伊推动DeepSeek R1模型落地,泽锐推进AI生成功能用例项目。此外,新人还通过自学、实践提升技能,如乔伊开发推理框架版本,泽锐探索AI自动化测试方案。最后,他们给新入职者建议,得物也为新人搭建了成长加速器。
#2基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践|得物技术
文章分享得物基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践。先提出 Harness 思维,让 AI 参照已有实现生成代码,避免凭空创造带来的问题。接着介绍全栈工作区搭建与 Codebase Indexing,对比 Cursor 和 Claude Code。阐述 SDD 驱动的全栈代码生成流程,包括提示词范式、前后端需求分工等。说明多 Agent 协作实现前后端并行开发,以及前后端联调的三阶段验证策略和 Mock 数据要点。还提醒警惕 SDD 陷阱,给出测试介入建议。最后总结实践效益,如采纳率提升、耗时降低等。
大淘宝技术
更新 2 篇#1天猫新品团队AI编码实战指南(下)
本文是天猫新品团队AI编码实战指南下篇。团队为顺应AI潮流进行全栈化转型,探索AI生码并沉淀经验。指南介绍了小二端和C端两个方向的实践。小二端以AI主导对话生码,初期提供辅助手段统一生成方案,中期补齐前端经验短板,后期构建轻量级团队知识库,还提出未来需解决精细化微调及开放式场景统一问题。C端全栈开发模式下,通过设计代码结构、沉淀工作流、建设知识库等提高AI参与度和开发效率,未来将完善知识库、优化代码架构。此外,文章还介绍了AI在UI重构、复杂prompt构建等方面的功能,以及多方案选优、文档生成等辅助编程方式,还提及用严厉语气和合理质疑提升AI准确度。
#2天猫新品营销技术团队AI编码实战指南(上)
本文是天猫新品营销技术团队AI编码实战指南上篇,先分析AI生码痛点及解法,如项目隐含信息多可提供辅助文档和知识库;用户输入不精准可增加输入内容、提供prompt模版等。提出“最大化复用、自然语言第一、二八定律”核心思想,按“前置准备→开发前→开发中→完成后”流程给出优化手段,如前置准备确定代码规范、设计目录结构等。将需求分为“需求驱动型”和“工程主导型”,通过小二端列表页和C端复杂业务案例展示不同场景实践,强调清晰prd和优质代码对功能预期和迭代效率的重要性。
腾讯云开发者
更新 2 篇#1AI Infra 其实没有多少新东西
本文分享传统后台工程师技术栈和方法论如何迁移到AI系统,拆解AI Infra挑战。硬件上,从CPU到GPU为核心,“AI大型机”集中式架构短期内难改变,长期或“去NVIDIA化”。软件方面,PyTorch是深度学习框架事实标准,推荐用Triton开发GPU内核,Python成AI Infra编程首选。模型训练面临存和算的挑战,可通过模型并行和通信计算重叠解决。模型推理要降延时、提吞吐,采用CUDA Graph、KV Cache、流式响应、传统批处理和连续批处理等方法。AI Infra工程挑战在传统Infra有对应场景和思路。
#2程序员越早想通这些越好
文章围绕程序员需具备的核心认知展开,涵盖技术债务、需求分析、代码质量等38条建议。强调谨慎对待技术债务,避免久拖;分析需求背后意义,提出更优方案;追求代码简单美,控制复杂度;不过度实现,时刻删减代码。同时指出要正视故障,不忽略错误,追踪问题根源;还涉及代码审查、命名、注释等方面,提醒早部署、常部署,重构需慎重。此外,倡导学习新语言、了解设计模式和Unix哲学,具备靠谱信用等软素质,持续学习并了解自身局限。
腾讯技术工程
更新 2 篇#1鹅厂员工觉得好的code模型应该具备什么能力?
文章围绕好的代码模型应具备的能力展开,邀请9名鹅厂员工分享看法。dan认为高级能力是“懂得不写代码”的智慧;he提出让agent先学习再写代码可提升质量;scar从理解需求、代码风格、调试能力和开发环境方面提出要求;bun希望模型能看懂代码、修bug、优化代码且不胡编;fe指出AI在调试和处理复杂业务逻辑有问题;gam列举了上下文、准确率等多方面能力;fie强调不懂不要瞎说;jeff期望更好的架构和纠错能力;ell认为模型应具备架构感知、上下文一致和主动提醒能力。
#2十年老技术开发的 AI Agent 探索之路
这篇文章是一位十年老技术开发分享的AI Agent探索之路。作者先指出人工并发操作多个AI终端有吞吐有限、状态不稳定、难以规模化等问题,人是瓶颈,应让系统不再依赖人的实时在场。接着介绍80%的AI需求用10行Bash脚本就能解决,提出代码优先于Prompt的原则。在Vibe Coding翻车后,作者构建了24h无人值守的“24h打工人”系统,采用文件+轮询架构、SDD模式,实现智能并发和工具失败自动切换。该系统还能自我修复bug,关键在于建立设计文档、SDD流程和架构约束文件。从demo到系统,关键是治理,包括可观测性、持续评估、控制平面等。当前Agent开发正从“框架之争”转向“协议+runtime+control plane之争”。最后,作者对比了Task-Driven和Goal-Driven模式,指出Goal-Driven可解决迭代问题,落地需满足多个前提和遵循特定步骤,强调增强自我而非取代自我。
微软亚洲研究院
更新 2 篇#1不改架构、无需3D数据,强化学习如何让视频模型真正“理解”3D世界?
当前视频基础模型能生成精美短片,但未真正理解三维世界。微软亚洲研究院推出 World - R1 框架,通过强化学习将视频生成与 3D 几何约束对齐。它无需改动模型结构、不依赖 3D 数据集、不增加推理开销,能提升视频几何一致性。其核心是用强化学习唤醒模型已有空间知识,还采用隐式相机控制、复合奖励机制、周期性解耦训练等策略。实验表明,World - R1 在 3D 重建评估和 VBench 基准上表现出色,各组件共同作用实现空间一致性和生成效果同步提升。未来,更高效的视频 RL 微调范式是关键方向。
#2微软亚洲研究院发起全球人工智能价值观挑战赛,共建AI的伦理基石
微软亚洲研究院发起“全球人工智能价值观挑战赛”,这是全球首次针对AI价值观对齐的跨学科开放协作计划。赛事邀请全球学者提出最具难度的价值观困境问题,构建价值导向问答数据集。面向全球学术界和研究者开放,2026年5月至8月参赛。参与者提交原创问题、答案及论证,通过评审可获奖励。该研究院在Societal AI研究有成果,为比赛提供基础。希望借此汇聚跨学科力量,塑造值得信赖的AI未来。
京东技术
更新 2 篇#1高可用架构的工程智慧
文章围绕电商系统高可用架构,先介绍其范式及分层架构,指出存储层是核心。分析电商数据,分流水和状态两类。流水数据通过统一单据号规则和路由数据库实现无感知扩容容灾;状态数据依业务场景采用不同策略。单个存储节点用多副本保障高可用。多机房场景下,将新增流水路由至新库规避同步延迟。最后列举京东多个业务系统架构升级案例,如外卖配送、电商核心链路、支付系统,展示高扩展性和高可用性架构建设成果。
#2京东2026年TGT顶尖青年技术天才计划全球启动!
京东在2026年启动TGT顶尖青年技术天才计划,不过文章未提及计划具体内容。此外还推荐了与AI、数据库、架构升级等相关的技术文章。
AI大模型应用实践
更新 1 篇#1中学生就能看懂:从零开始理解LLM内部原理【十四,大结局】|理解 Transformer 架构
本文是《中学生就能看懂:从零开始理解LLM内部原理》系列的第十四篇,也是大结局。文章介绍了Transformer架构,指出其由Encoder和Decoder组成,与GPT的Decoder - only架构不同。以机器翻译为例,说明完整Transformer分工明确,Encoder读懂原文,Decoder生成译文,可避免GPT的上下文挤占和任务混杂问题。详细阐述了Encoder和Decoder的工作流程及训练过程。还解释了虽然完整Transformer分工清晰,但GPT因架构简单、适合规模化训练成为主流大语言模型架构。最后总结系列核心内容,帮助读者建立LLM内部结构地图。
W3C资讯
更新 1 篇#1W3C设立深圳代表处,持续深化对开放Web标准的承诺
4月18日,在庆祝W3C进入中国二十周年前夕,W3C深圳代表处揭牌。该代表处设立获W3C董事会批准,是其与中国Web社区合作重要里程碑。W3C此前以四家总部机构协议形式运营,2023年转型为非营利组织,2025年满足在华设代表处法律要求。W3C与深圳合作已久,代表处将与北京航空航天大学的中国总部共同维护全球Web技术标准平台,职能包括确保合规、提供支持、加强合作等。未来,W3C计划推动Web技术创新和全球社区协作,代表处设立开启与中国Web社区合作新篇章。
淘宝设计
更新 1 篇#1AI试穿设计:你的手机,就是最懂你的试衣镜
文章介绍淘宝「AI试穿」技术,它解决了线上购物无法试穿的痛点。该技术以真实为基石,让用户上传照片,贴合实际身材试穿。体验规则上,点击即试、边逛边试,减少用户等待焦虑。产品围绕「AI试穿」「发现」「我的」三个页面,形成“试 - 逛 - 管”路径。试穿链路按“峰终”体验设计,将高认知负荷操作前置。其意义在于构建新型消费关系,让用户安全探索搭配。最后提到新人设计师要提升设计视角,融入AI技术。
京东零售技术
更新 1 篇#1AI助力跨境增长:京点点Oxygen Vision 跨境套图AI生成技术实践与展望
跨境电商竞争激烈,传统视觉生产模式难以满足需求。京东零售京点点Oxygen Vision推出跨境电商商品套图智能生成功能,解决了成本高、效率低、适配难、合规缺失等问题。该功能以AI技术实现全流程自动化、智能化、本地化,具有极简操作、多平台适配、多语言本地化等优势。其突破得益于技术、数据、业务层面的深度融合。未来,京点点将深化多模态融合,提升个性化与智能化,拓展场景与平台适配,构建视觉优化体系,推动技术普惠与生态融合。
职场Bonus
更新 1 篇#1五月,适合想清楚一件事|新账号幕启
本文围绕青年选择与成长展开。先阐述“有Sense”内涵,包括信息、社交和方向感知,指出职业生涯如三幕剧,入局、纷争、和解阶段的选择很关键。以《猜火车》为例,说明要直面选择、担结果。接着介绍《职场Bonus》的人物栏目和内容迁移至《有三思》,不鼓吹“正确路线”。最后,多位创业者分享职业选择经历,如离开稳定工作创业等,强调跟随内心、坚持学习。
AndroidPub
更新 1 篇#1AI Coding 知识库最佳实践:三层结构重建可维护工程
文章指出团队引入AI工具后,配置文件易混乱,导致系统失去可维护性。为此提出用三层结构重构AI协作配置:基础层定义全局规则,如AGENT.md和rules.md,保持稳定;流程层承载特定场景流程,以Skill实现,注重复用;任务层处理独立任务,随用户输入动态生成,保持无状态。还给出内容分层判断方法、常见反模式,阐述分层收益及落地步骤,强调分层是AI协作从可用到可维护的关键。
大转转FE
更新 1 篇#1WebNN:让 AI 推理在浏览器中“零距离”运行
文章介绍WebNN,它是为Web设计的神经网络推理加速抽象层,能让Web应用调用设备底层硬件运行机器学习计算。WebNN将底层硬件高性能与Web特性结合,带来降低延迟、保护隐私、提升可用性与降低成本等变革。文中给出启用WebNN的要求和设置,介绍其API及完整工作流,以人脸识别为例解析实战应用,还列举丰富应用场景。其架构分网页应用层、网页浏览器层、原生机器学习API层和硬件层。WebNN虽有诸多优势,目前仍处早期,开发者应关注学习,结合现有成熟方案开发。
算法进阶
更新 1 篇#1最强速成教程!《大模型提示工程书》.pdf
2026年初以来,大模型领域在科研、开源、落地方面取得突破,正从学术探索迈向产业赋能。为助力抓住机遇,有人整理了《LLM书》等资料免费送,讲解快速工程,涵盖底层基础与实操技巧。还联合顶刊审稿人打造七天入门LLM大模型系列课,整理写作提示词资料。此外,提供QS前50名大佬的大模型idea。沃恩智慧为学员提供科研辅导,导师实力强,与学员签协议保障服务,有众多学员中稿案例。
爱奇艺技术产品团队
更新 1 篇#1内存峰值降60%+,动图加载快75%:爱奇艺图片库一次从'能用'到'极致'的跨越
随着HarmonyOS NEXT发布,爱奇艺积极布局鸿蒙生态。其技术团队面临ArkTS性能瓶颈、AVIF格式支持缺失、图片库密集型任务挑战。经调研选择仓颉语言开发图片库,采用分层架构和仓颉/ArkTS混合架构,图片处理用三级缓存策略。动图解码有专项优化,性能上做了互操作回调、内存复制等优化,内存峰值降60%+。测试显示加载耗时显著降低,网络动图优化达75%,用户体验提升。未来规划功能补齐、跨平台拓展、生态共建。
AlibabaDesign
更新 1 篇#1阿里设计Showreel高能上线!AI时代的「设计新生」实录
文章介绍阿里设计Showreel上线,在即将到来的D20 2026,阿里各业务设计团队将呈现「设计新生」实录。如阿里云智能设计部让AI成共创伙伴,重塑设计边界;阿里巴巴企业智能设计团队为多元业务提供设计支持;淘宝闪购设计以「温暖」升级体验等。各团队在AI助力下,在设计领域有诸多创新成果,7月10 - 11日的D20 2026将开启人类设计师创造力的「设计新生」。
转转QA
更新 1 篇#1UI 自动化演进:从 Selenium / Appium 到 Skill + Playwright 自然语言驱动
文章介绍了UI自动化从Selenium/Appium到Skill + Playwright的演进。Selenium/Appium时代,UI自动化面临定位脆弱、等待同步困难等问题。当下,Skill驱动结合自然语言与Playwright,Skill沉淀测试信息,Playwright负责执行。实战案例显示其能高效解决传统方法难以处理的问题。应用场景广泛,可形成开发流程闭环,综合提效显著。后续将评估引入AI识别与执行方案,实现元素自动定位和全场景覆盖。与传统方式相比,Skill + Playwright能沉淀经验,解决同类问题更高效。
腾讯云TVP
更新 1 篇#1从前沿洞见到落地实践:腾讯云TVP布道澳门,燃动AI Agent新思潮
4月25日,腾讯云TVP协办的「從對話到執行:OpenClaw開啟的AI Agent時代」主题澳门新媒体大讲堂在澳门科技大学举行。中基宁波集团CTO王海涛作主题演讲,指出AI发展处于红利期,交互模式从被动问答升级为主动执行,OpenClaw架构开启新时代。他还展示WorkBuddy重塑工作流实践,结合中基宁波集团业务分享大宗投研与IT运维实战案例。此外,剖析了AI Agent安全风控与企业组织变革问题,并为个人发展提建议。此次活动是腾讯云TVP在大湾区深耕技术生态的一步,未来欢迎更多港澳科技先锋加入。
Unity官方平台
更新 1 篇#1Unity中国资源商店推荐系列 | NatureManufacture 10款美术资源盘点
文章介绍了个人开发者NatureManufacture在Unity国际资源商店的十款美术资源。这些资源平均评价4.7星,点赞收藏数平均1897。包括获2019年Unity Awards最佳艺术内容奖的Forest Environment - Dynamic Nature,有丰富森林草地资源;入围2025年Unity Awards的Coast & Dunes Environment - Dynamic Nature,含海岸等干燥环境模型库。还有如Meadow Environment、Mountain Environment等资源,涵盖草地、山地、冬日地面、冰面、城堡地牢等多种类型,追求真实与效率,助开发者三维创作。
海外独角兽
更新 1 篇#1The Era of Agent:拾象 AGI 投资洞察
文章是2026年AGI投资洞察,指出进入Agent时代,Coding Agent成增速最快新物种,AI Labs重注Coding。Anthropic靠Opus 4.5和Coding Agent领先,OpenAI和Google曾战略误判。硅谷LLM格局中,第一梯队是Anthropic、OpenAI、Google,xAI掉队,Meta冲击Tier 1,Neo Labs难进第一梯队。模型竞争关键在组织和战略文化,如Anthropic聚焦Coding,OpenAI有C端优势但战略失误,Google资源多但决策慢。市场应按To Human/To Agent划分,Agent成新消费者和生产者,其设计哲学转变,Anthropic向Agent云公司进化。机器人领域2026年是数据Scaling大年,技术从VLA转向World Model Policy,Neo Labs分追寻范式和专注高价值领域两类。
OpenBMB开源社区
更新 1 篇#1给LLM装上“分子认知模块”:SciCore-Mol破解科学数据的异构难题
文章围绕SciCore - Mol展开,它为解决LLM处理科学异构数据难题提出新思路。LLM处理分子结构等复杂数据时存在计算浪费与认知错位问题,以往线性化分子结构适配LLM的方式会导致信息损失和语义噪声。SciCore - Mol以LLM为主体,外挂三个可插拔认知模块,在隐向量层融合信号。其采用三阶段渐进训练策略,具有异质数据解耦、可灵活编排等创新点。实验表明,它在多种任务上性能优秀,泛化能力突出,解决了微调崩溃难题,为学科大模型提供了新路径,有望推广到其他领域。
前端圈
更新 1 篇#1Rolldown 1.0 正式发布:Vite 底层终于迎来高性能时代
Rolldown 1.0 正式发布,它是基于 Rust 的高性能 JS 打包工具,也是 Vite 最新主版本核心引擎。其 API 已锁定,输出产物行为持续优化。它解决了 Vite 过去‘双打包器’架构问题,历经两年从 2024 年 4 月首次公开到 2026 年 5 月稳定版发布。Rolldown 速度快、插件兼容性好、有高级特性,已被部分公司用于生产环境。介绍了独立和在 Vite 中使用方法,从 RC 到 1.0 修复问题并带来新特性。未来规划有 Vite 全量打包模式、稳定懒加载 Barrel 优化等,它由约 200 位贡献者完成,开源邀开发者参与。
MiniMax 稀宇科技
更新 1 篇#1大模型不认识马嘉祺?我们做了一次全链路排查
MiniMax M2系列模型出现“无法说出马嘉祺”问题,引发关注。团队从多维度排查,发现“嘉祺”虽为独立token,但后训练数据中出现频次极低致模型遗忘。对全词表扫描,约4.9%的token显著退化,分四类,日语token退化严重。这些退化或致小语种语言混杂和token遗忘。修复思路是确保后训练阶段每个token被练习,有构造合成数据、混入预训练数据、定向合成、词表裁剪+继续预训练等策略,还强调后训练数据覆盖要兼顾业务和token层面。
Android 开发者
更新 1 篇#1这次,Android 大有不同
文章宣传北京时间5月13日凌晨1点的The Android Show | I/O特辑,称将见证Android极具里程碑意义的一年,还给出预约提醒网址http://Android.com/io - 2026,让用户第一时间掌握先机。
阿里巴巴
更新 1 篇#1又见面了,阿里日🧡
今年是第二十二届阿里日,于5月9日、10日在多地园区举办亲友开放日活动。活动亮点颇多,千问AI数字人形象“千问小酒窝”担任游园搭子,在千问App内为亲友答疑;园区开设“千问办事·一句话花店”,方便为母亲买花。阿里云、千问等多个大模型携先进AI工具和产品亮相,淘宝“AI试穿”、闲鱼等平台也设置特色AI展台。此外,亲友还能在阿里云谷园区体验四款新AI产品,现场还有和AI下五子棋、赛博电子吉他等趣味活动。阿里日始于2005年,旨在纪念阿里精神并感恩亲友。
甲子光年
更新 1 篇#1别着急宣布VLA已死|甲子光年
本文探讨了VLA模型在具身智能行业的发展现状与挑战。过去两年,VLA是机器人“大脑”主流,让机器人有任务理解能力,但今年质疑增多,因其难以理解物理世界,存在泛化性不足、与机器人本体强绑定等问题。“VLA已死”被误读,实际是传统范式受挑战,能力未失效。世界模型受关注,与VLA功能不同,有数据生成、仿真训练等用途,但也存在定义争议和幻觉风险。机器人系统应走向分层架构,结合任务理解、状态预测、运动控制和数据闭环四层能力,VLA和世界模型需进化与落地。