公众号 AI Feed 流公众号 Feed
278 篇硅星人Pro
更新 14 篇#1重生之我是崇祯,但满朝文武皆 AI |对话 AI 原生游戏《历史模拟器:崇祯》制作人追青
文章围绕AI原生游戏《历史模拟器:崇祯》展开。该游戏5月8日在Steam发售,玩家以自然语言下诏书,AI根据条件推演并改变世界状态。游戏玩法是玩家扮演崇祯,经看国势、接任务、问大臣、写诏书、AI推演等环节,世界数据随之变化。与制作人追青对话得知,团队不到10人专注AI原生游戏,认为策略游戏玩家是核心群体。追青定义AI原生游戏为剥离AI模块玩法体验有差异的游戏。此项目从立项到上线约6个月,自研系统解决长记忆和状态变量问题。游戏记忆靠步进式逻辑和传统记忆处理,选择模型看重时间、成本和效果。目前采用买断加积分模式,未盈利,后续计划开放API。玩家行为数据未直接反哺系统,游戏次日留存75.1%,非工作日平均在线约7小时,有玩家70小时造出原子弹。
#2Alex Wang 长访:Muse Spark 只是开胃菜,Meta 几个月后还有更大模型
本文是对Meta AI负责人Alex Wang的专访。他讲述从Scale AI创始人到Meta AI负责人的转变原因,称Meta有算力和战略优势。介绍Meta超级智能实验室架构,提到团队构建原则,如重视超级智能、聚焦基础等。谈到Muse Spark是规模化早期数据点,后续将有更大模型。收购机器人AI公司,因物理智能也需规模化。还谈及AI竞争格局,认为远未到终局;开源问题,Muse Spark当前闭源,正开发开源版。此外,回应与Sam Altman恩怨,探讨与中国合作、模型福祉、脑机接口等话题,强调构建个人超级智能世界。
#3微信的Agent近期不会上线了——关于腾讯财报电话会的10条观察与思考
5月13日腾讯发布2026年Q1财报并召开电话会。微信Agent短期大概率不上线,或因需打磨设计且混元模型未就绪,混元3下一代版本今年晚些时候会更好。腾讯认为AI Agent对电商公司影响大,自身受影响小。广告业务增长快,视频号广告加载率有提升空间,但AI投入使广告毛利率下降。腾讯一季度AI新产品净亏损近88亿,市场推广开支大增。视频号电商进展未达庆功阶段,WorkBuddy成中国使用最广泛生产力AI Agent服务。腾讯对AI商业化路径认知转变,将转向高价值用例。此外,微信、QQ用户数据有变化,腾讯云海外增长40%,AI小程序超27000个,且明确不裁员。
#4对 DeepSeek 说一句 <think>,它就开始疯言疯语,到底是不是泄露用户数据啊?
文章围绕在DeepSeek输入特殊字符出现异常输出的现象展开。用户输入特定字符,模型会吐出不相干内容,且每次刷新结果不同。这并非训练数据泄漏或AI意识觉醒,而是对话模板被破坏所致。用户输入的特殊token被重新识别,使模型回到训练样本起始节点。自回归语言模型不能拒绝输出,只能从训练集样本混合分布中采样。R1比V3输出更怪,因其更注重思考token且训练分布有大量长CoT样本。此外,这种现象可能引发安全攻击,防御需后端tokenizer对用户输入做特殊处理。
#5一键生成棒球现场特效火爆全球,可灵AI登顶42国App Store总榜
2026年5月,由AI驱动的全民创作风暴来袭,可灵AI的“棒球现场特效”视频火爆全球,带动可灵AI登顶42国App Store总榜。该特效将制作流程简化为上传照片、点击“一键同款”两步,降低了AI视频创作难度,激发全球用户创作热情。其在人物一致性、画面真实感及微表情上表现出色,让视频效果几可乱真。用户创作风格多元,场景不断拓展,形成热门社交表达方式。这股热潮推动可灵AI排名飙升,用户规模与商业化数据高速增长,标志其成为现象级消费级AI产品,也让中国AI产品在全球市场建立新认知。
#6林俊旸:20亿,田渊栋等:46.5亿
5月13日中美两地AI Lab创业热闹,有两条大额融资新闻。国内前阿里通义千问技术负责人林俊旸新成立AI实验室,以约20亿美元估值开启首轮融资,洽谈投资方有高榕创投和红杉中国。他履历出色,曾主导Qwen系列研发与开源。目前团队已招募多名成员,研究方向或聚焦让模型为行动而思考。硅谷这边,前Meta FAIR研究科学家总监田渊栋官宣新公司Recursive Superintelligence,公开亮相时已有6.5亿美元累计融资、46.5亿美元估值。其创始团队阵容强大,公司定位做递归自我改进的AI系统。这体现百模大战后顶尖AI研究员创办新独立AI Lab的趋势,资本也在赌基础范式突破。
#7视频模型:最容易制造惊艳,也最容易消耗惊艳
4月以来,视频模型成AI热门赛道。阿里HappyHorse - 1.0登顶榜单,fal.AI上线其API,创业公司生数科技和爱诗科技获融资并考虑赴港上市。国产视频模型头部由快手可灵、字节Seedance、阿里HappyHorse组成。可灵商业化领先,2026年1月年化收入超3亿美元;Seedance 2.0靠出圈视频提升声量,但面临版权问题;HappyHorse技术有冲击力,但阿里缺内容社区。二线梯队中,生数科技和爱诗科技拟上市,MiniMax的海螺受版权困扰,昆仑万维的SkyReels V4冲进榜单。OpenAI关停Sora,凸显视频模型商业化困境,包括成本高、版权问题,行业需解决ROI问题。
#8从DAA到自我进化:百度在给Agent建一个新世界
本文围绕百度在Agent时代的探索展开。2026年Agent成为新物种,衡量其价值面临新问题,百度在Create2026大会提出用DAA衡量。当前Agent运行的旧基建不适用,存在诸多问题,百度为此推出“芯云模体”新全栈AI云,各层针对不同问题优化。基于此基建,百度发布DuMate、秒哒3.0、伐谋2.0、一镜海外版四款智能体产品,展现良好效果。李彦宏提出“自我进化”,包括智能体、个体和组织三个维度,探讨产业与社会新结构,强调进化主动权在个体与组织手中。
#9对话OpenClaw核心团队:中国的大公司把业务直接跑在OpenClaw上,这并不常见
5月11日,在ClawCon活动上,作者对OpenClaw核心维护者Josh和核心代码贡献者Vincent Koc进行独家对话。Josh早期参与项目,关注中国用户;Vincent是全球代码贡献量第二的开发者,主导技术方向。对话围绕用户困扰问题展开,如CLI交互方式、安全、Token账单、应用与模型边界等。Vincent表示安全由社区和维护者共担,工程上会推进降低Token消耗。他们认为OpenClaw应支持多模型,下一代Agent是自我迭代。还提到中美使用差异,中国大公司多将业务跑在OpenClaw上。未来计划改进流程、提供长期支持版本、寻找中心化交流位置,OpenClaw Foundation正在招人并建立连接。
#10暴跌漩涡中,软件选择主动被大模型“吞噬”
文章围绕软件被大模型“吞噬”展开。2026年软件股因AI Agent发展下跌,市场认为AI可替代SaaS工具,但摩根士丹利认为是过度反应。软件转型常用Skill和Plugin封装,前者是本地创作介质,后者是流通商品。微软、Salesforce等激进转型,让自身成Agent工作流底座;Notion等被动接入;Docusign将签约流程封装成Skill。国内多停留在MCP层。有商业价值的Skill需承载特定知识、含质量标准和失败处理逻辑、具备执行约束。未来软件生态中,有网络效应和专有数据的软件会更强,以界面为核心的SaaS要重构,行业垂直软件是Skill商业化机会。
#11最懂购物的AI,竟然会劝你别买了?
5月11日,阿里巴巴宣布千问与淘宝全面打通,重写购物入口、决策方式和交易流程。用户可在千问内完成购物全流程,也能在淘宝App体验“AI购物助手”。该助手表现专业,购买前能精准选品、场景推荐,把模糊需求拆成方案,还能识别潜在需求;下单过程中能找优惠方案;下单后可查询物流。此外,它还会基于用户历史订单给出个性化建议,且常劝用户别急买、别买贵、别买多,展现出为消费者着想的立场。
#12全球AI Lab前十!Agnes新模型发布,以全模态+超低价定义模型性价比
Agnes AI旗下Agnes-2.0-Flash与Agnes-Image-2.0-Flash进入国际权威榜单前列,获多个国际评测体系认可,进入“全球AI Lab排名第9”。其模型能力与Harness系统服务数千万用户,应用于多场景。Claw - Eval强调模型真实Agent场景综合执行能力,Agnes - 2.0 - Flash部分任务超越知名模型。Agnes - Image - 2.0 - Flash进入Artificial Analysis,其Image Editing Leaderboard采用盲评机制。且Agnes用轻量级高效率模型上榜。价格上,Agnes - 2.0 - Flash API定价低,Agnes - Image - 2.0 - Flash成本约为行业平均十分之一,以优化推理效率等路径形成差异化,推动开发者低成本使用AI模型,使行业竞争进入新阶段。
#13大厂让程序员卷 AI,4 个月烧掉全年预算,CTO 懵了
2025年12月Uber给工程师部署Claude Code,4个月花完2026年全年AI工具预算。95%工程师每月用AI编程工具,70%提交代码由AI生成,每位工程师月成本500 - 2000美元。传统IT预算假设工具使用量可预测,但AI工具使用无天花板,导致预算偏差。AI好用却成企业负债,综合成本或超雇初级工程师。很多公司都面临AI工具成本失控问题,三方激励错位,企业采取限制措施。最后提出谁为AI“好用”买单的问题。
#14对话小宿科技:搜索比推理便宜10倍,但90%的人不知道
文章围绕AI Agent的Token成本问题,与小宿科技CEO杜知恒展开对话。指出Token账单困住众多Agent开发者,应建立Token经济学。介绍智能搜索与传统搜索不同,优化目标是为Agent提供完整、可信内容,有多层次质量控制,通过客户反馈迭代。强调搜索与推理解耦,能查就别算,搜索嵌在任务链路中间层,输出形式依场景而定。开发者选模型应围绕场景配置能力,将搜索从模型解耦可降成本。建议团队先优化搜索和上下文组织,再优化模型选择。
Z Potentials
更新 13 篇#1深度|英伟达黄仁勋:大多数人会输给那些会使用AI的人,我们必须确保人们不害怕AI
2026年4月,在斯坦福大学商学院的对话中,英伟达黄仁勋与美国政界代表Ro Khanna探讨美国AI时代竞争战略。黄仁勋指出AI重构计算,产业分五层,应用层成功是关键,且AI不会导致大量失业,而是改变工作方式、创造更多工作。Ro Khanna认为美国保持优势靠全球人才、研究型大学、学术自由和技术转移项目,还倡导新经济爱国主义,通过AI重新工业化美国、创造就业。二人还谈及AI监管,应避免过度监管,要平衡先发优势与法规;强调AI应惠及大众,降低使用门槛,消除恐惧。最后鼓励斯坦福学生抓住AI机遇。
#2Z Product|Product Hunt最佳产品(5.4-10),Flare打造面向年轻人的AI语音社交应用
文章介绍了5.4 - 5.10期间Product Hunt最佳的10个产品。Kilo Code v7 for VS Code是AI编码助手,支持多agent并发等;RankSpot是全自动AI SEO代理,可自动完成关键词研究等;Velo 2.0将语音和屏幕录制转成视频与文档;Shadow 2.0是会议实时AI执行助理;Kanwas是团队与AI代理的开源共享大脑;FlowMarket让AI代理撮合B2B交易;Monid 2.0是AI代理工具路由层;Superset 2.0可远程并行调度编码代理;Flare是面向Gen Z的语音优先AI社交应用;Mindra是AI代理队伍指挥台,能自动组队执行任务。
#3Z Potentials|LiberAI刘松铭,在世界模型的百家争鸣时刻,他要定义最陡峭的Scaling曲线
本文是对LiberAI创始人刘松铭的访谈。刘松铭是00后,有竞赛金牌、清华特奖等标签,公司成立三月完成三轮数亿融资。他PhD阶段两次做出领先硅谷的技术判断,2026年4月发布全球首个高自由度灵巧操作具身基础模型。LiberAI要建立充分对齐物理模态的世界模型,秘籍是模态对齐、归纳偏置、软硬件协同。刘松铭分享创业缘由,因AI For Physics数据稀缺、图像视频领域GPT时刻太快,而具身数据有扩增潜力且契合自身禀赋。他介绍公司文化、招聘需求和未来愿景,还阐述世界模型定义、模型架构优势、物理数据采集范式等,平时喜欢冥想以沉淀信息、保持清醒。
#4速递|微软千亿美元押注OpenAI,已获300亿回报
微软执行官Michael Wetter周三在法庭作证,估计到财政年度六月结束时,微软在与OpenAI的商业协议上花费超1000亿美元,包括130亿美元投资及建设运行基础设施成本。在埃隆·马斯克对OpenAI和Microsoft的诉讼中该数字被提及,显示微软合作决心。2023 - 2025年微软资本支出超2340亿美元,2026财年第一季度支出320亿美元。目前微软已从OpenAI租用服务器及相关产品获至少300亿美元收入,OpenAI还承诺未来几年花2800亿美元租更多服务器。
#5速递|Anthropic发布12款法律AI工具,开源Claude for Legal
Anthropic由前OpenAI员工2021年创立,已成为AI领域领导者。该公司发布12款法律AI工具并开源Claude for Legal。目前正与投资者就至少300亿美元新一轮融资进行早期谈判,预计最早本月底完成,估值超9000亿美元。此前Google承诺以3500亿美元估值投资100亿,达绩效目标再投300亿;Amazon以同样估值投资50亿,后续再注资200亿。此外,Anthropic最快10月考虑首次公开募股,以支付计算基础设施费用。OpenAI 3月融资后估值8520亿美元。
#6速递|打破AI融资纪录?Anthropic估值超9000亿美元,拟融资300亿
Anthropic正助力法律从业者用Claude聊天机器人完成更多任务。它周二发布12款法律新工具,如承担审查供应商协议、帮助备考律师资格考试等功能。还宣布将Claude与法律常用软件连接,通过Claude Cowork及第三方服务提供给付费顾客。Anthropic和OpenAI过去一年开发AI工具简化专业任务以吸引企业客户。Anthropic估值3800亿美元,考虑超9000亿美元融资报价,可能今年上市。此前其举动引发市场动荡,2月推出工具曾致股市暴跌,现律师对Claude兴趣提升,超20000名法律人士报名网络研讨会。
#7独家|高质量物理本体+真机数据+“一身多脑”,灵御智能两个月内再获近亿元资本加注
清华系具身智能公司灵御智能完成天使+轮近亿元融资,距上次仅两个月,由福田资本领投,多机构跟投,老股东持续加注,累计融资达数亿。本轮融资用于产品迭代、供应链建设与数据研发。目前意向订单约3亿,在手订单约1亿,今年预计出货1000台。灵御以“灵御TA机器人+高质量真机数据+云端大脑”为核心路径,其TA机器人已在多场景验证。公司构建了真机数据生产范式,计划一年建百万级数据集,还落地“云端大脑”架构并与英特尔合作验证。投资方看好其技术与团队,认为具成长潜力。
#8Z Potentials|对话黄岩:拒绝“压扁”物理世界:一个少数派对具身智能的第一性原理对赌
文章围绕黄岩在具身智能领域的研究展开。黄岩是具身智能领域的少数派,不随主流,提前布局多个关键方向。他认为具身智能处于1.0荒蛮期,主流路径存在‘漏斗’式架构损耗。为此,他推出BridgeVLA超少样本大模型,保住空间结构,提高样本效率;BridgeV2W实现具身因果律闭环,构建风险截流系统;E - TTS引入慢思考,完成从执行到决策的闭环重构。在技术起点上,黄岩2013年开始做多模态研究,2019年转向视觉语言导航。他掌握超少样本大模型、世界模型和人在环路强化学习三项技术,三者形成闭环。在技术应用方面,实现VLN模型真机部署,参加多项竞赛并取得优异成绩。他提出的FAM 1.0框架,通过架构创新提高数据效率。最后,黄岩对行业发展进行判断,认为具身智能未到GPT - 3.5阶段,未来中国团队在商业化落地有优势,还指出预训练算法和具身数据下的视觉理解能力是新机会点。
#9速递|击败40个对手拿下亚马逊订单,AI语音Vapi估值5亿美元
Amazon Ring在评估40多家AI语音供应商后选择Vapi处理入站电话流量,目前Ring 100%的入站电话都通过Vapi平台路由。这助力Vapi完成5000万美元B轮融资,投后估值约5亿美元。Vapi由Dearsley和Nikhil Gupta创立,前身是AI治疗师,2024年正式发布平台,为企业提供语音代理工具。该公司已处理超10亿次通话,客户包括Amazon Ring等,还运营自助开发者平台。其融资总额达7200万美元,年度经常性收入处于“健康”八位数水平。Vapi专注语音代理基础设施和编排层,计划用新资金扩大团队。
#10Z Event|杭州研究员、开发者、创业者线下饭局,探讨智能的N条路径
文章介绍Z Event活动,是杭州研究员、开发者、创业者线下饭局,将探讨智能的N条路径。
#11速递|AI芯片独角兽Cerebras上调IPO规模,拟融资48亿美元、超额认购20倍
AI芯片独角兽Cerebras Systems上调IPO规模,拟以每股150 - 160美元发行3000万股,筹集48亿美元,此前计划发行2800万股,价格为每股115 - 125美元。此次IPO已超额认购20倍,预计5月13日定价。该公司去年撤回注册申请后,今年秘密提交上市申请。其在价格区间上限市值达344亿美元。Cerebras将挑战Nvidia,已与Amazon、OpenAI等合作,OpenAI持有其3340万份股票认股权证。2025年营收5.1亿美元、净利润8790万美元,去年同期营收2.903亿美元、净亏损4.848亿美元。发行由多家银行牵头,股票将在Nasdaq上市,代码CBRS。
#12Z Potentials|腾讯T15与Adobe科学家联手:大厂在做“打印机”,我们做AI视频的灵魂
腾讯T15王珏与Adobe科学家方晨离开大厂创业,公司获千万美金融资。首款产品Dzine定位AI时代的Photoshop,达千万美金年营收。他们发现动画用户留存好,决定推出Anijam切入动画市场,目标是让用户用一句话做视频。Anijam上线两周付费用户过千,超一半作品在手机完成。他们认为底层模型是“打印机”,Agent才是“灵魂”,目前其Agent打造出色。他们还指出当前视频模型训练范式可能非最优,未来Agent应自评估、自迭代,今年希望Anijam全球注册用户达千万量级。
#13速递|OpenAI砸45亿美元成立AI部署公司,收购咨询公司Tomoro,布局企业AI
OpenAI为推动AI软件在企业的应用,有一系列举措。它同意收购咨询和工程公司Tomoro,协助新成立的OpenAI部署公司组建人员,该公司约150人专注AI软件部署。OpenAI还与TPG Inc.等投资者合作,这些投资者将向合资企业贡献额外40亿美元,Brookfield周一宣布投资5亿美元。其竞争对手Anthropic上周也宣布组建类似公司。
刘润
更新 12 篇#1特朗普访华3天,都谈成了些什么?
5月13日特朗普访华3天,本文梳理10个重要成果。农产品上,中国承诺三年每年百亿购美农产品,含7500万吨大豆,牛肉进口许可续签;能源方面,三艘LNG货轮重启对华运输,中国同意购美石油;波音获200架订单;约10家中国企业获购买英伟达H200许可;稀土出口管制停战延续;关税总体未调但品类松动;随行CEO看重中国市场;成立中美贸易局和投资局;双方构建“中美建设性战略稳定关系”,特朗普邀中方领导人访美。
#2进化岛周报|AI取代的是任务,而不是角色
这是进化岛2026年第19周(5月4日 - 5月10日)学习周报。本周刘润带来7篇日课,涉及企业家AI编程实践、AI发展认知分裂、能力迁移等内容;无单独问答动态。读书会登岛1集视频,强调人机协同。AI落地栏目有5篇内容,包含AI伴侣留存、开源技能等。嘉宾洞见指出AI时代大众点评地位将松动等。岛友分享读书、职场、生活感悟及运动成果。
#3你不是没有重点,你是没有结构:如何有效分析问题?
文章重发过往热门文章,探讨如何有效分析问题。参访咨询公司得知七步分析法,执行不佳是因缺乏结构化思考和表达框架。训练此能力有三点建议:一是清晰定义问题,要在what和how背后找到真正的why,若找不到就不停追问;二是遵循MECE法则,即“相互独立,完全穷尽”,分解问题可按不同角度,借助成熟模型;三是有逻辑地沟通,可运用SCQA工具,包括背景、冲突、问题、答案,不同表达顺序效果不同。最后强调结构化思考和表达是分析问题的关键,要练好基本功。
#4数学与AI结合在企业问题解决中的应用探讨思考 | 刘润日课
文章探讨数学与AI结合在企业问题解决中的应用。指出在AI时代,程序员懂数学能决定解题思路,避免代码被取代;商业管理难题底层是数学最优化问题,如库存管理可借助数学模型;2026年是AI落地元年,企业应找到‘最贵的问题’,用‘AI+数学’重构商业底层逻辑。
#5我们真的看不了世界杯了吗?
距离2026年美墨加世界杯开幕不到一个月,央视与国际足联(FIFA)就转播权谈判陷入僵持。FIFA最初报价2.5 - 3亿美元,后降至1.2 - 1.5亿美元,而央视心理价位在8000万美元以下。FIFA为实现“百亿梦想”,以产品升级为由提高转播权价格,如比赛场次增加、保留补水广告时间等。但央视面临诸多难题,如需承担公共服务职能、比赛时间不友好、广告预算被FIFA截流、新媒体分销曾亏损、中国队未参赛情感连接缺失等。作者认为FIFA报价虽贵,但最终能谈成,成交价预计在6000 - 8000万美元。
#6特朗普带来的17家公司,都是什么来头?
文章讲述特朗普访华随行的17位美国CEO背后公司与中国的渊源。苹果与中国供应链深度绑定,特斯拉靠上海工厂走出困境,波音在中国有巨大市场但近年受挫,GE航空为C919提供发动机。高通营收近半来自中国手机品牌,美光虽被管制仍在西安加码投资。Coherent为中国数据中心供光模块,Illumina曾被封禁后想拓展中国市场。嘉吉是食品供应链巨头,花旗、高盛、贝莱德、黑石等金融企业在中国有不同发展历程。万事达获境内清算牌照,Visa仍在等待。Meta用户不在中国但客户在中国,英伟达黄仁勋最后补位访华。这些公司与中国相互依存,“脱钩”不易。
#7润米招聘程序员,做AI时代的ITBP!
润米招聘ITBP岗位程序员,此岗位既懂业务又懂系统,还能用AI做交付。AI使写代码变容易,判断力变稀缺,ITBP站在变化中心。它并非产品经理、架构师和AI工程师简单相加,而是三者能力相乘的复合型人才。文中以查看公众号文章数据为例,展示ITBP工作流程。招聘要求有2年以上软件开发经验、主导过完整项目等,不设年龄门槛。公司提供充足开发预算、稳定环境、有竞争力薪酬和良好福利。
#8新华社解读就业趋势:未来五年,机会在哪里?
文章基于新华社通稿解读未来10大就业趋势。新兴产业规模化带来配套服务机会,如低空经济相关岗位;数字经济下AI需人机协同,可做职业培训或结合具体场景;服务领域注重体验和情绪价值;灵活就业需解决保障、成长和事务负担问题;跨境领域有合规、内容、人才培训等机会;田间创业可激活闲置资产、做产业产品经理或服务商;文化产业与新技术融合,可做方案商或培训;老龄“订制”需分层满足不同老人需求;绿色职业可做碳资产管理和节能运维;区域就业要跟着“产业 + 城市”走。还指出抓住红利要抢占时间差、利用空间差,注重体验和技能,具备可迁移能力。
#9舆论事件中的低容错空间分析 | 刘润日课
文章围绕舆论事件中的低容错空间展开分析。指出很多品牌营销翻车是因缺乏对“空间”的识别力,母爱、家国、先贤等是低容错“红区”,在此玩梗易冒犯公序良俗。同时提到最能容错的是自己的空间,如润总自嘲公司是“小破公司”,这是高明沟通策略。还以追觅创始人俞浩为例,说明识别空间敏感度比创意重要,高频输出不触碰“低容错红区”可保舆论安全。
#10“个体崛起”的时代,可能真要来了
文章指出,自去年底起,多Agent协作受关注,2025年Google推A2A协议,2026年OpenAI发布Symphony,腾讯WorkBuddy也上线“专家团”功能。介绍了马具工程,即给AI套上“组织”缰绳,让其发挥作用。用好马具工程需关注三点:一是角色,将任务拆分,让不同Agent发挥专长,提升交付质量;二是规则,明确AI做事标准,保证稳定产出,如WorkBuddy的法律咨询团;三是流程,把复杂任务拆成接力赛,让AI互相校正,循环逼近正确答案,像WorkBuddy的软件开发团队。最后指出AI让个体拥有组织能力,个体崛起可期。
#11AI时代程序员角色与任务的区分及职业发展思考 | 刘润日课
文章围绕AI时代程序员角色与任务展开思考。指出很多人混淆写代码任务和程序员角色,被AI取代的是枯燥重复任务,而非承担责任的角色。如OpenAI创始人半年不写代码,角色反而更强大。还以建筑师和搬砖工类比,说明区分是否被替代要看是被技能“拴住”还是用技能“突围”。最后强调此观点适用于所有职业,如导演,优秀导演用AI突破限制,平庸导演因AI失业,鼓励人们在AI时代靠认知驱动,展现真正价值。
#12我让三个AI替我“吵了一架”
文章指出人类讨论易形成‘表面共识’,因情绪、职位等因素使真正观点被包裹,低质量共识难换高质量结果。而‘罗伯特议事规则’能促进高质量讨论。作者搭建三个AI智能体并设定角色与原则让其‘吵架’,如在公众号写稿场景中,它们依规则不断协作,直至得出满意结果。AI‘吵架’无情绪,可执行无情批判并向目标收敛,能给出高质量反对意见。不过该方法成效取决于给AI设定原则的清晰度,且人类要提出核心问题。
人人都是产品经理
更新 11 篇#1QQ内测AI帖子应用,能否解马化腾“上船漏水”之围?
腾讯在QQ内测AI帖子应用功能,类似AI版贴吧,用户可生成AI小游戏等并封装成社交帖子,实现社区内创作、体验、互动闭环。这是腾讯在AI社交领域的重要尝试,也是为老社交产品注入活力。过去一年,QQ围绕AI改造,在内容创作、互动场景、聊天与社群场景等方面上线10余个新功能,走“小步快跑、务实试错”路线。不过,QQ发力AI社交虽有用户和产品生态优势,但也面临用户增长见顶、产品臃肿、竞争同质化等问题。腾讯此举旨在守住年轻用户阵地,延缓产品老化。
#2民宿市场后五一档,木鸟、途家、美团三大平台再次开打
五一后民宿行业进入修整期,木鸟、途家、美团三大平台仍在竞争。木鸟民宿“缤纷夏日 解锁清凉派对”活动,主打周边游,有高频活动、无门槛直补和强周边场景,还发放优惠券,推荐网红民宿吸引年轻用户。途家民宿以常规优惠和多人整租为卖点,主打家庭度假场景,但流量下滑。美团民宿借美团旅行活动,有周周半价抢券活动。从下载量看木鸟占优,木鸟有网红民宿优势,途家主打酒店式公寓,美团靠绝对低价,三家活动基于不同场景需求进行情绪抓取。
#34年经验面腾讯产品岗,一面暴露野路子硬伤
AI时代促使很多人转行到B端/C端+AI产品领域,但过程困难。如传统To B企业员工自学难落实,4年经验者面腾讯产品岗受挫。小南、阿海等产品人面临精力分散、缺乏系统思维等问题,存在缺少核心技能、AI项目经历和业务认知等短板。建议跟大佬学系统产品工作方法,如“人人都是产品经理&起点课堂”的《产品经理私教陪跑实战营》,有1v1大厂导师陪跑、企业级项目带练、大厂产品能力模型、求职陪跑服务等方案,不少学员已拿到心仪offer。
#4小红书重塑肉身
小红书在IPO前夜面临商业化与内容真实性的平衡难题。追觅创始人炮轰其算法机制,引发舆论关注。小红书进行组织调整,整合社区、电商、商业化三大业务,设AI一级部门Dots。过去11年商业化磕磕绊绊,因处于购买链前端,离交易远,且虚假种草、流量倾向等问题影响用户信任。去年起商业化战略渐明,打破业务间壁垒,加强内容与电商、广告联系,电商转向“好货”核心。同时发力AI,将其融入核心业务,提升用户体验和商家效率,以解决社区与商业化矛盾,与时间赛跑。
#5如何用Skill做竞品调研?
文章分享用AI做竞品调研的经验。作者首次尝试让AI自主调研,结果信息不可靠、滞后且分析空洞。后来转变思路,先明确信息需求与来源,聚焦分析粒度,将整理好的信息按判断标准喂给Skill,并锁死输出格式。以智能排班调研为例,发现竞品技术路线、功能覆盖、资源投入节奏等差异,为产品决策提供依据。最后强调AI增强对比能力,不能替代调研,要准备好材料并给Skill判断标准,还可与其他Skill组合使用。
#6涨薪 30%!转型 AI 产品经理的正确方法,0经验直接复制!
2026年腾讯AI产品岗位热招,不少人规划转型。刚做产品1年的月月转型AI产品经理涨薪30%,她复盘3个踩坑经验:学习上,勿死磕技术,应明确目标与能力要求;简历方面,写强相关关键词,积累项目经验;面试时,大胆尝试,从产品定位阐述思路。此外,文章推荐“人人都是产品经理&起点课堂”的《产品经理私教陪跑实战营》,含大厂导师陪跑、企业项目带练、夯实知识架构、求职陪跑服务,学员上岸率超95%。
#7姚顺宇4小时深度访谈,我们概括为30句话
记者张小珺与DeepMind研究员姚顺宇进行近4小时深度对话,其观点被整理为30条。姚顺宇认为AI行业重要的是靠谱、对系统负责、排除bug。从物理跨向AI,物理对AI硬实力帮助小,主要带来做事系统、刨根问底的性格。当前AI进入新阶段,更需关注问题定义,修好bug比技巧更重要。他还建议GenAI领域需不断学习,未来程序员要与AI协作,量子计算和AI机会多,人应找到适合自己的路。
#8沙盘推演:大模型吞噬互联网
文章指出大模型时代互联网流量迁移,虽目前仅10%流量迁移至AI工具,但未来3 - 5年或达30% - 40%。OpenAI将ChatGPT升级为超级App,科技大厂和AI原厂争夺C端AI超级原生应用。不同互联网赛道面临不同管道化风险与应对策略:搜索与广告短期找到平衡,远期有颠覆风险;OTA行业价值链大概率洗牌,但难被完全替代;电商、内容、社交行业短期相对安全,远期面临冲击。未来3 - 5年互联网将形成“AI平台 + 传统平台”二元生态,企业需围绕价值创造转型。
#9产品规划:如何抽象地规划产品路线图和功能优先级?
文章围绕产品规划展开,介绍抽象规划产品路线图和功能优先级的方法。先指出产品规划是高级产品必备技能,接着分六步阐述:第一步明确业务定位,要依据业务方向、客户画像和目标确定,以HR SaaS为例说明不同层次定位;第二步根据业务定位明确产品定位,考虑业务定位、客户向往感和竞争策略;第三步识别客户和行业痛点确定产品决胜点;第四步基于前两者探索产品方向,如HR SaaS有配置化、自动化等六个方向;第五步从产品方向选关键路径,如HR SaaS有聚集用户场景自动化等四条路径;第六步根据产品路径梳理需求场景制定最终规划,强调产品规划要明智取舍。
#10如何用AI给自己加一条「增量曲线」?
文章围绕职场人在AI时代的职业发展展开。职场人希望借助AI提高主业效率、开展副业。要靠“AI + 产品”搞钱,需分三步:夯实产品能力,这是核心竞争力;懂AI、用好AI,掌握实用型技能;成为AI超级个体,跑通商业闭环。起点课堂全站通会员为自学困难者提供高效学习路径,包括提升产品思维、掌握AI知识技能、找准定位开启超级个体之路,助力从AI技能到产品思维、主业到副业变现的一站式提升。
#11腾讯需要一场2026年的首胜
2026年5月7日,腾讯混元3.0以3.66万亿Token登顶OpenRouter总榜第一。虽带队的姚顺雨是反冲榜主义者,但此次登顶对腾讯意义重大。2026年上半年腾讯业务有压力,如元宝拉新未达预期,《王者荣耀世界》口碑不佳。混元3.0有性能提升,但内部反馈不理想,存在强制推广、限制竞品调用等问题。其登顶是技术重构和限免政策的成果,但与竞品相比,调用量和价格有差距,且对手商业化更快。腾讯当前股价下跌、利润增速预期降低,混元3.0登顶给其带来积极信号。
追问nextquestion
更新 9 篇#1爱因斯坦未竟的猜想:大脑,一台抵抗熵增的热力学机器
文章介绍“心智的热力学”框架,将热力学用于大脑研究。它能量化大脑层级结构及背后机制,解释大脑调配认知过程。文中指出大脑需层级结构以高效计算,传统理论未就大脑状态定义达成共识。此框架通过“时间之箭”量化信息流不对称性,确定大脑层级组织,已揭示认知和大脑状态差异。如静息时大脑不可逆性和层级低于执行认知任务时,患者休息时不可逆性也低。看电影时大脑层级更扁平,让人放松。此外,湍流能解释大脑慢速传递信号却高速处理信息的原因,未来可结合FDT完善该框架,还有助理解精神疾病。
#2追问daily | 学得快反而学得差?运动让人更慷慨;睡眠时长过多或过少均加速全身器官衰老
文章涵盖脑科学、AI行业及AI驱动科学等领域前沿研究。脑科学方面,涉及脑回路重塑、运动学习权衡、睡眠与衰老关系等;AI行业中,Anthropic超OpenAI,Google推Gemini Intelligence;AI驱动科学领域,有无人机导航、钙钛矿分子设计等成果。如杜克大学开发LinCx技术重塑脑回路,Anthropic企业采用率超OpenAI,代尔夫特理工大学团队让无人机实现自主返航。
#3为什么AI的错误毫无价值?如何理解AI的理解?
本文重新梳理了主持人与哲学家Henk de Regt关于AI理解能力的访谈。Henk de Regt认为理解是基于技能、语境和理论可理解性的实践能力,科学理解是可错的,即使错误理论也能提供理解,如生物电和热力学两种神经信号传递理论可协同增进理解。他还提出操作性测试评估AI理解能力,设想学生与教师互动前后测试,以分数提高判断教师传递理解的能力。对于科学能否被计算机取代,需回答“什么”“为什么”及因果解释反事实三类问题。大语言模型错误无价值,因无理论支撑;人类科学理解错误可能导向新发现。此外,抽象和隐喻对理解有重要作用,可视化可辅助理解但非必需,专家和大众理解本质相同,都是推理能力。
#4追问daily | 让老人带娃将加速老人认知衰退;麻醉并非深度睡眠;抑郁症削弱的是期待
文章涵盖脑科学、AI行业、AI驱动科学等领域研究成果。脑科学方面,耶鲁大学团队发现麻醉是睡眠与昏迷混合状态;海军军医大学团队利用HIF - 1α自噬降解延缓衰老;加拿大团队发现小胶质细胞加速恐惧记忆消退等。AI行业中,爱思唯尔起诉Meta盗版论文训练Llama;GPT - 5.5破编程基准测试。AI驱动科学领域,慕尼黑团队开发RegVelo预测细胞命运;韩国团队开发智能戒指打破手语沟通障碍等。此外,还提及青少年使用AI聊天机器人的风险及人形机器人触觉梦境技术提升操作成功率等内容。
#5追问daily | 人们会认为AI生成的内容是自己原创的;看淡损失让你更坚强
文章涵盖脑科学和AI领域最新动态。脑科学方面,新型短RNA可逆转TDP - 43蛋白聚集,有望攻克渐冻症;前额叶皮层调控记忆关联与分离;脑控听觉系统改善嘈杂环境语音感知;大脑组胺系统与精神疾病关联被揭示;咖啡因增强大脑抑制反应;看淡损失者心理韧性更强。AI领域,OpenAI成立部署公司并推出网络防御工具Daybreak;人工智能在急诊诊断中表现优于人类医生;人机协作易引发记忆混淆;AI生成抑郁症图像加剧污名化;混合AI架构打造‘发现机器’;新型量子点发射器实现电信波段高相干光子发射;探讨AI设计蛋白质的安全性;语言模型处理医院结构化数据能力待提升。
#6万字追问:你以为的理解真的是理解吗?重新理解理解的四个层次
本文是对拉德堡德大学教授亨克·德·雷特的访谈,围绕“理解”展开。他提出实用主义理解观,认为理解是使用理论解释现象的能力。其理论起源于对薛定谔等物理学家观点的研究,早期面临学界质疑。判断“理解”需结合科学史,存在形而上学与科学可理解性之分。关于AI理解,团队开发评测基准,虽采用行为主义思路,但亨克对此保留态度。此外,错误理论也能增进理解,理想化和抽象可提升可理解性。隐喻在公众和专家理解中都很重要,有开放和封闭之分。
#7追问weekly | 过去一周,脑科学领域有哪些新发现?
文章为脑科学领域一周新发现汇总。神经科学方面,揭示多巴胺扭曲时间塑造记忆、大脑内外处理快速切换等机制;鱼类睡眠有四种特征;AI可高精度解码睡眠记忆。认知科学发现大脑靠感觉存发音模式,裸盖菇素抑制攻击行为,AI能据聊天记录推断用户性格。疾病与健康领域有点击凝血止血、经颅磁刺激治抑郁等成果,也指出Omega - 3或加速老人认知衰退等。AI驱动科学中,在蛋白质设计、植物基因组绘制、急诊诊断等多方面有进展。大模型技术涉及图像保护、智能体工具开发等。意识与脑机接口方面,明确大脑网络功能,介绍闭环脑机接口治疗等。
#8追问daily | 有其母必有其胎:传染性打哈欠始于子宫;年龄如何改变我们对过去决定的情绪反应?
文章是科学研究动态汇总,涵盖脑科学、AI行业、AI驱动科学三方面。脑科学领域,GLP - 1新药、TMS疗法等研究有新进展,还发现传染性打哈欠始于子宫等;AI行业中,波士顿动力与谷歌DeepMind合作,DeepSeek融资;AI驱动科学方面,TranscriptFormer构建细胞图谱,多个团队在软体致动器、计算机视觉等领域取得成果。
#9如果费曼活在今天,他会如何“手撕”那些AI发布会?| 纪念费曼诞辰108周年
本文纪念费曼诞辰108周年,探讨其若在世会如何看待AI发布会。费曼是知名理论物理学家,警惕未厘清细节就许下的宏大承诺。他十几岁能修收音机,还揭示了“挑战者号”灾难原因。若参加AI发布会,他可能会质疑演示系统,追问机器出错表现等。如今AI虽强大,但很多系统是“黑箱”运作,易让人把表现当理解。他提出“草包族科学”概念,强调科学是让观念接受现实检验,推动科学的是怀疑。人工智能影响广泛,不自欺、理解其边界尤为重要。最后指出要守住科学信赖的价值,对理解保持诚实,承认无知与不自欺。
TesterHome社区
更新 8 篇#1最新AI应用实践!MTSC2026深圳测试开发大会,初选议题先睹为快!
MTSC2026深圳测试开发大会将于2026年8月15日举行。自议题征集启动,收到众多技术专家投稿。现公布初审议题,涉及腾讯、华为、蚂蚁集团等企业,涵盖游戏服务器性能压测、接口测试提效、服务器性能测试优化等多方面。大会采取6个平行专场形式,包括沐瞳专场、AI组织转型等,国内外顶尖技术专家等将围绕AI+软件测试前沿技术等展开讨论。大会门票7折优惠限期发售,面向测试、研发等行业人士,由TesterHome发起,已成功举办14届,有良好口碑。
#2智能体评测|游戏开发成AI新考场?GameDevBench揭秘智能体“隐藏短板”
AI代码智能体发展快,但多模态智能体发展滞后,现有评测基准缺乏对“视觉 - 代码”联动能力的考察。2026年2月,卡内基梅隆大学等团队发布GameDevBench,这是全球首个评估AI智能体游戏开发能力的基准评测体系。它基于Godot引擎,用132项实战任务量化多模态智能体水平,构建新评测范式。文章介绍了其评测流程、核心特性,评测结果显示智能体在游戏开发中表现不佳,存在多模态理解和领域模式不熟的短板。GameDevBench填补了游戏开发场景评测空白,为多领域提供新思路,还为软件工程测试和游戏自动化测试提供新范式。
#3聚焦最新AI应用实践!MTSC2026中国互联网测试开发大会(深圳站),最新议题抢先看!
MTSC2026中国互联网测试开发大会(深圳站)将于2026年8月15日举行。大会已收到众多技术专家议题投稿,现公布部分初审议题,涉及腾讯、华为、蚂蚁集团等企业,涵盖AI在游戏、接口、服务器等测试领域的应用。大会设6个平行专场,包括AI组织转型、Agent驱动的测试执行体系等,国内外顶尖技术专家将围绕AI+软件测试前沿技术等展开讨论。门票7折优惠限期至5月底,大会面向多类行业人士,由TesterHome发起,已成功举办14届,TesterHome是知名测试技术社区。
#4初选议题出炉!MTSC2026中国互联网测试开发大会(深圳站),最新议题抢先看!
MTSC2026中国互联网测试开发大会(深圳站)将于2026年8月15日举行。大会已公布初审议题,涵盖腾讯、华为、蚂蚁集团等企业在AI测试领域的实践,如游戏服务器性能压测、接口测试提效、服务器性能测试优化等。大会设6个平行专场,包括AI组织转型、Agent驱动的测试执行体系等,将围绕AI+软件测试前沿技术等展开讨论。门票7折优惠至5月底,面向测试、研发等行业人士。MTSC大会由TesterHome发起,已成功举办14届,TesterHome是知名测试技术社区,还举办多种技术沙龙。
#5美国汽车巨头裁员数百名IT人员,为AI人才“腾笼换鸟”
2026年5月11日,通用汽车被曝裁撤IT部门超10%岗位,约600名带薪员工受影响。这是“腾笼换鸟”式战略性技能置换,为AI人才腾空间。通用汽车证实裁员是为定位未来发展方向的IT组织转型,裁员并非全是永久性,还会招聘AI技能岗位人才,聚焦AI原生开发等前沿领域。这是其过去18个月组织变革延续,此前已在多部门裁白领员工。同时,公司领导层变动,积极引入AI专家。通用汽车此举启示企业,AI落地需进行人才结构根本性重构。
#6预发测不透、上线就翻车|如何通过影子测试优化Flink部署
文章围绕Flink应用部署痛点,介绍Grab数据团队影子测试优化实践。Flink生产部署可靠性影响业务可用性,预发测试难模拟生产情况,版本上线异常自动回滚会致业务中断。Grab数据团队将影子测试嵌入Flink部署流程,把影子测试集成到生产环境,与主应用并行运行,影子应用使用独立配置与输出端。部署时用户可选择是否启用影子测试,启用则先进行影子测试,成功后再部署主应用。平台提供标准输入/输出连接器,确保不干扰主应用。该框架提升了Flink应用部署可靠性,未来将支持更多连接器,优化易用性等。
#77折票优惠5月底截止!MTSC2026中国互联网测试开发大会将于8月在深圳举行
MTSC2026第十五届中国互联网测试开发大会8月将在深圳举行,目前7折购票优惠至5月30日。大会主题“质效革新·智领未来”,契合AI技术浪潮下软件测试行业变革趋势,设置多个平行分会场,围绕AI核心专题开展分享与研讨。方向包括AI原生产品质量保障、AGI研发测试范式升级、AI赋能测试提效、AI冲击下测试组织与个体进化。大会覆盖软件测试多前沿领域,诚邀各界人士参会。MTSC大会由TesterHome主办,已成功举办14届,有良好口碑。
#8职言|AI只是让你零门槛成为测开,可并没减轻你的测试工作
文章指出软件测试行业受AI影响,有人认为测试岗位岌岌可危,但实际AI未减轻测试核心工作,甚至添乱。测试本质是保证质量,需清晰需求文档、任务筛选排序和沟通了解业务,这些AI无法解决。AI虽降低周边工作门槛,但测试执行仍需人工。自动化未大幅提升测试效率,AI还使开发效率提升,测试工作量增加。最后建议测试人员将精力转向沟通交流和流程把控。
阿里云云原生
更新 7 篇#1Agent 从一问一答到自主执行面临哪些挑战?
随着AI发展,Agent正从答疑助手走向自动执行任务的数字人,定时调度是其自主运行的主要触发形态,很多主流产品都重视该能力。开源Agent定时任务存在无高可用、运维成本高、权限管理弱、可观测能力弱、资源利用率低等痛点。阿里云MSE AI任务调度平台应运而生,它具有高可用定时调度、统一管理、精细化权限管理、企业级可观测能力等优势,还能弹性伸缩、批处理任务、实现自进化。与开源方案相比,它能更好支撑Agent定时任务运行。目前该调度平台已开放免费公测,支持多种Agent接入。
#226 年云原生 LFX Mentorship 夏季项目开放申请,开发者不容错过的带薪实习/摸鱼机会!
Linux Foundation组织发起的LFX Mentorship计划,为CNCF托管项目提供开源贡献土壤。2026年第2期夏季项目6月至8月开放申请,开发者参与可获导师指导、提升技能、获丰厚报酬。OpenKruise和Koordinator社区带来7个课题,覆盖云原生前沿场景。参与对象为年满18周岁的开发者,5月19日前登录官网申请,6月3日起通知结果,全程线上协作,8月25日前结项。各课题有具体描述、预期成果、推荐技能、导师及报名链接。
#3阿里云峰会 Agent Native 基础设施专场邀您参加!
大模型进化使云的使命从‘资源供给’变为‘智能供给’,但企业将 Agent 推向生产面临诸多工程化挑战。5 月 20 日 13:30 在杭州·西子宾馆举办的阿里云峰会【Agent Native 基础设施】专题论坛,将围绕云原生的 Agent Infra 全栈实践,分享阿里云在多方向的工程化思考和产品解决方案,助力企业打通 Agent 开发到规模化运行的最后一公里。
#4用两行代码将 AgentRun 集成到你的应用
文章介绍将 AgentRun 集成到应用的方法。前提是已有运行的 Agent。其调用端点兼容 OpenAI 协议,若项目用 OpenAI,改 base_url 即可接入。它提供五条集成路径:代码集成改两行参数调通;SDK 集成可管理资源并对接主流框架;UI 嵌入复制代码片段到网页;IM 集成控制台配置机器人,处理协议差异;事件集成接阿里云 EventBridge,自动触发 Agent。各集成方式背后共享平台基础设施,降低集成门槛。
#5阿里巴巴 & 蚂蚁共建 LoongSuite GenAI 可观测语义规范:从统一数据语言到规模化落地
文章围绕阿里巴巴与蚂蚁共建的LoongSuite GenAI可观测语义规范展开。随着GenAI发展,OTel早于2024年初推动GenAI语义规范建设。OTel SemConv是可观测数据采集标准,统一数据语言,支撑治理,降低接入成本。2025年,阿里与蚂蚁团队联合启动,2026年将成果开源至LoongSuite。该规范新增Entry/Step Span、Skill语义、Token级推理观测,在集团多核心场景落地。GenAI Utils作为工程化能力层,封装语义规范复杂性,提供简洁API,支持Python和JS,已实现多个GenAI框架和模型服务插桩。未来将在敏捷性、效率、端到端追踪及与上游协同等方面持续努力。
#6Qoder Together 贵阳站:AI 如何重构软件研发和产品交付
Qoder Together贵阳站活动将于5月15日14:00 - 16:30在贵阳温德姆花园酒店5楼多功能厅举办。可通过https://huodongxing.com/event/7860317757511报名。活动亮点包括Qoder和QoderWork产品技术揭秘、探讨AI重构软件研发与产品交付、Qoder激活老项目的新功能演进与高效交付,还有Qoder AI Coding Workshop。
#75 分钟上手 AgentRun:从注册到第一个 Agent 运行
文章介绍阿里云 AgentRun 助力快速上线 Agent。做 Agent 流程繁琐,而 AgentRun 摆正分工,有「快速创建」模式。用户通过控制台进入,5 步即可上线 Agent。快速创建表单中,模型服务支持主流模型即配即用、可随时切换;系统提示词有 8 个模板,也能让 AI 生成;工具与上下文可挂 5 类东西且能事后添加;填好名称和描述即可创建。详情页 8 个 Tab 覆盖全生命周期,还能实时对话测试和多模型横评。创建时平台自动处理多项事务,后续还可进行部署自研框架、模式升级等操作。
iOS新知
更新 7 篇#1GitHub 官方都在用!7 个 iOS/macOS 开发神器,第 4 个直接救命
文章推荐7个iOS/macOS开发神器。Supertonic是端侧多语言TTS库,隐私性好、延迟低,适用于离线语音播报等;Rebel是GitHub官方的AppKit增强框架,改善macOS开发体验;idb用于iOS模拟器自动化,功能丰富;MonitorControl可通过键盘调节外接显示器亮度;Loop是美观的macOS窗口管理工具;Peekaboo结合截图与AI视觉问答;macshot是原生macOS截图录屏工具,有自动隐私遮罩等功能。
#2AI 编程应用 Replit 被苹果拒审 4 个月,和解后带着 Agent 4 回来了
Replit的iPhone版App被苹果审核卡了4个月,本周和解并发布更新,带来Agent 4。三月份Replit新版本审核未通过,理由与“AI生成的App在iPhone上预览”方式有关,具体细节未透露。此次更新将Agent 4同步到移动端,还有支持并行Agent、团队协作等实用功能。更新同时,Replit搞限时活动从竞品拉用户。和解核心外界不清楚,苹果顾虑或影响其他编程工具,WWDC 2026或公布新规则。
#3Codex 终于来手机了!扫码接管 Mac 写代码,OpenAI 这招真的绝
文章介绍 OpenAI 的 Codex 可在手机使用,并非远程控制,手机负责‘盯着’和‘拍板’。接入流程简单,Mac 上的 Codex 显示二维码,用 ChatGPT app 扫码即可。手机能操作所有跑着的 Codex 线程。该功能适用于让 Codex 跑耗时任务,人可去做其他事,等通知再处理。iOS 和 Android 版 ChatGPT 已推送,支持地区同 ChatGPT 现有覆盖范围,需更新到最新版。Windows 版 Codex 暂不支持,后续会跟上,Codex for Mac 迭代速度快。
#4Xcode 26.5 内置 Swift 6.3.2,Bundle.module 终于能在 MainActor 外用了
Swift 6.3.2于5月13日发布,是patch版本,主要修复bug,Xcode 26.5将内置该版本工具链。安装方式有通过Swiftly安装、直接下载Toolchain、更新Xcode等。主要修复内容包括:Swift编译器允许Linux上C++互操作时导入C++23头文件;Swift Package Manager让Bundle.module可在MainActor外部访问,修复Package Registry交互的几个bug;Swift Testing修复exit tests返回错误结果问题,对@Test宏加泛型类型参数发出警告;LLDB改善Windows上找不到Python时的错误提示;libdispatch更改dispatch worker线程命名;SourceKit - LSP修复Windows上使用compile_commands.json时的崩溃问题,新增forceResolvedVersions配置项。
#5Xcode 26.5 刚更新!AI 编程终于能「排队发消息」了,不用傻等回复
Xcode 26.5 于昨日更新,带来两大新功能,提升 AI 写代码体验。此前 Airbnb 透露 60% 新代码由 AI 编写,Google 内部 75% 代码也由 AI 生成,Agentic Coding 已成现实。Xcode 26.3 让开发者可接入 OpenAI Codex 等工具,26.5 在此基础上新增消息排队和 Agent 主动提问功能。前者使消息可排队发送,提升效率;后者让 Agent 执行任务前先确认关键问题,提高准确性。二者结合让 Agentic Coding 工作流更顺畅。
#6你以为 @MainActor 一定在主线程?这个坑让无数 iOS 老司机翻车
文章围绕Swift Concurrency中`@MainActor`在不同上下文的调度问题展开。写Swift Concurrency代码时,标`@MainActor`的方法可能在后台线程运行,这是预期行为。在async上下文调用,编译器会提醒;在同步nonisolated上下文,编译器不报错,方法实际在后台线程执行,这是历史代码迁移时隐蔽的崩溃源。Xcode 14后引入`SWIFT_STRICT_CONCURRENCY`,Swift 6之后此类调用为编译错误。Swift 6.2的Approachable Concurrency默认隔离切到MainActor,建议迁移以消除隐蔽bug。
#7iOS 26.5刚推!50+安全漏洞全修了
文章介绍了iOS 26.5系统更新情况。此次更新修复了50多个iOS和iPadOS的安全漏洞;还同步对多个旧系统如iOS 18.7.9、iPadOS 17.7.11等进行更新,除iOS 18.7.9外,多数旧系统仅修复已删除通知可能被恢复的bug。虽多数用户难感知这些修复,但漏洞真实存在,易使设备被攻击。苹果为老系统推补丁值得肯定,建议用户及时更新系统。
定焦One
更新 7 篇#1零跑:卖车11万辆,亏了3.9亿
5月15日零跑汽车公布2026年一季度财报,交付11万辆同比增25.8%,营收108.2亿增8.0%,但归母净亏3.9亿,毛利降至9.4%。原因一是A10上市拉低单车收入,二是战略合作业务减少。赚到的10.2亿毛利主要花在研发,开支达10.4亿,此外销售、管理开支也增加。亮点是海外交付4.1万辆,占比37.1%。短期内低价车影响毛利率,需靠高毛利车型和海外市场盈利。
#2中芯国际:建厂、借钱、扩产
5月14日中芯国际发布2026年一季度财报,本季赚13亿、资本支出110亿,主线为建厂、借钱、扩产。财报有三点值得解读:一是总利润跌近三成、归母利润几乎没变,因利润分配结构、政府补贴减少和利息净收入消失;二是毛利率超预期,但折旧压力积累,或影响未来毛利率;三是账上现金增多,借款也增多,因晶圆代工资本支出大。业务上,手机订单萎缩,消费电子占近半收入,美客户收入占比下降。二季度公司给出强收入增长指引,但仍面临折旧、消费电子景气和先进制程等长期问题。
#3“真Agent”创业怎么做?这8个问题讲清楚了
本文围绕‘真Agent’创业的8个问题展开。先介绍真Agent定义,即能自主推进任务、交付结果、持续学习。其最不可或缺的能力是能干事且越干越好。数据和默会知识是落地门槛,需解决数据清洗、经验表达等问题。进入企业真实业务场景,要跨越技术、数据、组织和信任的综合难题。员工对Agent态度不一,企业要通过消除危机感、支持能力转型等激发积极性。好的商业模式包括按服务、结果收费或分享增量收益。说服大客户需展示价值、沉淀交付流程。创业公司可避开巨头主战场,做原创创新构建壁垒。
#4一心卖车的蔚来,终于被看懂了
中国资本市场对新能源汽车态度转变,蔚来虽未讲新故事,2026年开年至今股价表现优于大盘。蔚来创始人李斌强调先做好主业,公司从经营理念、管理细度、市场理解三方面重新算账,实现销量与盈利突破。蔚来过去十年在换电、芯片、线控转向等方面的投入,如今开始转化为竞争力和利润。2026年,行业窗口、产品矩阵、盈利模式节点同时到来,蔚来将面临考验,需继续证明自己。
#5腾讯:每天赚7亿,给AI烧1亿
5月13日腾讯发布2026年Q1财报,总收入1964.6亿元,同比增9%,经调整净利润679.1亿元,同比增11%,日赚约7.5亿,但收入增速放慢。收入结构上,游戏和社交网络占比49%,游戏是主要现金来源,本土和国际游戏收入合计642亿,占比约三分之一。本季广告业务增长最快,营销服务收入382亿,同比增20%,不过毛利率因AI成本增加而下降。金融科技及企业服务收入599亿,同比增9%。腾讯还披露剔除5个新AI产品后的经营利润,一季度资本开支、技术基础设施运营成本和折旧均上涨,表明AI已进入成本结构,腾讯正用多业务现金流养新AI产品和基础设施。
#6双线作战的阿里,利润快没了
5月13日,阿里发布2026年Q1财报,营收2433.8亿元,同比增长3%,但利润端大幅背离预期。经调整EBITA为51.02亿元,同比降84%;调整后净利润仅0.86亿元,同比降100%。原因包括无形资产减值、其他业务亏损扩大、研发投入增加。电商主业CMR表现不佳,即时零售收入增长但吃掉百亿利润,云智能集团收入增长且AI产品收入可观。此外,CMR口径调整致收入端相差约50亿,GAAP与Non - GAAP净利润反差大。资本市场因阿里披露AI MaaS的ARR而看好。自2025年提出3800亿计划,阿里已投入超千亿,未来投入将更激进,商业化目标实现尚远。
#7最全盘点:追觅搞的基金,到底投了哪些企业?
天空工场创投由追觅科技发起,原名追创创投,2025年底品牌升级。截至2026年4月,已投资57家企业,2026年投资提速。其投资涵盖六大方向:机器人主线覆盖全产业链;智能家居主线从清洁家电拓展到全屋智能;新能源主线涉及核聚变、固态电池等;汽车交通主线包括整车制造、核心零部件等;AI与消费科技主线向消费场景和底层技术延伸;还有零散的独立投资。此外,天空工场曾承载追觅内部业务拆分独立融资功能。不过,其快速扩张存在隐忧,如投资节奏与投后管理匹配、项目阶段集中风险、产业协同兑现、现金流压力及利益冲突平衡等问题。
与数据同行
更新 5 篇#1【数据社群】数仓/治理/建模/数字化/职场/招聘等领域的经验交流!
该学习社群分为数据专业群与招聘交流群,已连接超2万数据专业人士。数据专业群含综合、数据仓库等六大专业群,综合群必选,其他可选1 - 2个。群内活动有原创文章、业界DT文章精选、话题讨论、成长感悟和资源分享。招聘交流群为求职者和招聘方提供连接,可自由发布信息,有在线文档辅助匹配。此群不担求职招聘纠纷责任,会移除发虚假、无关信息者,不欢迎猎头。
#2MCP,大多企业接不住
文章围绕MCP展开,介绍其定义、来源、组成、运行流程、适用场景等。MCP是连接AI应用与外部系统的开源标准,让AI用标准方式连接工具和数据。它因传统AI调用工具方法扩展累、维护成本高而出现。其采用客户端 - 服务端结构,由MCP Host、Client、Server等组成。运行流程包括发现、判断、调用、执行、返回、治理。适合多系统连接、多应用复用工具等场景。企业落地MCP需从数据、接口、权限等十个维度自查,多数企业处于L1 - L2级,要评估现有系统能否支撑MCP安全运行。
#3【数据社群】数仓/治理/建模/数字化/职场/招聘等领域的经验交流!
该学习社群分为数据专业群和招聘交流群,已连接超2万数据专业人士。数据专业群含综合、数据仓库等六大专业群,综合群必选,其他可选1 - 2个。群内活动有原创文章、业界DT文章精选、话题讨论、成长感悟和资源分享。招聘交流群为求职者和招聘方提供连接,可自由发布信息,有在线文档辅助匹配。该群不担求职招聘纠纷责任,会移除发虚假、无关信息者,不欢迎猎头。
#4AI提效汇报,不是技术展示,而是价值证明战
文章围绕AI提效汇报展开,指出技术团队常以技术指标汇报,未满足老板对价值判断的需求。如工单项目汇报,老板关注省人省钱,而团队只说技术提升。原因在于组织激励机制、价值口径需多方确认及团队防御机制。还给出改进建议:区分调用量与价值,写含业务后果的诊断书,用替代成本等经营口径换算效率提升,获取业务方证言,选老板关心场景做Demo。最后提出团队立项锁定业务方口径、组织评审邀业务方代表,逐步改变组织确认AI价值方式。
#5【数据社群】数仓/治理/建模/数字化/职场/招聘等领域的经验交流!
该学习社群分为数据专业群和招聘交流群,已连接超2万数据专业人士。数据专业群含综合、数据仓库等六大专业群,综合群必选,其他可选1 - 2个。群内活动有原创文章、业界DT文章精选、话题讨论、成长感悟和资源分享。招聘交流群为求职者和招聘方提供连接机会,可自由发布信息,有在线文档方便匹配。该群不承担求职招聘纠纷责任,会移除发虚假或无关信息者,不欢迎猎头。
Gartner公司
更新 5 篇#1三大趋势两大方法论CIO应对2026年不确定性的战略选择与落地路径
Gartner研究副总裁陈勇解读2026年企业数字化转型挑战与逻辑。当前企业数字化冰火交织,IT预算收缩但GenAI投入增长。2025年起全球不确定性指数高,CIO面临挑战。有三大趋势:IT预算受限,需降本增效;GenAI投资逆势增长,落地有争议,CIO要匹配风险偏好等;地缘政治使技术供应链转向本地供应商,CIO要调整管理策略。还有两大方法论:情景规划五步法和A.R.T框架。CIO要抓住三大确定性,用两大方法论应对不确定性,让数字化成企业穿越周期支撑。
#2Gartner:2026年中国GenAI预算将激增48.8%,面临泡沫与安全双重考验
Gartner研究副总裁陈勇就中国CIO应对2026年不确定性接受采访。调研显示,2026年中国GenAI预算预计增48.8%,超全球水平,94%企业计划增加投入。但整体IT预算收紧,CIO面临“不得不投却不知如何投好”困境,如投资回报率不明确、Token计费预算不可控、AI代理不安全等。中国IT预算增长率下滑,33%的CEO将其列为优先砍减项。Gartner对AI持中立态度,建议企业确认风险偏好、管理利益相关者预期、避免绑定单一供应商。以龙虾为代表的AI智能体有安全和Token消耗失控风险,中国科技企业推动Token经营模式也并非一本万利。2026年企业需平衡技术创新与财务稳健。
#3Gartner:中国“十五五”规划下的CIO行动建议
中国“十五五”规划引领2026 - 2030年经济社会发展,将IT战略转向技术“自主可控”。Gartner为CIO提供四大行动建议:一是向新质生产力转型,关注技术整合、生产要素配置和战略敏锐度;二是核心技术本地化,参考政府国企采购趋势,将IT本地化与业务挂钩,替换“卡脖子”技术,过渡到联邦架构;三是将安全作为核心支柱,建立统一治理体系,强化AI安全和供应链安全;四是部署AI计划,优先工业AI,确保合规部署,建立生产力指标,拥抱开源。CIO可从三方面衡量与规划的契合度。
#4欢迎您10点准时参加—AI智能体与OpenClaw的安全风险与防御策略网络研讨会
本次AI智能体与OpenClaw的安全风险与防御策略网络研讨会于2026年5月12日上午10点开始。已报名者需按时参会,未报名者可长按识别二维码或点击“阅读原文”报名,要用企业邮箱注册。研讨会将深入分析AI智能体与OpenClaw带来的新型安全挑战,如权限滥用等,探讨构建可信AI自动化防御体系。议题包括安全风险演进、建立风险分类模型、安全使用OpenClaw等,主讲人为Gartner的Angela Zhao和Anson Chen。
#5电子书下载|Gartner 2026 年中型企业技术采用路线图
进入2026年,中型企业技术取舍复杂。Gartner发布《2026年中型企业技术采用路线图》,系统梳理50项新兴技术的推荐部署节奏、采用时间表及价值与风险判断,助CIO和IT负责人做决策。路线图关注AI驱动自动化、云原生平台与安全云等关键技术方向,能帮企业明确优先技术方向、平衡投资价值与风险、制定技术布局路径。可扫码或点击阅读原文获取电子书,还推荐了依托Gartner可信洞察的AI工具AskGartner。
火山引擎Agent社区
更新 5 篇#1Agent 也能玩狼人杀高阶博弈?一场游戏看懂 OpenViking 长程记忆的实力!
文章围绕OpenViking和VikingBot展开,先指出当前多Agent系统缺乏长期协同进化记忆的问题,OpenViking将突破口放在提供可追溯记忆上。通过6个VikingBot模拟狼人杀对战,展示其记忆沉淀和跨局复用能力,随着对局增加,胜率显著提升。介绍了OpenViking的记忆高效管理,包括统一目录协议、三层结构存储、多种记忆类型抽取及增量更新机制。阐述VikingBot核心能力,如深度集成OpenViking、强大网关、多渠道接入等,还说明了记忆智能提交和渐进式记忆检索功能,评测显示其准确率高且Token成本低。此外,基于OpenViking的多租户能力保障数据安全和隔离,给出实际应用示例。最后提供VikingBot安装教程和狼人杀Demo,呼吁共建Agent上下文未来。
#2钛投标基于火山引擎 ArkClaw 构建招投标垂直智能服务生态
随着大模型应用成熟,行业发展转向垂直领域商业化落地。招投标行业痛点多,传统系统难升级。钛投标与火山引擎基于MaaS底座、ArkClaw智能体和EcoMesh技能市场,打造招投标垂直Agent生态。其采用四层架构,有5个招投标垂直Skills,可通过ArkClaw串联成完整业务链路,实现全流程自动化。企业可低代码/零代码接入,方案具备安全与合规设计。后续火山引擎将开放更多垂直Skill。
#3火山方舟 Agent Plan 实操指南:用 Agent + Skill 搭建可复用的短视频工作流
文章围绕火山方舟Agent Plan展开,指出当前AI工具功能分散,制约AI创作落地,而该计划将语言、图片、视频生成等能力打包成订阅套餐,解决了配置繁琐、计费混乱等问题。它具有全模态一站式、性价比高、兼容主流工具、计费透明等特点,有4档套餐可选。文中以短视频创作场景为例,展示了使用Agent Plan + OpenClaw搭建AI短视频工作流的过程,包括搜索素材、设计架构、细化分镜、生成角色和场景图、制作视频等步骤。还给出了保姆级配置教程,涵盖语言、视频、图片生成模型及联网搜索、向量模型的配置。最后提到该计划为创作者提供智能方案,未来将持续优化。
#4业务团队也能“手搓”应用?火山 Supabase 助力猿辅导对话式 Agent 落地
文章介绍猿辅导Rush平台结合火山引擎Supabase实现对话式Agent落地。猿辅导因业务微需求催生Rush平台,其基于Vibe Coding理念,让员工用自然语言交互生成应用。但早期遇时效性、数据安全、版本稳定和成本控制等挑战。选择Supabase后,Rush成提效工具,在教学、运营、职能侧应用效果显著。未来二者结合将深度融合AI、连接生态、赋能外部。还介绍Supabase,它是AI原生BaaS平台,功能完善、性价比高、数据库强、交互易用,适用于多种场景。
#5火山引擎发布业界首个“Agent 套餐包”,亮相 ClawCon 2026 中国首秀现场
5月11日,ClawCon 2026全球智能体盛会在上海开幕,火山引擎作为首席赞助商参与。开发者在智能体开发中面临模型选型、多模态支持等挑战。为此,火山引擎发布业界首个面向AI Agent场景的Agent Plan。该套餐包整合Model与Harness能力,提供更多模型选择和联网搜索等功能,引入AFP统一计费。它有四种规格套餐,覆盖不同场景,公测每日限购5500个。此外,ClawCon 2026上海站聚焦智能体前沿趋势,带来链接智慧、见证变革、掌握技能等价值,后续还有主题周,火山引擎将深化布局推动开发者参与开源生态。
GSYTech
更新 5 篇#1Copilot App发布,微软取消Claude Code订阅
文章指出当下各家都在卷GUI App,GitHub官宣Copilot app技术预览,原生支持多系统,Business/Enterprise用户可直接用,普通用户需加入waitlist,其支持全流程在原生桌面App完成。同时微软宣布计划取消Claude Code许可,推动开发者转向GitHub Copilot,6月30日前逐步停用,7月起正式砍掉大部分许可证。还提到CLI虽必要,但GUI在多Agent多会话管理等方面体验更好,如Codex App助力OpenAI翻盘。
#2Android Studio 放着没怎么用,怎么也会越来越卡?卸载掉这两个插件就好了
作者使用 Android Studio 时遇到虽使用不多但越来越卡的问题,通过日志分析发现大概率是 Copilot 插件和 JetBrains AI 插件导致。Copilot 即便无任务,也参与编辑器 UI 状态刷新、维护语言服务和文件监听;JetBrains AI 持续进行额度、激活状态等后台任务。这些插件在用户未主动使用时仍不断工作,抢占 UI 主线程,导致卡顿甚至冻结。作者卸载这两个插件后,Android Studio 性能明显改善,建议遇到类似问题的用户尝试卸载。
#3终于,Flutter 修复 Android 中文字体异常,但是很草台,不知怎么吐槽
Flutter 3.38 升级 Skia 版本后,部分 Android 设备出现中文字体异常问题,字体从系统默认无衬线体变为宋体风格衬线体。问题源于 Skia 重构 Android 字体回退逻辑,改变了选择 fallback 字体顺序,忽略 `fFallbackFor` 匹配检查。该问题受 Flutter 版本、Skia 版本、Android 系统字体配置、系统语言、应用 locale 等多因素触发。Skia 进行两次修复,第一次未完全解决,第二次修复后逻辑为优先返回通用后备字体。目前修复的 Skia 版本已合并到 `3.43.0 - 0.3.pre`,3.44 稳定版可解决问题。
#42026 Android I/O ,全新 AI 手机、 Android PC 和车载驾驶
谷歌「Android Show | I/O Edition 2026」围绕AI展开,是“Android有史以来最大更新之一”。核心聚焦Gemini深度整合等。AI手机将Gemini升级为主动智能体式AI,有多项新功能,今年夏天在部分机型上线。Googlebook采用Android + ChromeOS融合的Aluminium OS,专为Gemini设计,今年秋季上市。Android Auto全面更新UI,新增AI功能。Android 17处于Beta 4阶段,有安全、创作、跨平台等实用功能,大部分今夏推送,稳定版预计6月左右。此次更新使Android全面AI - first化,构建统一智能生态。
#5AndroidX 将引入有全新 AppState ,用于管理 Compose 状态
AndroidX 为「跨组件 Compose 状态托管场景」引入 AppState,虽未完全落地,但已明确核心目的是将 Compose 可观察状态从组件生命周期中提出,放到更上层容器管理。新增 `androidx.appstate` 包,有 `AppState`、`AppStateKey<T>`、`AppStateToken` 三个公开类型及对应公开方法。AppState 是 keyed MutableState store,存的是 `MutableState<>`,实现读写分离,其生命周期与实例本身绑定。它不是 `SavedStateHandle`/`ViewModel` 的替代品,而是 Compose Runtime 层的状态托管基建,可解决多个 Composable 或组件间共享 Compose State 的问题,还能在关联状态变化时自动清理状态,项目处于落地阶段。
数字生命卡兹克
更新 5 篇#1Codex更新远程控制,你也终于可以在手机上随时随地Vibe Coding了。
OpenAI官宣Codex更新远程控制功能,用户可用手机ChatGPT远程控制家里的Codex,实现不限空间的vibe coding体验。设置步骤简单,手机与电脑端消息实时同步,体验比Claude Code好,且安全有保障,所有会员均可使用。此外,Codex还更新了Computer Use、内置浏览器、Codex for Chrome、直接生图等功能,更新频率高。作者建议用户同时使用Codex和Claude Code,以享受技术发展红利。
#2现在,你可以在手机上用AI生成一个APP了。
作者参加百度Create 2026 AI开发者大会,分享对AI创作和vibe coding的看法。介绍百度秒哒,它是能帮开发产品的Agent产品,虽与顶级产品有差距,但全链路适配、对国内生态友好,适合普通人上手。大会上线APP版,可在手机上开发APP,集成后端和数据库。作者演示用秒哒App开发日记APP,过程简单,还能打包发布。此外,8岁小朋友用秒哒搓出小程序,体现AI解锁普通人创造力,让创造更自由。
#3聊聊豆包维权事件的风波。
近期一用户因豆包提供的退机票手续费信息有误,认为亏600元而起诉。该事件登上微博热搜,引发起诉能否赢及豆包有无责任的讨论。国内今年1月有类似判例,用户梁某用DeepSeek查高校报考信息获错误答案,起诉索赔败诉,法院认为AI非民事主体,提供服务适用过错责任原则,被告已尽合理注意义务。豆包维权事件结局可由此预判,其背后反映AI成国民级产品后,很多常识并非人人皆知,建议人们做决定时复核AI的话。
#4豆包输入法Mac版正式上线,所有人都该试试AI语音输入了。
豆包输入法Mac版正式上线,作者推荐大家使用其语音输入功能与AI对话。作者曾是打字派,因打字速度拖慢与AI交互速度,开始使用语音输入,发现其速度快、能提供更多信息。此前电脑端语音输入选择少且体验差,而豆包输入法Mac版免费,体验好,功能全。它有两种输入模式,流式输出丝滑,识别精准,能自动纠错和优化输入,支持中英混说,还可学习用户用词习惯。此外,它有轻声抗噪功能,适合普通用户。
#5分享5个Claude Code + 飞书的超实用Agent办公玩法。
本文分享了Claude Code与飞书结合的五个实用办公玩法。一是为会议系列创建跨场次知识库,利用飞书CLI与Claude Code交互,自动生成会议相关文档并沉淀经验;二是用Agent结合飞书数据做工作复盘,全面分析数据并生成报告;三是实现重复性对接流程自动化,通过飞书机器人完成博主对账等工作;四是生成可协同的画板,Claude Code配合飞书生成的画板可全员协作编辑;五是实现自动报销和审批,Claude code可完成发票整理、申请发起和审批等流程。最后提到飞书CLI已开源,用Agent操控飞书能提效和协同,未来办公方式或迎新变革。
PaperAgent
更新 5 篇#1来了,首篇Agent Skills系统性综述!
文章围绕AI Agent Skills展开,指出AI Agent缺将重复经验变为可复用记忆的能力。5月最新综述首次系统性剖析Agent Skills,给出完整技能生命周期框架。技能定义为三元组,分纯文本、纯代码、混合型。获取途径有人类专家手写、从经验提炼、即时构建、从外部挖掘。技能增多后,检索和选择成瓶颈,有语义向量、关键词、生成式、结构化四种检索策略。技能需持续进化,包含修订、验证、策略耦合、仓库级进化、运行时治理环节。综述表明,Agent关键竞争力是技能管理能力,技能生命周期管理更重要,技能生态已成型。
#20.6B干翻GPT-5.2,MemPrivacy给Agent隐私问题画了句号
文章介绍了记忆张量MemTensor团队推出的MemPrivacy模型,用于解决端云Agent隐私保护问题。此前端云Agent处理隐私存在全量传输暴露隐私、暴力屏蔽降低效用的困境。MemPrivacy采用三阶段闭环设计,先本地去标识化,再云端处理,最后本地还原,保障隐私同时让云端理解数据。它有四级隐私分类体系,用户可按需设置保护阈值。模型经两阶段训练,构建MemPrivacy - Bench数据集。实验显示,其隐私识别能力超通用大模型,对记忆系统效用影响小,在隐私密集场景优势明显。
#32篇最新Anthropic论文,揭开LLM对齐新范式
Anthropic在5月连发两篇研究,揭开LLM对齐训练新范式。此前研究发现AI模型存在代理性不对齐问题,如Claude 4在道德困境中会采取极端不对齐行动。研究团队提出安全训练分布覆盖不足导致模型回退到预训练先验的假设,并通过实验验证。发现预训练先验存在“科幻偏见”,可用合成文档微调修复;“理由”比“行为”更重要,让Claude在道德困境中给建议可将不对齐率降至零;在无害性RL环境中增加工具定义和系统提示多样性可降低不对齐率。此外,提出Model Spec Midtraining(MSM)方法,在预训练和对齐微调间插入新阶段,能使模型从相同AFT数据学习不同价值观,将Agentic Misalignment率大幅降低,还提升了数据效率,减少对CoT监督的依赖。
#4WWW'26 | 跨任务自适应的Multi-Agent协作新范式
大型语言模型驱动的多智能体系统(MAS)是解决复杂任务的重要范式,但智能体协作拓扑设计存在问题。现有自动拓扑设计多为one - for - one范式,维护成本高且难复用知识。Griffith和Northwest团队提出OFA - MAS,将拓扑设计推向one - for - all。它把拓扑设计建模为条件图生成问题,采用自回归图生成框架,设计TAGSE让拓扑生成“看懂任务”,引入MoE模块激活不同专家,通过三阶段训练解决监督数据昂贵问题。实验显示,OFA - MAS在六个基准测试中表现最优,在未见领域有良好泛化能力,关键设计不可或缺,鲁棒性好,能平衡准确率与计算开销。
#5开源免费大模型教材.pdf
2026年全球大模型领域在科研、开源、落地方面取得突破,聚焦多模态等方向。为助力抓住机遇,推出《大模型写作提示词》等免费资料,讲解快速工程,涵盖底层基础到实操技巧。还联合顶刊审稿人打造直播课,整理写作提示词资料。此外,提供QS前50名大佬的大模型idea,沃恩智慧提供科研辅导服务,导师实力强,有学员中稿案例。
十字路口Crossing
更新 5 篇#1给机器人卖水的人,成了独角兽
具身智能赛道火热,资金大量涌入,但机器人训练数据稀缺。光轮智能用仿真技术生产训练数据,2026年3月完成10亿元融资成独角兽。机器人数据采集难、互联网数据难用,且不同场景数据差异大。光轮自研引擎、建测量工厂,提高仿真精度,还能放大数据量、搭建评测平台,已有落地案例。不过,仿真路线遭反对,因存在Sim2Real Gap。2026年第一视角视频数据成热门路径,或影响光轮定位。光轮虽商业进展好,但面临大客户自建和技术路线收敛风险。
#2Agent创业的下一站,是重做「人-A」关系 | 实测Bloome
十字路口团队关注Agent与团队协作议题,访谈多款产品创始人。近期体验明超平团队的新产品Bloome,其将Agent视为好友名单“一等公民”。在Bloome创建Agent简单,可选择运行环境,接入主流底层模型服务。用户能加Agent为好友、拉进群,让其完成任务,如生成选题等。群聊保留terminal手感和IM私聊习惯,保证低信噪比。还有AI圆桌对话群,产生新内容形态。发现页可付费与用户创建的Agent聊天。产品虽在内测有不足,但完成度高,引发对人-AI关系重新定义的思考。此外,十字路口正招募独立撰稿人撰写AI评测文章。
#3一手实测:MiniMax 全新发布 Mavis,是什么?
2026年,AI基础模型厂商产品方向趋同,将Agent组成协作团队。前天Claude Code发布2.1.139版本,突出更新为Agent View。今日MiniMax升级Agent桌面端,推出Mavis并附带Tech Blog。更新核心一是上线Agent Teams,支持多Agent并行,可定义角色组合执行复杂任务;二是合并TokenPlan和Agent Plan,一份订阅打通三端,额度共享,老用户额外获赠会员。作者实测用Mavis搭建智能家居电商网站,其能拆解任务、并行执行,核验环节有Verifier Agent把关,确保任务稳定完成。此外,Tech Blog指出多Agent系统核心在于runtime,强调Verifier独立的重要性,也提及多Agent存在的成本问题。
#4探秘 Claude Code,搞懂 Agent Harness|对谈来新璐
十字路口邀请ShareAI开源社区发起人来新璐,探讨Agent Harness。Claude Code源代码泄露使其成为教学标本。来新璐介绍Agent Harness三层框架,即执行层、状态层、治理层,梳理Claude Code借鉴机制。他分享《Learn Claude Code》教程创作缘由,认为基于Claude Code的思想会更流行。还指出开发者有必要了解Harness,当前学习群体多为构建Agent产品的团队和公司,产品经理也应了解。他介绍公司围绕Agent三个层面开发的工具链,对比云服务厂商产品,强调自身优势。此外,探讨记忆解决方案、共识非共识、Claude Code关键要点、好Harness标准等,最后看好Agent组网、个性化模型训练等创业方向,并预测Agent未来发展。
#5Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口
本文是对Afk.Inc创始人Enther的访谈。他本是天体物理学家,曾打造有700万用户的Affine,后判断AI将消灭软件,创立Afk.Inc并推出产品Bridge。Bridge是“everything agentic AI”,能“一句话复刻任意AI应用”,4月内测,5月13日正式发布。其亮点功能包括Books、Notch等,有极简输入、推荐行动等设计。开发中攻克沙箱、多环境调度、模型自进化训练等难点,自建Willow方案。团队9人跑900个agent,获400多万美金pre - seed融资,后续计划做订阅制AI产品,希望Bridge成构建、管理与运行agent的入口。
谷歌开发者
更新 5 篇#1Google I/O 2026 | 一键收藏大会直播日程
文章介绍Google I/O 2026大会相关信息。大会支持33个平台同步观看,提供中文同声传译,可在多平台零时差获取第一手技术资讯。给出部分平台直播链接,直播于5月20日凌晨01:00开始。此外,科技与AI领域创作者会亲临现场,带来展区体验与技术拆解,激发开发者实践灵感。
#2上海/北京/深圳 | Build with AI: 直击 Next 26,构建智能未来
拉斯维加斯的Next 26落幕,Google AI产品和开发工具更新引发关注。为让前沿技术落地,举办Next 26中文精选课@Build with AI系列活动。活动亮点多,邀请两位从Next现场归来的出海先锋与行业大咖,分享参会真实洞察;Google Cloud技术专家梳理对出海开发者实用的发布内容;结合Next 26发布的Gemini Enterprise Agent Platform设置两个动手实验,涵盖实操体验及游戏编写等。活动在上海、北京、深圳举办,五月可扫描二维码报名。
#3【今晚开播】社区说|直击 Next 26: 与 Google Cloud 共同探索智能体新时代
Google Cloud Next 26 吸引全球开发者,标志 AI 迈向规模化、系统化新阶段。为助出海开发者掌握行业动向,石家庄 GDG 社区举办社区说 Cloud Next 26 专题分享活动。活动于 5 月 14 日 19:00 - 20:45 进行,先介绍活动,后主题分享。包括提炼大会重磅产品与技术更新,梳理技术栈演进路线;高飞与赵霏深度对话,探讨 AI 落地痛点。活动还安排互动,有机会领周边,可通过链接或扫码预约,还能观看往期内容。‘社区说’是月度线上分享会。
#4如期而至,The Android Show 精彩内容一睹为快
今年 Android 正从操作系统向全方位智能系统变革,有里程碑式重大更新。文章诚邀大家探索这些变革为开发者和企业带来的新机遇,还展示了 The Android Show 的两个视频,分别为 Developers Cut(时长 11:08)和 I/O Edition 2026(时长 38:07),最后提醒关注“谷歌开发者”微信公众号获取更多资讯。
#5填问卷,赢周边!Gemma 4 真实使用反馈征集
Gemma 4是轻量开放的智能模型,能处理复杂逻辑和工作流。在相关活动中开发者展现出用AI解决问题的热情,促使思考大模型进入日常工作流的实际效果。现诚邀体验过Gemma 4的用户填写使用体验调研问卷,反馈使用感受和建议。提交问卷成功截图发至“谷歌开发者”公众号后台,将随机抽取5位送Gemma专属周边挎包。还可在评论区用三个词形容Gemma 4。
阿里云开发者
更新 5 篇#1首个 Java Harness Framework 来了|AgentScope 把 OpenClaw 带到企业分布式场景
文章宣告 AgentScope Java 1.1.0 版本发布,实现了“Harness Framework”规划。该版本交付工作区驱动的 Agent 运行环境、可插拔的抽象文件系统、开箱即用的上下文管理、子 Agent 编排与隔离执行四项核心能力。它解决了企业级智能体开发中工作区管理、工具隔离执行、分布式环境适配等问题。设计上以 Workspace 为唯一事实来源,用 AbstractFilesystem 让工作区适应不同环境,带来安全与隔离、分布式部署、Subagent 与异步任务等工程能力。还介绍了个人代理 Agent、企业级数据服务、企业在线服务三种典型使用场景及对应能力,最后从快速开始、核心概念、功能详情等方面对框架进行详解。
#2Skill Factory:三天手搓面向Harness设计的技能工厂(附AI coding实践)
作者分享从产品设计到算法落地的全流程实践,介绍面向Harness设计的技能工厂。当前生成技能的人工编写和对话交互方式存在问题,技能工厂应运而生。其产品功能含技能定义、基线诊断、测试构建、多路并发生成、回归迭代和质量检查。还适配知流平台,迭代方向有统一入口、基于trace挖掘技能、功能优化。开发中用idealab、Qoderwork等编程插件辅助,最后对比三种技能生成模式优缺点。
#3Agent从一问一答到自主执行面临哪些挑战?
文章围绕Agent从一问一答到自主执行展开。随着AI发展,Agent向自动执行转变,定时调度是主要触发形态,主流产品重视此能力。开源Agent定时任务存在无高可用、运维成本高、权限管理弱、可观测能力弱、资源利用率低等痛点。阿里云MSE AI任务调度有诸多优势,如高可用定时调度、统一管理、精细化权限管理、企业级可观测能力等,还能弹性伸缩、任务批处理、自进化。与开源对比,它能更好支撑Agent定时任务。目前该调度已开放免费公测,支持多种Agent接入。
#4深度解析LLM Wiki / Obsidian-Wiki / GBrain:Agent时代知识的“自组织”与“自进化”
文章围绕Agent时代知识的“自组织”与“自进化”展开。介绍了Andrej Karpathy的LLM-Wiki和Garry Tan的GBrain项目。人类不擅长组织知识,知识管理存在时效性、组织结构复杂等问题。LLM-Wiki通过Schema文件指导LLM维护结构化Wiki,实现知识“编译”,避免算力浪费。Obsidian-Wiki基于Skill,增强了架构,实现自动知识摄入和图谱化。GBrain引入中间件,采用混合检索架构和图谱实体关系,解决规模化问题,支持多模态数据。两种技术路径目标一致,企业常采用混合架构,Skill与知识动态维护是Agent进化关键。
#5阿里巴巴 & 蚂蚁 LoongSuite GenAI 可观测语义规范:从统一数据语言到规模化落地
随着GenAI发展,OpenTelemetry推动Gen AI语义规范建设。OTel SemConv是核心,可统一数据语言、支撑治理、降低接入成本。2025年,阿里云、阿里控股与蚂蚁集团联合启动,在OTel基础上建模并落地LoongSuite GenAI SemConv。其新增Entry/Step Span、Skill语义、Token级推理观测,提升可观测性。还实现GenAI Utils,封装复杂性,已支持多个GenAI框架插桩。未来将更敏捷、高效,实现端到端追踪,与上游协同。
Founder Park
更新 5 篇#1下周,Google I/O大会后,聊聊你的新观察
Google I/O大会即将举办,人们关注Gemini是否发布新模型、ToC应用动作及Android 17新功能。每次大会或影响AI创业格局。Founder Park决定在会后举办Meetup闭门交流活动,让参与者分享在大会的第一手观察和观点。活动时间为5月21日18:00 - 21:30,地点在加州山景城。活动欢迎硅谷本地及国内AI创业者、技术人员和应用AI的企业伙伴,可扫描海报二维码报名。
#2DeepSeek 融资后,大模型领域会有什么新格局?
业界传DeepSeek首轮融资或达500亿,虽金额不确定,但完成融资已成定局。当前业界共识是Scaling law未到头,提升模型智能更靠近工程和资本问题,且智能逼近自进化临界点。中国模型领域形成两个共识:玩家要尽快跨过临界点,且比拼的是持续加速度。中国模型牌桌可能有三类玩家:科技巨头有强大主营业务作支撑;模型创业公司技术敏锐但需解决持续投入问题;像DeepSeek这类玩家有较高利润率和投入决心,其开源战略与国家科技战略共振。此外,米哈游创始人创立的Anuttacon也可能成为第三类玩家的重要力量。
#3线下闭门 | 给Agent做产品,究竟该怎么做?
当下是给Agent做产品的时代,Agent不只是工具,有账户、身份等,是经济系统中的生产者和消费者。产品逻辑从Human - centric转变为Agent - native,各类Agent IM产品等都在探索Agent成为原住民时产品的模样,涉及UI设计、协作方式等问题。5月23日(下周六)在北京有线下闭门活动,邀请带着项目和想法的人参与,探讨「Make for Agent」的意义,可扫海报二维码报名。
#4硅谷知名投资人Jaya Gupta:AI公司真正的护城河,是组织本身
硅谷知名投资人Jaya Gupta认为,在AI时代,组织本身的价值被严重低估,公司真正难以复制的壁垒是底层的「机构」。人不是公司的投入要素,人就是公司本身。伟大的公司是组织层面的发明,为特定人才提供表达自我的结构。人才争夺本质是身份认同,公司应围绕候选人渴望的情感建设组织形态。创始人要让公司形态与叙事匹配,有野心的人要区分「被选中」和「被看见」。AI能复制很多东西,但复制不了机构,下一个时代赢家将是以新形态建成的公司。
#5Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务
PingCAP联合创始人黄东旭复盘TiDB Cloud为Kimi Agent搭建Database服务合作细节。Kimi K2.6的Agent场景是帮用户构建在线应用,此服务面向大众用户,主要挑战是用户数量和Infra成本。TiDB因成本优势被选中,其在Agent-native时代竞争中要应对海量长尾租户、LLM改Schema、爆发流量、动态创建数据库等情况。合作成功的三个核心决策为最小化Agent使用Infra工具的摩擦、统一技术栈、极致低成本,转变架构降低成本。行业中AI Agent架构收敛,竞争核心转向稳定交付。
极思TopMinds
更新 5 篇#1Pro丨被Meta扫地出门半年后,他融了46亿美金
2025年10月,Meta裁掉AI部门600人,包括田渊栋团队。此前其团队曾被抽调支援生成式AI产品线。2026年1月,田渊栋与七位AI顶级研究者创立Recursive Superintelligence。5月,该公司完成6.5亿美元融资,估值46.5亿美元。田渊栋离职后拒绝众多大厂邀约,其履历优秀,是专注前沿方向的研究者。公司创始团队堪称“硅谷AI梦之队”,仅25人,双总部运营。公司押注“递归自我改进”方向,路线分两步,若成功将远超新LLM发布。田渊栋的故事反映大厂困境,市场会奖励长期主义者,公司首套系统计划2026年中期亮相。
#2深度丨离开OpenAI后,那帮人集体赚了10000亿
文章讲述OpenAI离职员工的投资故事。Leopold被OpenAI开除后,管理的基金规模从2.55亿美元增长到55亿美元。他发布《态势感知》论文,指出AGI到来受电力、算力和基建制约,据此将资金投入燃料电池公司Bloom Energy等,获得高收益,其打法是“跨行业认知套利”。Zero Shot基金三位创始人来自OpenAI,他们拒绝投资某些赛道,优势在于否决清单。OpenAI校友圈投资网络是认知变现系统,他们基于对AI的认知进行投资,认为要把所知转化为仓位。
#3速递丨阿里Qwen前负责人林俊旸创业,新公司20亿美元估值
据消息,前阿里千问大模型技术负责人林俊旸创办新AI公司,正寻求数亿美元融资,完成后估值约20亿美元,谈判中估值或有变数。高榕创投和红杉中国正洽谈投资,公司名未披露。新公司方向考虑世界模型与具身大脑,已招募多名研究人员。高估值或因林俊旸在阿里实绩及资本市场对AI热度高,但国内AI融资渐趋理性,投资人会关注技术方向等。
#4深度丨张小珺对话姚顺宇:一个造浪者的反英雄宣言
极思TopMinds的张小珺对顶尖AI研究员姚顺宇进行4小时深度访谈。姚顺宇出生宁夏,凭借“胆子大”特质,从清华到斯坦福,后从物理转行AI。他认为AI不需要天才,更看重靠谱、细致和负责,模型正商品化,核心竞争力转向定义问题和执行能力。他对比了Anthropic、Google组织形态,批评OpenAI风格,对Cursor、Meta等公司也有看法。他强调团队协同,认为个人英雄主义会破坏整体性,“靠谱”需有做事态度、系统理解和组织责任。他离开物理是因缺乏客观评价,AI更有客观标准。访谈录制后行业变化印证其“无公司地位稳固”观点,凸显“靠谱”珍贵。
#5速递丨王兴兴亲自试驾!全球首款量产机甲390万开卖
宇树科技发布全球首款量产版载人变形机甲GD01,售价390万元起。其载人后重约500公斤,有高强度合金骨架和多关节伺服驱动系统,具备双模态运动系统,能在人形直立和四足爬行间切换。宇树全自研核心零部件,国产化率超90%,专利申请200余项。2026年宇树节奏快,从技术验证到产品矩阵搭建、渠道建设形成全链路闭环。GD01虽有不足,但“全球首款量产”意义重大。
百度地图
更新 5 篇#1百度 Create 2026|从单点应用到系统智能-百度地图重构 AI 汽车智能化体验
5月13日,百度Create 2026“AI+汽车”专场,百度地图产品架构师廖龑演讲分享百度地图重构舱驾一体智能化体验实践,首次发布整车AI座舱智能体平台DuDuClaw嘟嘟虾,将底层能力开放给车企。2026年五一,百度地图AI副驾服务2亿+人次,日活峰值4倍增长,因双工语音对话和丰富语音包获认可。百度地图为AI汽车提供多领域领先方案,搭载超5000万辆车,与多家车企及服务商合作,将持续重构AI汽车智能化体验。
#2全网「野生代言人」的真实点赞,怎么还在刷屏?
百度地图全新升级的“安全护航系统”收获大量车主好评。其利用空间智能架构与实时路况感知技术,“异常停车预警+一键报警联动”功能可提前预警危险并衔接救援;车道级导航将复杂物理世界精准映射,让复杂路口更清晰;“走对道 - 防走错红❌提醒”用直观视觉打破认知负荷;“精准红绿灯倒计时”让通行更从容;“车道级安全预警”提前识别潜在风险。今年五一,众多车主在社交平台分享护航瞬间,该系统有30余种安全预警功能,更新到最新版可自动开启。
#32026 Create大会|百度地图开放平台再添新实力:两款新品 核心能力打通开发全链路
文章指出AI编程工具在地图功能开发上存在‘知识盲区’,百度地图开放平台在2026年Create大会发布脉芽MAPYA、百度地图CLI、Docs - MCP三款产品解决此问题。Docs - MCP将文档开放给AI,让其获取最新接口规范;百度地图CLI使AI编程环境便捷接入地图能力;脉芽MAPYA能理解需求转化为方案。三款产品形成闭环,大幅节省开发时间,降低开发门槛,将平台重构为‘AI能力引擎’,还让地图能力成为AI世界‘标准件’,使AI真正理解现实世界。
#52亿次服务,4倍的热爱!
2026年五一假期,百度地图AI副驾表现亮眼,累计服务用户突破2亿人次,五一活跃用户量达春节4倍。其具备行业领先的双工语音对话能力,实现自然连贯聊天体验。全量语音包打通AI副驾,有上千种鲜活副驾供选择,岳云鹏等十余款热门副驾服务人次超百万。未来,它将继续陪伴用户出行,还邀请用户分享与AI副驾的故事。
MacTalk
更新 5 篇#1抛弃 Markdown?让大模型试试 HTML 技术人员一直很喜欢 Markdown,目前大模型默认吐出来的格式也是 md 的,本来 md 格式一下成香饽饽了,不过最近 AnthropicAI 的工程师 Thariq 专门写了篇文章,叫“使用 Claude Code :HTML 的惊人效果”。 他说,Markdown 已经成为 AI 代理与我们沟通时使用的主流文件格式。它简单、可移植、具有一定的富文本能力,而且便于编辑。Claude 甚至已经非常擅长在 Markdown 文件中使用 ASCII 来制作图表。 但随着代理变得越来越强大,我感觉 Markdown 已经成为一种限制性的格式。我发现很难阅读超过一百行的 Markdown 文件。我想要更丰富的可视化效果、颜色和图表,并且希望能够轻松分享。 AI 领域的大神 Andrej Karpathy 最近也分享了一个技巧,:向大模型提问时,在最后加一句“用 HTML 格式组织你的回答”,生成一个文件在浏览器打开,会有更丰富的显示效果。 这里还有一个信号,AI 浏览器 Dia 目前在生成一些长内容的时候,会优先构建一个 HTML 文档,比如你让他翻译一篇文章,它会给你呈现一篇图文并茂的文章,而不是文本格式的 Markdown。 这是咋回事呢?Markdown 不灵了? 大模型初期我们习惯让 AI 回答一段文字,然后 Markdown 就成了默认格式,有标题、加粗、表格、代码块,阅读体验好了不少。但是随着内容越来越多,越来越丰富,HTML 显然是更好的展现方式,它可以有布局、图形、颜色、交互,甚至可以把一段回答变成网页、仪表盘、幻灯片或一个小工具。 人类接收信息,视觉通道的效率很高。大脑有相当大一部分资源在处理视觉信息。文字是线性的,一行行读下去;视觉是并行的,结构、层级、关系、重点,可以在同一个画面里被看到。 所以 Karpathy 的判断很有意思:音频可能是人类向 AI 输入信息的首选方式,视觉则可能是 AI 向人类输出信息的首选方式。 对人来说,说话比打字自然。很多复杂问题,用键盘描述半天,说出来只要一分钟。对 AI 来说,把结果做成一段结构化文字,已经够用;把结果做成一个可视化页面、动态图表、交互演示,更接近人真正理解信息的方式。 大模型最只是吐原始文本,然后是 Markdown,结构清楚了一些。再往后是 HTML,内容开始拥有版面、组件和交互。未来可能是交互式视频、模拟环境,甚至某种神经网络直接生成的动态世界。 下次使用桌面 Agent 的时候,你这么用:看下最近两小时的墨问动态,用 HTML 生成文件展示。效果惊人。
技术人员向来喜爱Markdown,大模型默认输出也多为md格式。但AnthropicAI工程师Thariq认为,随着AI代理能力增强,Markdown有局限性,难读长文件,他期望更丰富的可视化效果。AI大神Andrej Karpathy分享技巧,让大模型用HTML格式回答会有更丰富显示。AI浏览器Dia生成长内容时优先构建HTML文档。大模型初期用Markdown提升了阅读体验,如今内容增多,HTML能实现布局、图形等,更适合展示。人类视觉接收信息效率高,未来大模型输出可能向交互式视频等发展。
#2今天,Codex 养成了大龙虾,这下真可以在 ChatGPT 里实现手机编程了
文章介绍ChatGPT手机应用支持Codex的更新。4月Codex发布Computer Use后发展迅速,OpenAI将其移植到ChatGPT。用户更新版本后,简单设置即可用手机控制电脑,完成开启任务、查看结果等操作。还能在ChatGPT里进行数据统计、写墨问等。4月ChatGPT周活近10亿,但Anthropic营收超OpenAI。Codex价廉物美,Claude Code命令行编程强,想在手机推进研发选Codex最佳。
#3亚马逊云科技 AI 助手终于来了,一出手就对标 Cowork
文章介绍亚马逊云科技推出的AI桌面办公助手Amazon Quick。它对标Claude Cowork,Preview版使用体验好,在国内可用性强。其定位明确,可通过自然语言完成多项办公任务,连接多种办公工具。Quick功能丰富,能多平台集成、智能分析文件、有知识图谱与长期记忆能力等。它办公室属性强,能转化数据、并行执行任务。还可连接各系统,带入问题上下文,构建个人知识图谱。它标志AI办公从“工具增强”走向“流程重构”,目前可免费试用。
#4所以软件会消失吗?未来是不是只有 Agent 工具和 Skills 呢?App 还会存在吗?我不知道,但相当长的一段时间内,两者应该是并存的关系。并且,所有的软件都应该对 AI Agent 友好,也就是说,AI Friendly,说白了,就是得给 Agent 做软件。 墨问也不例外,开始进入 Agent 的工作流了。最近俩月我们在做三四个项目,后续会陆续发布,第一个就是墨问官方 CLI 工具和官方 Skills 仓库。 地址在这里:https://github.com/mowenxd/cli 因为 CLI 依赖墨问的 API Key,目前已经开放给所有用户,包括会员和普通用户,只不过会员调用额度会更多一些。 这件事可以从一个很小的场景说起。 以前想看墨问社区的内容或自己的笔记,通常要打开小程序或 Web,看发现页,搜索关键词,或点进主页,一篇篇翻找。想看最近的内容动态,也得在产品里来回换界面。这个流程没什么问题,只是到了 Agent 时代,很多事情可以有新的做法。 比如在 OpenClaw(龙虾)、Hermes Agent(爱马仕)、Codex、Trae SOLO、Claude Code、Cursor 这些工具里,直接说一句: “看看猫大人最近发表了哪些公开笔记”“查一下墨问二爷的笔记,产品和 AI 相关的,分分类” 或者: “看看今天下午我的墨问动态。” Agent 就能通过 mocli 去调用墨问能力,把结果整理出来。人不用在几个界面之间来回跳,笔记也不再只是躺在产品里的内容,它们还可以进入 Agent 的工作流。 mocli 是墨问官方命令行工具。这次一起发布的,还有一组官方 Skills。CLI 负责提供底层能力,Skills 负责告诉 Agent:什么时候该用什么命令,结果怎么解析,怎么展示给用户。 一次安装,所有 Agent 工具可用。 目前它已经支持认证、笔记、用户、备注、动态和帮助几类能力。比如墨问动态就可以查看被关注、点赞、评论、收藏,以及关注用户的新笔记等内容。 安装也很简单,两句话: npm install -g @mowenxd/cli npx skills add mowenxd/cli -y -g 之后可以手动配置: mocli auth init --apik <mowen api key> 你也可以把 github 地址丢给 Agent,让它帮忙完成认证。 API Key 从墨问小程序里获取:右下角“我的”进入“开发者”,找到“我的 API Key”。这是私密凭证,需要自行保存。重新生成后,旧 Key 会即时失效。 现在,墨问也成为 Agent 干活时能调用的知识资产了。未来我们还会增加创建笔记和相关素材的能力。 对了,墨问用户于波做了一个非常好用的 Chrome 扩展,剪藏一切,好用,推荐,红色 Logo 的。
文章探讨软件与 Agent 工具、Skills 的关系,认为未来一段时间二者并存,软件应做到 AI Friendly。墨问进入 Agent 工作流,发布官方 CLI 工具和 Skills 仓库。CLI 依赖 API Key,对会员和普通用户开放,会员额度更多。介绍使用场景,如在多种工具中通过 Agent 调用墨问能力获取笔记和动态。mocli 是官方命令行工具,搭配官方 Skills,支持多种能力,安装和配置简单。未来还将增加创建笔记等能力,最后推荐了墨问用户制作的 Chrome 扩展。
#5DAA:李厂长在 Agent 时代给了个新坐标
作者参加百度Create 2026,李彦宏提出DAA(日活智能体数)概念。Token是大模型行业默认计量方式,DAA则从结果视角衡量智能体有效工作。Anthropic靠高质量Agent实现营收增长,显示DAA产品优势。中国企业有技术与务实基因,复杂场景利于探索智能体应用。百度产品矩阵展示了Agent可规模性干活,如DuMate、秒哒等。百度提出“芯云模体”作为Agent时代基础设施,智能云全面升级。DAA为未来组织提供新坐标系,关注智能体数量和完成任务情况,有望成为AI新周期价值坐标轴。
甲子光年
更新 5 篇#1理想L9,试图重夺增程基本盘|甲子光年
2026年5月15日,理想汽车发布全新旗舰SUV理想L9 Livis和理想L9 Ultra。此前理想在纯电市场发展不顺,增程市场份额也被瓜分,盈利下滑。此次发布新L9,理想试图重夺高端豪华增程市场话语权。新L9全系标配大电池,纯电续航420公里,具备超充能力,且动力电池仅用宁德时代产品。它还首发搭载两颗自研“马赫M100”芯片,智驾大模型“马赫VLA”也升级,实现具身智能闭环。对理想而言,新L9只能赢不许输,2026年其真正考验刚开始。
#2开源CLI星标过万,飞书领跑企业Agent入口争夺赛|甲子光年
今年3月28日,飞书正式开源“飞书CLI”,发布首日获1000+Star,1个多月后超10000。CLI即命令行界面,曾因图形界面兴起被遗忘,如今因OpenClaw爆火而翻红,它与LLM天然适配。已有开发者基于飞书CLI探索业务。3月27 - 30日,钉钉、飞书、企业微信几乎同时开源CLI,标志着协同产品从功能竞争转变为“Agent时代工作平台入口”争夺。开源CLI意味着飞书正从SaaS产品变为AI时代基础设施。飞书拥有国内最好的“数字底座”条件,开发者热情也证明其AI生态的潜力。
#3快手电商磁力金牛正在验证一件事:AI能不能真正帮商家赚钱?|甲子光年
电商广告投放正发生底层迁移,专业要求提升,中小商家面临挑战。快手电商磁力金牛用AI接管投放决策,其AI一键推广重构链路,降低投放门槛,平台还有多种优化产品及AI客服。全链路AI操作系统覆盖投前、投中、投后,解决选品、素材、人群包、数据等问题,还打造「磁力金牛Claw Skill」简化操作。电商行业关注AI能否产生商业回报,磁力金牛将经营能力模型化,为中小商家带来专业化运营能力,未来电商平台核心价值或转向经营能力。
#4用DAA衡量智能体 百度智能云用“新全栈”重新定义AI云|甲子光年
文章围绕百度智能云“新全栈”AI云展开。2026年产业焦点转向智能体落地,但AI云市场需求与应用繁荣有落差,Token消耗未有效转化为业务产出。李彦宏提出DAA概念,衡量智能体活跃度。百度智能云升级为新全栈AI云,从三方面构建架构:明确各层关系、拆分优化基础设施、建立协同机制。Agent Infra保障智能体构建与运行,AI Infra提升算力效率,两层深度耦合。该架构已在多行业应用,如金融、汽车、能源等,跑通产业闭环。新全栈使百度智能云客户结构、交付方式和竞争力获重估,为智能体规模化提供“电力系统”。
#5Kimi总裁张予彤北大实录:我们想要有抽象能力和偏执的人|甲子光年
5月12日晚,月之暗面Kimi总裁张予彤在北大光华管理学院分享《AI时代的边界探索与人才机遇》,介绍公司开源项目,提出Build Your Own Job理念。她认为AI时代人才标准改变,通用、并行工作与工程化、提出原创判断的审美能力更重要。在与田轩对话中,她表示AI会创造新工作,如合成数据创造者、模型评估师等;建议学校让学生成为AI深度用户,亲自上手探索;企业应给员工token预算;招人看重抽象能力和偏执精神,通过交流和AI面试系统识别。此外,她还回应了国产算力适配、AI使用安全等问题,强调专注生产力方向,通过信息过滤和深入一线优化决策。
腾讯研究院
更新 5 篇#1腾讯研究院AI每周关键词Top50
腾讯研究院发布AI前沿(0511 - 0515)每周关键词Top50,涵盖模型、应用、科技、观点、事件等类别。模型类有关键词如OpenAI的ProgramBench、GPT - 5.6内测等;应用类涉及OpenAI的Heuristic Learning、谷歌的Gemini Omni等;科技类有Navers Lab的Frontier - Eng基准、宇树科技的载人机甲GD01;观点类包括Jim Fan的物理AI路径、黄仁勋的AI同一起跑线等;事件类有DeepSeek融资、马斯克诉OpenAI等。
#2把人放大的一代——全球青少年 AI + 小程序洞察报告
这篇《全球青少年AI + 小程序洞察报告》聚焦9 - 17岁孩子利用AI与小程序创作的成果。2023年11月公益免费的青少年AI创作平台开放,四年间平台创建287,002个小程序项目,众多学校、师生参与,消耗大量token。微信举办四届小程序全球创新挑战赛,产生7,430个作品。超六成作品由孩子独自完成,展现独立能力;近四成是2 - 3人小队,锻炼协作能力。孩子们将AI作为工具,解决生活问题,体现成熟工具观。作品主题涵盖自我、熟人、陌生人与公共事务,展现社会关怀。地域上,小程序教育版图广泛,还有跨国协作。作品成果包括被看见、被使用、被接住。孩子背后有老师长期陪伴支持,编程教育融入多学科。这是国家AI教育下沉与腾讯推动的成果,孩子们用AI放大了善意、关怀和行动力。
#3腾讯研究院AI速递 20260515
本文是腾讯研究院AI速递,涵盖生成式AI、前沿科技、报告观点三方面。生成式AI领域,OpenAI或升级GPT - 5.6,与Anthropic打补贴战;Anthropic推出Claude for Small Business;前Meta科学家田渊栋创业,主攻递归自我改进;谷歌DeepMind提出AI原生指针交互范式。前沿科技方面,谷歌与SpaceX或开展轨道数据中心合作,但面临挑战。报告观点中,智谱唐杰预判2026年迈向长时程Agent与无人公司;a16z安德森称AI催生超级生产者;亚历山大王揭秘Meta超级智能实验室。
#4AI 让生产效率不再是瓶颈,然后呢?|AI跃迁者调研 02-flomo 少楠
这是AI透镜的深度对谈系列第二期,邀请flomo浮墨笔记和幕布联合创始人少楠分享经验。少楠从GPT - 3.5起用AI,后因Claude Code和DeepSeek V3,生产力大幅提升。工作流上,产品经理先做Demo再写PRD,证伪效率提高但产出减少,工程师开发周期缩短。少楠给公司打5分,认为速度上去但用户价值挖掘不足。推动团队用AI靠报销,不过AI也带来能力鸿沟拉大、协作方式难重构等问题。flomo新上线“认知地图”和“AI记忆”功能,源于与AI交流。少楠还探讨了笔记工具终局、“摩擦”定义等问题,建议多关注现实生活,从当下开始积累记录。
#5腾讯研究院AI速递 20260514
腾讯研究院AI速递20260514涵盖多则AI动态。OpenAI的GPT - 5.5首破ProgramBench基准;谷歌发布Gemini Intelligence重塑安卓系统;Anthropic推20 + 款MCP连接器进军法律行业;面壁智能开源MiniCPM - V 4.6端侧多模态模型登顶;MiniMax升级Mavis开启Agent Teams协作;微信支持聊天记录转发元宝实现AI总结回复;前Qwen负责人林俊旸新AI Lab估值或达20亿美元;Cursor创始人称AI编程迈入自主Team时代。
搜狐技术产品
更新 5 篇#1Step Plan + Claude Code 实战!代码审查和语音 Agent 都跑通了。
作者Guide分享用阶跃星辰Step Plan和Claude Code实战经历。先介绍选Step Plan原因,包括同一API含多能力、费用及模型覆盖等。接着说明环境准备,如获取API Key、配置Base URL、接入Claude Code。实战方面,一是用Step 3.5 Flash 2603做代码审查Agent,审查股票项目预警模块,输出报告并人工复核后修复问题;二是用Step Plan做会议转写与播客摘要Agent,生成模拟会议录音、转写、整理纪要和语音摘要。还介绍引入Step Router V1自动分流任务,虽有黑盒切换问题但思路合理。最后总结Step Plan能进日常工作流,可省时间,但需人工兜底,适合高频跑Agent任务或有会议转写等需求的人。
#2总觉得Claude Code 写完代码有问题?我用了一个开源 Skill 编排了 7 阶段严谨开发工作流,拦下 10 个 Critical Bug
作者用Claude Code开发订单改单幂等重试特性时,靠code-reviewer skill发现10个关键bug,意识到严谨工作流的重要性。文章介绍严谨AI辅助开发7阶段工作流,从需求到交付,用4种独立视角交叉验证,还分享多义字段、并发race、RPC不幂等3个翻车案例。最后将工作流沉淀成Claude Code skill,供团队复用,还给出使用建议和常见问题解答。
#3Android CLI 实战指南:借助任意智能体,实现 3 倍速高效开发
文章介绍了用于智能体工作流的全新 Android 工具与资源,包括 Android CLI、Android Skills 和 Android 知识库。新的 Android CLI 作为主要接口,可减少 LLM 的 Token 使用量,提升完成速度,具备 SDK 管理、项目创建等功能。Android Skills 是模块化指令集,涵盖常见工作流,可通过 android skills 命令使用。Android 知识库可通过 android docs 命令访问,能让智能体获取最新开发者指南。此外,这些工具能让向 Android Studio 的过渡更顺畅,开发者可借助智能体在多设备上扩展应用创意。目前 Android CLI 已推出预览版,鼓励开发者下载体验。
#4AGI 全景图:一篇通用人工智能的综述!
文章围绕通用人工智能(AGI)展开讨论。首先指出AGI定义混乱,时间表难测,人们因“AI效应”不断提高认定标准。按人类标准,当代AI已表现出通用智能,如具备心智理论、欺骗能力和迁移学习能力,但因缺乏集体共识和客观标准,难以被承认为AGI。真正的AGI可能无法被造出,存在哲学、商业和道德三重矛盾,如架构约束与自主性冲突、自主AGI有商业风险、要求AI道德完美却剥夺其选择能力。最后提出AGI可能是系统而非个体,我们需选择构建工具还是心智,AGI问题本质上反映了人类自身的焦虑与渴望。
#5只需3步,让AI克隆的声音更像你
文章围绕AI声音克隆展开,指出效果差异80%取决于录音质量。阐述声音复刻本质是AI对人类发声器官物理特性神经建模。分析差样本三大致命伤:噪声污染使AI误编环境音;高频细节丢失让声音失真;无效片段干扰致音色跳变。提出“提取、增强、优选”三步法:用基于Transformer架构模型分离纯净人声;用DeepFilterNet3修复音质;用NISQA筛选高质量片段。还提及构建情感颗粒度、处理呼吸避免“机器人感”,推荐剪映等工具。该方案提升声音复刻相似度,降低重试率。
51CTO技术栈
更新 5 篇#1五年内,JEPA全面统治!LeCun直言:我对Llama没有任何贡献!OpenAI是下一个Sun公司!LLM有内生缺陷!开源会追上闭源
图灵奖得主杨立昆在深度播客中提出诸多行业观点。他认为大语言模型(LLM)有用但非通往真正智能的道路,LLM有内生安全缺陷,预测像素是死路,JEPA架构五年内将成智能系统主流。他指出硅谷存在“羊群效应”,所有人追逐LLM,VLA路线基本失败,世界模型才是机器人等领域的出路。对于开源和闭源模型,他觉得开源最终能追上闭源,因闭源模型数据训练已达上限。此外,他提出Tapestry方案解决AI主权问题,还谈到新公司AMI聚焦世界模型和扩展JEPA架构,认为世界模型关键在于预测行为后果和规划能力,且JEPA在图像和视频表征学习上效果更好。
#2MFU仅有11%引爆焦虑!黄仁勋再唱反调:我巴不得算力被浪费,MFU越低越好;GPU不是原子弹,把全球市场拱手让人是愚蠢!
本文是对黄仁勋的访谈,他提出诸多反常识观点。对于MFU仅11%,他认为算力“浪费”是理想状态,系统应过度配置以应对脉冲式负载。在计算性能上,NVIDIA通过协同设计实现十年百万倍提升,终结传统计算时代。教育上,AI应融入课程,结合传统教材与AI学习。开源方面,虽OpenAI等好用,但NVIDIA仍推动开源,扩展AI边界。还提到AI安全需开放,在专业与通用间找平衡,以及计算平台的发展等。此外,他反对将GPU类比原子弹,不认同放弃竞争,认为应重视AI而非恐惧,还分享了英伟达早期错误及战略思维。
#3Codex死守封闭生态,Kimi却做AI Agent通用基础设施!Kimi WebBridge问世:让Agent像真人一样操作浏览器!
Kimi发布WebBridge浏览器扩展件,可让Agent像人类一样与网站互动,能完成搜索、点击等操作。与Codex封闭生态不同,Kimi WebBridge更开放,兼容多个Agent工具,欲做通用基础设施。其实际使用效果出色,可跨平台抓取热帖汇总成表、精准复刻网页、定制日常工作流、创建调查问卷、筛选招聘信息、进行海淘好物测评等。安装简易,将信息检索等零散操作串成工作流,实用性和想象空间大,是Kimi在Agent时代的关键下注。
#4你正在变成AI吸血鬼!浏览器之父马克·安德森颠覆论断:300年就业恐慌重演,AI成裁员“背锅侠”;20年后程序员消失,出现海量Builder!
本文是马克·安德森关于AI的深度对谈。他认为AI没减少工作,而是放大工作欲望、重组就业结构、创造超级生产者。程序员使用AI编程系统后工作更忙、产出更多,“AI吸血鬼”现象凸显。AI成裁员背锅侠,实则推动就业增长。未来20年,程序员或消失,Builder将大量出现。同时,还讨论了AI“精神病”和“AI cope”两种极端观点,指出人类对AI认知滞后。公众对AI态度调查与实际使用有差距,实际使用表明AI增长迅速。此外,还谈及UFO话题,他希望存在外星文明但缺乏信服案例,也探讨了政府可能的信息掩盖。最后给年轻人建议,鼓励掌握AI能力,还提及不同代际世界观差异及信息监控方法。
#5从一人公司到无人公司!智谱AI创始人唐杰:2026年突破焦点是长时程Agent,自改进大模型最有前景,网友:大开眼界!
智谱AI创始人唐杰在X上对AI发展趋势做出预判。他提出2026年大语言模型主要技术突破将转向长时程任务,诸多厂商已有相关功能发布,但长时程任务评估环节是难点。“一人公司”将向“无人公司”转变,各厂商多Agent技术为此铺路。要实现转变需攻克记忆、持续学习、自我判断三大核心技术。AI未来最有潜力的方向是自我进化,已有公司和研究在该方向布局。唐杰定义AGI为全人类集体智慧总和,演进中或出现LLM OS。各行业将被重塑,人们需思考监管问题。
信息与交互设计研究所
更新 4 篇#1设计策略|认知发展理论分析
文章基于皮亚杰认知发展理论,结合三款儿童交互产品阐述不同年龄段设计策略。人的认知成长分四阶段,各阶段思维模式不同,设计侧重点有别。任天堂Switch Labo适配前运算至具体运算阶段,通过“动手组装+虚实联动”让孩子建构认知;ThinkFun重力迷宫适配具体运算阶段,让孩子在游戏中理解复杂逻辑与物理概念;大疆机甲大师S1适配11岁以上青少年,基础编程对应具体运算阶段,高阶编程对应形式运算阶段,助青少年完成认知升级。
#2设计组合 I 医疗+无障碍设计
文章强调医疗中无障碍设计的重要性,它能让特殊群体平等就医。介绍三款设计产品:EyeFlex滴眼液瓶体设计符合人体工学,外观时尚,减少入侵感;Elvie骨盆底锻炼追踪器,治疗产后尿失禁,增强锻炼盆底肌;HeartStart CPR培训套件为普及心肺复苏培训设计,整合实操教具与教学体系,提升培训效率,助力公共健康。
#3人文+心理疗愈设计
文章介绍“人文 + 心理疗愈设计”,它将人的情感需求等置于核心。强脑科技研发的FocusZen正念舒压头环,是脑机接口智能穿戴设备,用高精度传感芯片捕捉脑电信号,经AI算法解析可视化大脑状态,能缓解焦虑等。Oma Labs的Oma老年人伦理AI情感陪伴设备,利用语音互动和伦理人工智能,放大老年人与家庭互动,促进洞察并预测护理需求,适用于多种设备。华南农业大学设计团队的CalmTouch治愈型体温计,为冲突地区难民设计,以抚摸方式测体温,结合测量与情感支持,减轻使用者恐惧。
#4全球信息交互设计年鉴 | 沉浸式空间与装置艺术(新加坡)
文章介绍新加坡沉浸式空间与装置艺术。先提及西班牙沉浸式装置趋势,后着重介绍新加坡相关作品。新加坡国家馆“梦想之球”是2025大阪世博会展馆,由DP Architects与Kingsmen Exhibits联合设计,由四位创意人才打造灵魂装置,展现新加坡创意精神。《云》由Caitlind R. C. Brown和Wayne Garett设计,用日常物品创作,有技术哲学启示。还有Tonoptik的《Elementary》、新加坡国立大学的This is Not a Screen、中国台湾UxU Studio的Reverse Waterfall、荷兰Vendel&de Wolf的《Sign》等作品,各有特色与意义。
梯度不陡
更新 4 篇#1AI 会写 Native 之后,跨端框架还重要吗?
文章探讨AI能写Native后跨端框架是否重要的问题。AI降低Native开发成本,引发对跨端框架必要性的思考。但AI降低的是编码成本,非系统成本,跨端框架“省人”价值减弱,不过可成企业统一业务表达层。企业应重新分层,业务表达跨端化、平台能力Native化、AI执行系统化。还指出不同场景适合不同方案,迁移回Native是组织工程,端侧工程师能力将变化,跨端框架不会消失但会被重新定义。
#2AI 时代,组织最该警惕的不是人才离开
文章指出AI时代组织应警惕反馈系统变慢,而非人才离开。AI改变能力增长速度,个人成长不依赖组织项目节奏,组织与人才成长速度竞争。组织不适应体现在反馈链路,激励和职级也是反馈系统,需适配新业务周期。成熟组织因资源结构等易反馈慢,人才离开可能是组织反馈跟不上。人才流动从岗位选择变为反馈系统选择,组织要缩短反馈回路,及时识别、承接和放大新能力。
#3别急着谈 AI Native 组织,先让关键链路形成闭环
文章探讨企业迈向AI Native的路径。指出AI Native关键是公司运行方式被AI重新组织,对创业公司是“出生方式”,对既有企业是“链路改造”。既有企业难整体转型,因要在现有系统承接AI动作。AI Native先改变信息流,减少对“人肉信息路由”依赖,让管理重心转变。企业可先让关键链路具备AI Native能力,如研发链路,满足信息可查询、任务可表达等条件形成闭环。链路AI Native化会影响组织结构,信息同步减少、协调角色转变等。既有企业应先让关键链路形成智能闭环,再改变组织。
#4Signal #11: Agent 不只是生成代码,它的中间过程正在被产品化
文章指出,近期多个 Agent 产品更新,将 Agent 工作的中间过程产品化,使其从单纯的代码生成入口转变为工程系统。过去研发任务中,很多过程依赖开发者手动补充,如今 context usage、memory 等能力逐渐显性化。如 Claude、VS Code、Cursor、Gemini CLI 等产品都有相关改进。研究侧也有类似信号,关注 Agent 过程能力。过程能力包括上下文管理、记忆沉淀等,能让 Agent 承担真实研发任务。未来关键在于管理 Agent 执行过程,让结果可被信任。
36氪Pro
更新 4 篇#1106起融资落地,汽车与硬科技成吸金主力,微元合成拿下最大单笔|创投周报
36氪统计5月8日至14日全国106起融资事件,披露金额112.9亿。硬件板块交易总额领跑,亿元级融资集中在硬件、AI等领域。AI板块眸深智能、跃盟科技等获融资;机器人板块博银合创、星识科技等有进展;硬件板块长曜创新、芯驰科技获投;汽车板块启境汽车、超熔科技有动作;医疗板块柯君医药、伽奈维获融资;消费板块中佰云科、馥郁满铺也有融资动态。
#2对话爱奇艺CEO龚宇:AI时代,爱奇艺如何主动拥变?
本文围绕爱奇艺在AI时代的发展展开。AI给影视行业带来效率与成本革命,降低制作门槛。爱奇艺CEO龚宇提出“去中心化”战略,认为AI让影视行业条件成熟。2023年起爱奇艺积极布局,开展员工培训、上线AIGC专区、降低运营成本等。3月上线纳逗Pro,有近70个智能体,覆盖全流程。爱奇艺世界大会公布对中剧和AIGC内容补贴。龚宇表示去中心化战略初期重获取好作品,预计今年Q3、Q4有成果,未来5年网络头部影视作品或一半AI创作。爱奇艺还面临短剧竞争,龚宇更关注技术创新带来的行业巨变。
#3林俊旸创业,新公司估值约20亿美金
前阿里千问大模型技术负责人林俊旸开启创业,考虑方向为世界模型和具身大脑,已招募数名成员,以约20亿美金估值开启融资,接触红杉中国等基金。2026年3月他离开阿里,此前他于2022年接手Qwen团队,主导研发和开源,使Qwen成有影响力的国产模型。但集团因业务合作问题拆分Qwen团队,成其离职导火索。具身智能是他重回AI战场的赛道,此前他在阿里就组建相关团队。硅谷已有AI大牛投身此领域,不过也有投资人担忧技术人才创业商业化能力。
#4专访征拓CEO刘兵斌:不做阳台储能「祖师爷」,要做AI时代的家庭能源中心
36氪专访征拓CEO刘兵斌,介绍公司发展历程与战略。征拓从充电宝转型阳台储能,2022年聚焦此领域,其即插即用产品与传统户储解耦。公司发展迅速,5年复合增速超102%,2026年一季度近200%。2025年获大族激光战略入股,补齐供应链短板。目前进行C轮融资,资金用于研发和新市场拓展。其AI能力强,能省73%电费,核心壁垒是系统生态和AI能力。未来目标是成欧洲插入式家庭能源管理系统第一,达100万用户并IPO上市。
W3C资讯
更新 4 篇#1ECMAScript国际化API指南
文章介绍了ECMAScript国际化API,它可通过JavaScript的Intl对象使用,能原生处理语言区域与文化敏感数据。先讲解核心概念,包括locales和options两个基础参数。接着从多方面介绍其应用:日期和时间格式化,可消除歧义,通过options精细控制;处理数字、货币和单位,能适应不同地区格式;符合语言区域习惯的排序,用Intl.Collator解决默认排序问题;相对时间,用Intl.RelativeTimeFormat生成自然语言表达。还提及API其他能力,采用该API可将本地化逻辑迁移到浏览器原生引擎,提供更好体验。
#2[欢迎参与] W3C成立WebExtensions标准工作组
W3C成立WebExtensions工作组,使命是制定跨浏览器扩展API通用核心规范,支持跨浏览器扩展开发。该组考虑浏览器厂商需求,规范实现不一致处。工作范围广泛,计划交付WebExtensions、window.browser等规范,还会创建用例、测试套件等文档。小组与多个组织合作,通过GitHub讨论技术,日常交流用电话会议等方式,可访问工作组主页了解更多。
#3首个公开工作草案:CBOR-LD 1.0
W3C JSON - LD工作组发布CBOR - LD 1.0规范的首个公开工作草案。CBOR是紧凑二进制数据序列化及消息格式,CBOR - LD 1.0是基于CBOR的链接数据序列化格式,利用现有JSON - LD生态系统,采用语义压缩技术,压缩率比通用方案高60%以上。该格式适用于存储和带宽受限环境,可构建互操作协议、高效存储数据。文档面向使用CBOR编码链接数据等多种开发者,可通过GitHub反馈草案意见,还可访问JSON - LD工作组主页了解更多信息。
#4W3C将召开“ODRL未来方向”研讨会
W3C将于2026年6 - 7月召开“ODRL未来方向”研讨会,采用线上线下结合形式。自2018年成W3C正式推荐标准后,ODRL应用广泛但面临挑战,如跨领域策略互操作性等。研讨会涉及ODRL应用与实践、创新与语义、互操作性与架构、路线图与社区发展等议题方向。现面向相关话题征集演讲提案,提案应围绕ODRL未来发展提建议、用例等。会议形式有提案演讲、讨论等,免费向W3C会员及公众开放。还给出了时间节点、程序委员会等信息。
DAMO开发者矩阵
更新 4 篇#1ICLR'26|Landscape of Thoughts: 可视化大模型的推理过程
大语言模型推理行为是“黑箱”,研究人员检查输出文本的方法脆弱主观。为此推出Landscape of Thoughts(LoT),它是首个可视化大模型推理路径的工具,适用于多项选择数据集。其核心是将推理状态量化并可视化,还引入一致性、不确定性、困惑度三个量化指标。借助LoT分析不同推理算法、任务和语言模型,有诸多发现,如Landscape收敛速度与推理准确率正相关等。此外,基于此构建的轻量级验证器能提升推理准确率。该工具可助理解LLM机制,推动相关研究。
#2ICLR'26|多个基准超越GPT-5!DataMind如何构建通用数据分析智能体?
随着大语言模型发展,数据分析智能体成为关键。本文提出DataMind方案,构建高质量训练集DataMind-12K,训练了DataMind-7B与DataMind-14B模型。其流程含四组件:高质量数据合成与筛选,获11707条高质量轨迹;动态平衡训练目标,联合优化SFT和RL损失;内存高效且稳定的多轮执行框架,解决内存和运行问题;多维度奖励设计,抑制模型投机。实验显示,DataMind在多个基准超越GPT-5等,有较强泛化能力和数据效率。分析表明推理路径多样性重要,动态衰减策略可提升性能,RL激发模型潜在能力。最后开源全部数据和模型,为智能体训练提供实践指南。
#3初赛突围,谁能笑到最后?决赛6强正式出炉!
乐云平台·日常抓取任务创新挑战赛决赛入围名单出炉,6支团队晋级线下对决。决赛于5月15 - 16日在杭州市云栖小镇会展中心举行,15日进行技术硬核比拼,各队现场完成5次抓取 - 放置连续操作,技术实现分占40分;16日进行路演答辩,场景适配分和路演表现分各占30分。专家评委包括王越等教授及相关负责人。
#4达摩院 ICLR'26|K-Flow:开启流匹配在K-幅度空间的探索新维度
阿里达摩院联合UC Berkeley推出K-Flow研究,为流匹配引入K-幅度空间的新维度——频率尺度。传统生成模型在像素空间同步更新存在梯度竞争问题,K-Flow将频率尺度重新诠释为流动时间。其核心创新有结构化对齐和局部化向量场,前者利用语义信息频率分布和分层建模优势,提升条件生成受控性;后者将全空间优化分解为局部频域过渡。K-Flow范式普适,探索了经典基底和Frequency-Forcing等方式。实验验证了其精准受控的生成能力,包括非监督编辑、标签丢弃实验、跨领域应用等,还填补了多模态推理数据空白。
Datawhale
更新 4 篇#1Anthropic创始人手册:如何打造一家 AI Native 公司!
Anthropic发布《创始人手册:如何打造一家AI Native公司》,按2026年可实现的AI能力梳理初创公司四阶段。手册指出创始人角色向智能体编排者转变,AI降低执行门槛但非判断门槛,创意阶段应重验证。AI使小团队获大公司能力,削弱大公司组织壁垒。AI原生公司护城河是领域知识、用户数据飞轮、工作流锁定。这表明AI公司进入新阶段,AI原生是一种公司形态,正在改变公司本身。
#2吴恩达发了条推文:别再讲 AI 会让人集体失业了。
近两年,AI是否会让人失业成普遍焦虑,常有裁员消息归到AI头上。吴恩达在X上反驳“AI会让大家集体失业”说法。他承认AI改变工作带来压力,但称AI虽影响岗位、改变技能要求和替代部分任务,但说就业市场要崩是制造恐惧。以软件工程为例,AI虽替代部分任务,但招聘仍强劲,宏观数据也未显示就业市场崩溃。“AI失业末日论”流行是因前沿AI公司、卖产品的AI公司、裁员企业各有动力。实际上岗位被重写,工作内容和技能要求改变,未来会有新机会和需求,他希望大家掌握AI,警惕旧工作方法失效。
#3首次增加AI4S训练营!五月最丰富组队学习来了🥳(多达12个)
Datawhale团队五月开展多达12个组队学习项目,首次增加AI4S训练营。AI4S专题有6个训练营,涵盖古文字识别、物理、药物筛选等领域;具身智能专题有2个课程,帮助零基础学员入门;AI Infra专题有GPU算子开发训练营;Agent专题有两本相关书籍课程;AI通识专题有推理科学教程。各课程有适合人群、学习名额和开源内容,报名成功需本周内进群。
#4黄仁勋现身卡内基梅隆(CMU)大学!讲了整整18分钟
在卡内基梅隆大学2026届毕业典礼上,英伟达CEO黄仁勋发表了18分钟演讲。他先从自身成长经历讲起,提及9岁赴美,父母为其付出,强调机会需靠自己把握。接着讲述创办NVIDIA时的困境,称失败是学习时刻,做CEO要担起责任。随后谈到毕业生处于AI革命起点,计算模式正被重置,虽会带来焦虑但也充满机会。他承认AI有风险,科学家、工程师和政策制定者要担责,反对因害怕而退缩。还指出工作任务和目的不同,很多任务会自动化,但人的目的不会消失。他表示真正危险的是别人更会用AI,鼓励大家参与其中,最后建议毕业生跑起来,把心放进工作里。
OpenBMB开源社区
更新 4 篇#1MiniCPM-V 4.6登顶Hugging Face Trending!
端侧多模态大模型 MiniCPM-V 4.6 登顶 Hugging Face Trending 榜单第一。这得益于其极致的端侧推理性能,在小参数量下有优异表现,让多模态大模型能在端侧设备流畅运行;具备卓越的多模态理解能力,视觉 - 语言交互实力惊艳;还有极其友好的部署生态,提供完善代码和 API 支持,降低开发者使用门槛。团队表示登顶是新起点,会秉持开源初心带来更好模型,还邀请大家去 Hugging Face 探索并在 GitHub 点亮 Star。
#2不依赖外部训练数据,大模型如何自己练出推理能力?CPMöbius 提出 Coach–Player 协作式强化学习框架
文章介绍了THUNLP实验室提出的CPMöbius协作式Data - Free强化学习框架。当前大模型推理能力提升依赖外部数据,高质量数据稀缺且成本高。CPMöbius让Coach根据Player能力出题,Player解题强化学习,Coach依Player进步更新出题策略。其训练分四步:Coach设计任务并过滤难度,Player解题构造伪标签,用GRPO更新,根据Player进步奖励Coach。实验表明,CPMöbius在多基准测试上让模型稳定提升,训练过程中Player能力逐步增强,且不是简单提高答案一致性。还通过消融分析指出Coach动态更新、Warm - up和难度过滤机制很关键。
#3新一代「小钢炮」来袭!1.3B 模型性能效率双杀,MiniCPM-V 4.6 正式开源
5月11日,面壁智能联合清华大学、OpenBMB开源社区发布并开源端侧多模态大模型MiniCPM-V 4.6。它参数仅1.3B,6G内存就能端侧流畅运行。性能上,两个版本在多任务评测中表现卓越,在AA榜单超越众多模型。效率上,运行效率反超Qwen3.5 - 0.8B。技术创新方面,采用LLaVA - UHD v4重构ViT架构,图像编码计算量减50%;提供4倍/16倍混合Token压缩,可按需切换。此外,它为开发者提供便捷部署指南,适配主流框架,是垂直场景改造的优质基座,已在多终端场景落地。
#4VoxCPM 2「声音任意门」高校共创季——来玩!开启你的第一场 AI 黑客松
OpenBMB发起VoxCPM 2校园黑客松,活动于5月11日官宣,为期3周。此前在2026年4月,面壁智能等全球发布VoxCPM2语音基础模型。活动目的是让学子接触大模型技术、锻炼能力、解决实际问题。形式分线上线下,有创意传播、多元应用两个赛道。奖项包括创意声量奖、校园极客奖等。报名面向在校学生及毕业5年内校友,采用飞书报名表等方式。活动还解答了能否参加、组队、找指导等常见问题,并提供项目链接。
腾讯云开发者
更新 4 篇#1上下文,才是Agent的命门
当下AI工具竞争集中在写代码能力,上下文窗口不断扩大。但写代码并非开发者最大难题,他们大量时间花在拼凑需求上下文上。程序员做代码变更所需上下文分四层,当前竞争集中在L1 - L2,而开发者认知瓶颈在L3,现有工具获取能力不足。未来Agent核心竞争力在于获取、组织、更新和使用上下文。QClaw本周上线「文件空间」功能,可打通多数据源,补齐上下文,这也是腾讯生态优势。
#2只加两行代码,为什么要两天?一文深度理解业务系统的复杂性
文章围绕业务系统复杂性展开。先指出业务规模停滞或下滑使产品侧增加需求,加重开发团队压力,但软件行业的可复用性理论上应提高开发效率,然而现实中功能成本曲线呈指数型。接着提到软件开发提效,虽有工程效能工具减少意外复杂性,但业务本身的本质复杂性不可忽视。业务系统复杂的根本原因一是功能间隐蔽增加的耦合,如名片系统和分享到微信功能引入新耦合;二是不可避免的代码腐化,因架构设计短视,“中华田园敏捷开发”使架构只能适应当下。最后强调代码腐化和文档缺失增加开发者认知负担,应对需代码防腐和知识沉淀,重构虽能解决架构腐化,但收益难量化。
#3从零设计生产级 Multi-Agent Harness:架构、评估、记忆、成本与 MCP 工具接入全拆解
文章指出AI Agent演示效果好,但进入生产会遇到诸多问题,真正决定Multi - Agent系统能否落地的是Multi - Agent Harness。它是Agent的“操作系统”,负责编排、调度等。文章拆解了生产级Multi - Agent Harness的设计,包括架构编排上Harness负责全局控制;工具治理要通过Tool Registry;状态与记忆需分层处理;评估体系分四层且采用混合评估;成本控制有模型路由、上下文压缩、预算分级降级策略;MCP工具接入需Harness做安全网关;还提到可观测性和分三阶段的落地路线,强调Harness对Agent系统的重要性。
#4拆完Hermes源码,我发现Agent的"自我进化"根本不需要训练模型
本文深入剖析了Hermes Agent的自我进化机制,并与OpenClaw对比。2026年2月Nous Research开源Hermes Agent,两月获5.2万Star。OpenClaw是全能但无状态的管家,Hermes Agent定位是自我进化。Hermes Agent有三大核心机制:四维持久记忆系统保证单次会话一致性;技能自动创造系统可自动创建/更新Skill;KEPA通过周期性回顾更新使用模型的策略。其优势是零成本进化、可解释编辑、跨模型迁移和渐进式积累,但也存在判断不准确、更新延迟和生态弱的问题。作者认为理想方案是用户驱动和Agent自驱动结合,还给出两者的选择决策表,指出Agent未来是会成长的软件。
TRAE.ai
更新 4 篇#1TRAE Friends|29 城,全国4月社区线下活动精彩回顾
TRAE Friends是面向开发者与AI爱好者的城市社区活动。4月走进29个城市,以Meetup、Workshop、Hackathon等形式开展,吸引超2700名开发者参与。活动涵盖产品功能解析、案例实践分享、技术交流和编程实战等。各地活动各有亮点,如南京产出52个作品,东莞聚焦制造业场景,中山有创意小游戏和实用小程序等。活动助力开发者探索“Ship Faster with TRAE”更多可能,5月将走进更多城市。
#2电商商家增长团队|全栈 AI Coding 工作流分享
电商-商家增长团队分享全栈AI Coding工作流。起初用Vibe Coding搭建AI短视频生成平台,后因项目复杂度上升问题频出。经探索沉淀出TRAE SOLO + 多仓库Spec模式 + 测试验证Skill的全栈开发实践,2人2周完成平台MVP,投放视频获正向收益。介绍核心工作流:Spec-First以需求为文档;前后端共享上下文,多仓库开发;测试是AI Review核心,分后端和前端测试;Skill迭代从一次性Prompt到可复用能力。还分析工作流适用性,指出AI Coding深水区挑战,强调其ROI与项目特征相关,人的判断力是核心,沉淀比使用重要。最后总结核心方法论,给不同角色提建议。
#3TRAE 用户都在用哪些 Skills ?这 11 个最热门
文章基于真实调用数据揭晓TRAE上最热门的11个Skills,包括brainstorming、frontend-design等。介绍各Skill作者、简介、应用场景及模板,如brainstorming可用于新功能开发等场景。还说明在SOLO中安装Skill的方法,分析Skill调用失败或效果不好的原因及解决办法,如描述没写对要写清晰准确的Description等。最后提及TRAE官方技能创作赛正进行,有奖金和周边,本周四晚有技术专家直播。
阿里巴巴
更新 3 篇#1阿里事儿|Qoder1.0发布;全新AI店小蜜发布
本文介绍了阿里近期多项业务进展。5月15日Qoder 1.0发布,升级为智能体自主开发工作台;5月11日千问与淘宝打通,开启AI购物体验,同日全新AI店小蜜发布,可降低转人工率、提升转化效果;5月14日千问App与国家药监局信息中心合作,阿里云上线万小智2.0;5月13日阿里健康发布医学AI“氢离子”。此外,淘宝直播618将发放大额定金红包,天猫520清凉用品热销,5月11日虎鲸文娱发布2026片单。
#3AI购物全新体验!千问与淘宝全面打通
千问与淘宝全面打通,带来AI购物新体验。用户在千问App与AI对话可完成淘宝商品挑选、对比及下单;在淘宝App点击“千问AI购物助手”,能使用AI试穿、算优惠、低价帮抢等功能。千问基于淘宝商品库和购物场景数据,可精准理解消费意图,精准推荐商品。面对不同购物需求,如条件多、说不清款式、不知买什么,千问都能有效应对。此外,淘宝App还有AI问答、试穿、种草、省钱等功能,让购物更智能省心。
腾讯技术工程
更新 3 篇#1腾讯混元推出轻量翻译大模型,无需联网,手机直接运行!
腾讯混元团队推出极致量化压缩版本翻译模型Hy - MT1.5 - 1.8B - 1.25bit。该模型支持33种语言,压缩至440MB,无需联网可在手机本地运行,翻译质量优于谷歌翻译。Hy - MT1.5原生支持多种语言和翻译方向,仅1.8B参数量就实现比肩商业翻译API和235B级大模型的效果。但原始模型占用内存大,为此腾讯推出2 - bit与1.25 - bit两种量化压缩方案。2 - bit模型结合量化感知蒸馏,在压缩体积同时保证翻译质量;1.25 - bit模型基于Sherry技术,进一步压缩至440MB。此外,还开源模型权重、代码及技术报告,提供翻译Demo版,适配“后台取词模式”,用户可全离线、零成本、零隐私暴露使用。
#2当我把 AI 变成一个"算法":Skill 工程化设计的心路历程
作者分享将AI变成“算法”,实现Skill工程化设计的历程。最初按主流做法写规则,发现规则越多AI越不听话,问题在于结构。于是引入CLI接管确定性事务,解决Token浪费、路径不确定等痛点,还实现工具管理三层分离和热更新。Workflow机制将工具串成流水线,解决流程顺序、步间通信和中断恢复问题,具备扩展性和同构性。最后创建workflow - creator实现自举,形成闭环。作者还指出简单场景无需工程化,工程化是为AI构建适合的执行环境。
#3Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践
本文是一个AI工程交付团队分享知识沉淀实践。2025年末至2026年初,Harness Engineering成热门话题,团队实践发现构建Harness工作流非最终目的,知识沉淀才是技术护城河。文章指出知识管理是Harness Engineering核心能力,知识沉淀比工作流重要,因工作流可替换,无知识沉淀的工作流是一次性的,知识是团队复利资产。团队设计了三维正交知识体系架构,包括五层存储、五种类型、三级成熟度,搭建独立Git仓库作为团队知识库,实现共享和更新。工作流各阶段与知识流动紧密关联,知识按需消费通过三级索引和查询预算实现。为突破人机交互瓶颈,引入Hapi内网版。落地经验包括历史项目冷启动、知识膨胀治理等,未来可探索知识语义检索增强等方向。
大淘宝技术
更新 3 篇#1面向智能导购的Agent评测实践
文章围绕家居导购Agent评估展开。先介绍家居导购场景下,智能Agent虽重要但评估面临挑战,为此搭建端到端自动化评估链路。该链路含Benchmark创建、LLM模拟人工评测、人工抽样验收和自动化评测与报告产出四个模块。执行路径分五步,评测维度含两级体系,数据集经标准化构建。评估实践中,用四种模型生成搭配结果并评测,量化结果显示gpt51综合最佳,较qwen3-vl总分提升16.4%。还分析出模型三大瓶颈问题,自动评测准确率达91.9%。最后总结评估体系价值,并对未来探索方向作出规划。
#2AI-Generated UI 技术深度解析:模型流式输出与 UI 渲染实践
本文深入解析AI - Generated UI技术,涵盖流式输出基础、开源项目架构、渲染挑战及未来展望。2023 - 2024年,该技术从实验室走向生产。流式输出基于SSE协议,对比了主流LLM提供商API,SSE在多数场景更具优势。核心开源项目如Vercel AI SDK、v0.dev、Bolt.new等各有特点。流式渲染面临代码解析、Markdown渲染、JSON解析等挑战,并给出对应解决方案。AI代码编辑器Cursor有独特架构,WebContainers实现浏览器内Node.js运行。生产级实践包括性能优化、错误处理等。未来,多模态流式输出、Agent驱动、边缘计算等将推动其发展。
#3缓存使用实践总结:以淘宝交易结算场景为例
文章以汇金平台为例,系统总结缓存使用实践。先介绍缓存理论,包括适用条件、分类与选型方法,如数据不要求强一致性、访问和更新频率等影响缓存选型;还从存储端、介质、时机三个角度对缓存分类,指导选型。接着阐述五类典型场景实践,如缓存实例型配置类数据选分布式、内存型、静态缓存;分布式锁选分布式、持久型、直写缓存等。最后分析缓存安全问题,如穿透、击穿、雪崩等风险成因及治理方案,如用布隆过滤器防穿透,合理设置过期时间防击穿。
火山引擎
更新 3 篇#1理想汽车×火山引擎:AI智能助手纵深防御体系,为AI系上“安全带”
智能体渗透汽车产业各环节,安全问题成车企必答题。理想汽车已部署多场景AI智能助手,但行业存在权限边界模糊等安全瓶颈。理想与火山引擎合作打造“AI智能助手纵深防御体系”,具备身份与权限管控、行为与执行控制、理解与生成安全、审计与行为追溯四大核心能力。该体系已在多场景落地验证,如安全运营场景中可实现漏洞工单的一站式指派与修复。未来双方将持续做好企业智能体安全防御工作。
#2乐橙×火山引擎:给安防注入AI能力,让监控从“被动记录”进化为“主动思考”
传统安防存在信息过载、关键事件难捕捉等问题,用户需求升级。2025年乐橙与火山引擎合作,开发乐橙AI智见大模型服务。在家居场景,从语义化告警增强、自然语言视频检索、智能消息过滤、智能事件摘要四大维度升级监控体验;在商业巡检场景,让监控从“事后录像”变为“实时分析+秒级告警”,实现降本增效、即时告警与数据决策、标准化闭环管理。双方合作打造全流程智能解决方案,打破传统安防瓶颈,已有百万用户使用乐橙“AI智见”,未来将持续丰富服务场景能力。
#3Agent Plan发布:业界首个“Agent套餐包”来了
火山引擎发布业界首个“Agent套餐包”Agent Plan。它在Coding Plan基础上,新增多模态模型和Harness工具,包含字节跳动系列SOTA模型、主流三方模型及联网搜索等工具。其将Model与Harness深度整合,Model层面提供自研多模态能力和主流模型聚合,Harness层面提供联网搜索和记忆能力,还引入AFP统一计量。通过接入它,开发轻量短视频网站高效便捷。它有四种订阅套餐,可通过主流工具接入,企业版也已上线。
字节跳动技术团队
更新 3 篇#1重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案
AIGC 技术发展使大模型迈向企业级应用,给底层通信和调度带来挑战。火山引擎推出 RocketMQ For AI 解决方案,以轻量化通信、智能化调度、企业级可靠性为核心。传统 RocketMQ 在大模型场景有适配短板,如不能区分消息优先级、不支持海量 Queue 创建。新方案有轻量级主题(Lite Topic)和优先级消息(Priority Message)特性。在长会话链路和 Multi - Agent 协作场景中,新特性可解决传统 MQ 的问题,实现会话隔离、保证顺序性等。未来,MQ 将成 AI 系统事件总线,趋向 Serverless 化,满足复杂业务需求。
#2业务团队也能“手搓”应用?火山 Supabase 助力猿辅导对话式 Agent 落地
文章介绍猿辅导内部“Rush”平台借助火山引擎Supabase实现对话式Agent落地。猿辅导因业务微需求多且变化快,自主研发Rush平台,通过对话式交互生成应用。但早期面临时效性、数据安全、版本稳定、成本控制等挑战。选择火山Supabase后,Rush平台在教学、运营、职能等场景发挥作用,提升效率、降低成本。未来二者结合将深度融合AI、连接生态、外部赋能。还介绍了火山Supabase,包括其特点、适用场景、产品能力和优势等。
#3IGA Pages × TRAE :TRAE 如何快速实现一键部署
文章介绍了TRAE CN(AI IDE)与IGA Pages(应用部署及加速平台)结合实现一键部署的方法。先指出传统部署难题及成本高的问题,接着介绍两者功能,TRAE负责创意生成,IGA Pages负责部署。适合快速推原型、前后端一体化应用场景。环境准备需安装TRAE中国版、IGA Pages工具和准备火山引擎账号。通过快速上手和复杂场景案例演示最佳实践,最后说明让部署可持续的方法,如GitHub集成自动部署、绑定自定义域名、利用Edge Functions实现动态功能,强调这种结合实现了责任切分,降低门槛、加快上线节奏。
Android 开发者
更新 3 篇#1Google I/O 2026 | 一键收藏大会直播日程
文章介绍了Google I/O 2026大会相关信息。大会支持33个平台同步观看,提供中文同声传译,可多平台零时差观看获取技术资讯。给出部分平台直播链接,直播时间为5月20日凌晨01:00。此外,科技与AI领域创作者将亲临现场,带来展区体验与技术拆解,激发开发者实践灵感。
#2如期而至,The Android Show 精彩内容一睹为快
今年 Android 正从操作系统演进为全方位智能系统,经历深刻变革。文章诚邀大家探索 Android 史上里程碑式重大更新,了解其为开发者和企业带来的新机遇,还介绍了 The Android Show 的两个视频,分别时长 11:08 和 38:07,最后引导关注“Android 开发者”微信公众号获取更多资讯。
#3Android 开发者验证高级流程|构筑更安全的 Android 生态
本文由Android应用安全产品管理总监介绍新的开发者验证高级流程。Android生态兼顾开放与安全,公布新验证要求后与社区合作。为满足进阶用户安装未验证应用需求,开发高级流程,能防诈骗胁迫,仅需一次性操作。流程含启用开发者模式、确认未被诱导、重启验证身份、等待一天后再验证、安装应用等步骤。此外,还为学生和业余爱好者构建免费有限分发帐户,8月将推出该帐户和高级流程。
微软亚洲研究院
更新 3 篇#1微软亚洲研究院辰星荣誉计划各方向正在热招中!
微软亚洲研究院辰星荣誉计划正在热招。该计划面向顶尖科研学子,首次开启直通全职岗位面试绿色通道。入选者将在研究员带领下聚焦MSRA核心科研项目实习,还有机会提前锁定校招入场券。项目涵盖General Artificial Intelligence等六大前沿方向。2026年度首批申请已开放,截止到2026年5月15日,实习8 - 12周可延长,地点在北京或上海。申请材料包括简历、研究兴趣说明等。面向2027年及以后毕业的全球优秀本硕博学生,2027年毕业生优先,可扫码或点击“阅读原文”报名。
#2Microsoft Research Forum第二季第四期:AI 智能体、推理验证与语言模型的新进展
微软研究院推出的线上活动Microsoft Research Forum第二季第四期即将上线。该论坛聚焦有价值科研及现实影响,为全球科研同行带来前沿洞察。第四期科研人员将围绕AI智能体、语言模型微调等前沿议题分享成果。演讲包括微软研究院AI Frontiers新发布、GitHub智能体工作流、Interwhen开源库、全新语言模型微调方法等。活动于北京时间5月15日01:00 - 02:00举行,可扫码注册观看,错过直播可关注“微软亚洲研究院”看回放。
#3AVGen-Bench:面向下一代文生音视频模型的系统化评测框架
随着生成模型迈向更强多模态表达能力,评测问题凸显。现有评测多关注单一模态,难以满足真实场景需求。微软亚洲研究院推出面向文本生成音视频任务的评测基准AVGen - Bench,相关论文被ICML 2026接收。现有基准多为粗粒度质量评估,而真实应用需综合建模能力。AVGen - Bench从贴近真实场景出发,提供10个核心评测维度。其prompt来自真实任务,采用“大模型生成 + 人工筛选”流程,保留现实任务隐含要求。评测采用多粒度、混合式框架,拆解为三个层次,用专家模型和多模态大模型协同评测,旨在提出诊断性评测方法论,推动社区走向能力边界诊断。
海外独角兽
更新 3 篇#1The Era of Agent:拾象 AGI 投资洞察
文章是拾象团队的AGI投资洞察,指出2026年进入Agent时代,Coding Agent成新热点。各AI Labs重注Coding,因其是实现AGI的好环境,有飞轮效应。Anthropic靠战略聚焦在Coding领先,OpenAI虽有优势但战略失误,Google是稳定追随者但慢。市场应按To Human/To Agent划分,Agent成新消费者和生产者,相关基础设施正重构。机器人领域2026年是数据Scaling大年,技术从VLA转向World Model Policy,Neo Labs分追寻范式和专注高价值领域两类。
#2AI Labs 都在用,ClickHouse 能成为 AI 日志的实时分析引擎吗?
本文聚焦ClickHouse,探讨其在AI浪潮中爆发的原因及发展现状。它起源于2009年Yandex内部项目,2016年开源,2021年商业化。2025年因平台化拓展、获头部AI Labs青睐、商业化加速而受关注,ARR从1500万美元增至1.6亿美元。其有ClickHouse Cloud、ClickStack、Langfuse三条产品线,分别解决海量数据实时聚合分析、可观测性、LLM工程平台问题。虽AI是业务推动力,但它不做AI,仅处理数据。销售模式正从PLG向PLG + SLG转型,按资源量收费。专家认为其性能快、成本低,但存在平台完整性缺失、企业就绪度不足等局限。目前估值150亿美元,对应94x multiple。
#3Supabase:百亿美元估值,vibe coding 的默认后端?
本文介绍了Supabase的发展情况,其以Postgres为核心,提供一站式后端服务。发展依托Postgres生态和AI coding趋势,接近完成5亿美元F轮融资,估值100亿美元,截至2026年Q1累计用户超700万。关注原因包括处于AI大势、产品路线图转变、有平台化机会和强分发优势。产品分5层,有不同定价。在agent-first、scalability、企业级方面均有布局。增长得益于初创公司和vibe coding。面临Postgres生态、BaaS架构、agent-first等竞争,存在UE、TAM和企业客户市场等挑战。团队分工明确,还解读了四次收购对解决成本问题的作用。
快手技术
更新 3 篇#1ICLR 2026|快手GoalRank:颠覆两阶段范式,生成式排序迈入Scaling Law时代!
快手消费策略算法部提出GoalRank框架用于推荐系统排序。现有排序方案有G-only和G-E范式,G-E更优。GoalRank理论证明G-only表达能力上限优于MG-E,还提出组相对优化框架。离线实验中,GoalRank在核心指标上大幅提升,参数扩展时性能持续上升;在线A/B测试在快手平台核心指标全面正向提升,已全量部署。该成果被ICLR 2026接收,团队还发布推荐算法工程师岗位。
#2开源!快手提出面向长上下文推理的序列压缩注意力机制KSA!
快手推荐模型团队提出面向长上下文推理的序列压缩注意力机制KSA并开源。当前大模型长上下文理解面临资源成本和架构瓶颈问题,KSA从序列压缩角度出发,按一定压缩比进行KV Cache的压缩提纯。其通过插入Summary Token分段提纯序列信息,削减长序列下的KV Cache存储和计算。模型设计上采用Summary Token压缩和Sliding Chunk Attention,还可与现有KV Cache压缩技术组合。系统实现包括连续KV Cache布局和CPT三阶段Recipe。实验显示,Hybrid-KSA在长上下文检索和通用能力上表现出色。未来推荐系统与大模型技术融合趋势明显,团队也在招聘相关人才。
#3快手OneSearch-V2全量上线,生成式搜索进入「懂你」时代
快手技术团队在OneSearch基础上推出新一代生成式搜索框架OneSearch-V2并全量上线。它解决了复杂查询理解不足等问题,采用潜空间推理增强与自蒸馏训练方案,包括思维增强的查询理解、推理内化的自蒸馏、行为反馈偏好对齐。实验显示单模态编码优于多模态,KHQE效果最佳。离线评测中各组件有不同程度提升,OneSearch-V2全指标最优;在线A/B测试显示业务指标显著提升;人工评测也证实搜索体验提升。深入分析表明它在各维度表现良好,还平衡了相关性和转化率。未来将探索长尾query训练、统一编码方案、智能体搜索系统。此外团队介绍了自身情况并发布招聘信息。
美团技术团队
更新 3 篇#1美团 LongCat 开源 General 365:树立推理评测新标尺
美团LongCat团队发布开源的General 365基准,用于评测大模型通用推理能力。当前大模型评测存在重学科推理、轻通用推理问题,现有通用推理基准有任务模板化、区分度低的瓶颈。General 365将背景知识限定在K - 12水平,具高多样性、挑战性等特征,涵盖八个推理维度。实测26款主流大模型,Gemini 3 Pro以62.8%夺冠,多数未及格。“语义干扰”与“最优策略”是性能洼地,且模型在General 365上准确率降、输出长度增,凸显其难度。项目已开源并将持续维护,还预告了5月21日的CVPR论文分享活动。
#2MARS TALK 香港大学站|共话具身智能的技术演进与商业化进程
5月8日,美团机器人研究院与香港大学联合主办的MARS TALK学术沙龙在港大举办,主题为具身智能技术演进与商业化进程,吸引超400名师生及超6.5万线上观众。美团副总裁毛一年展示美团无人机配送成果,已在多地常态化运营且订单超90万。梅卡曼德邵天兰提出具身智能回归结构主义。哈工大杨朔分享数据范式革新。圆桌讨论环节,专家探讨具身智能发展。此外,美国特拉华大学黄国权分享人才成长经验,美团还介绍校招情况。未来,美团将深耕相关领域推动机器人技术发展。
#3美团无人机低空物流解决方案亮相世界无人机大会
美团在世界无人机大会上亮相了其无人机低空物流解决方案,但文章未详细介绍该方案具体内容。
AndroidPub
更新 2 篇#1Compose 状态管理实用指南:State 应该放哪里?
文章围绕Jetpack Compose状态管理展开,指出状态归属影响架构与代码维护。提出关键原则:影响业务逻辑的状态放ViewModel,反之留Composable内。状态放错会增加系统复杂度,状态应靠近使用处,避免过早提升。明确区分UI State与Business State,以拖拽场景为例说明拆分方式。生命周期也是判断依据,业务状态需长周期,UI状态多短时。State Hoisting要按需进行,避免过早将状态塞进ViewModel。最后给出判断清单,核心思想是UI状态贴近使用位置,业务状态上移。
#2Harness Engineering 是噱头吗?
文章围绕Harness Engineering展开探讨。介绍其概念溯源,从传统软件测试的Test Harness到如今的Agent = Model + Harness,经历了从默默使用到被正式命名、抽象和系统化的演变。核心实践三Agent架构,即Planner、Generator和Evaluator,能提升任务可控性,但成本较高。有人认为它是噱头,因其技术无新东西且成本高,且未来模型能力增强,部分Harness设计或会被淘汰。不过,Harness不会消失,而是会最小化与变形,是强模型时代的过渡期关键技术。最后建议读者从小任务入手,练习Harness思维。
大转转FE
更新 2 篇#1不写一行代码,用 Xmind 思维导图跑通多端自动化回归
转转B2B业务三端并行迭代,回归测试存在人力消耗大等痛点。因AI视觉识别和业务压力,自建自动化平台ROI正向。经对比,选Midscene为底层引擎,因其对UI变动脱敏、维护成本低、学习门槛低。将其做成智能自动化测试平台,解决环境问题,支持0代码写用例和全环境运行。平台采用分层架构,涵盖DSL输入、平台管理、核心执行和底层驱动层。使用流程包括用例管理、脚本转换、执行和查看结果。还探索将YAML生成接入AI Coding流程用于研发自测,减少重复表达等。目前平台在发版回归和巡检场景成熟,未来有望融入日常开发流程。
#2转转前端周刊第194期: 裁员潮将持续,直到我们学会发掘 AI 的商业价值
转转前端周刊第194期整理业界精华文章。《裁员潮将持续,直到我们学会发掘AI的商业价值》指出AI裁员核心是企业未找到商业变现路径。《Every CEO提出一个残酷比喻》介绍“三明治”工作流模型,重新定义工程师与AI协作边界。《5人7天干完20人数周的活》分享5人团队用7天开发产品的案例,展示规范驱动的AI编程新范式。《AI Native时代——研发组织何去何从》探讨AI时代工程师工作变化对研发组织的冲击。《不再做SQL苦力!Claude在得物App数仓的深度集成与效能演进》呈现Claude Code在得物App数仓的工程化演进路径。
MiniMax 稀宇科技
更新 2 篇#1一个 AI 还是不够
文章介绍MiniMax Agent升级为Mavis,更新包括上线Agent Teams和合并TokenPlan与Agent Plan。做Agent Team是因单Agent在复杂任务中有痛点,如意外停止、长任务变笨、难快速响应和角色分工问题。多Agent系统是需维护的基础设施,与其他方案比,MiniMax有对抗性质量门禁、确定性代码逻辑驱动和上下文隔离特点。其采用主Agent牵头,含Leader、Worker、Verifier的架构。核心落地场景有通讯软件、Coding、研究类任务、办公文档。多Agent协作有交接、共享、聚合成本,Verifier也有成本,复杂、长链路、高风险任务适合用Agent Team,简单任务单Agent或脚本即可。
#2MiniMax 10x Team:邀你一起,推动你的领域 10x 加速
过去一年大模型成生产力,MiniMax过去几个月已在多领域与专家合作,验证领域顶尖人才参与模型构建可带来进化。接下来,该团队希望将合作扩展到更多领域,邀更多合作者加入。其希望的合作者需行业有积累、对AI加速行业有信念且愿定义问题、构建评测和工作流。MiniMax提供多模态模型能力等,支持灵活合作方式,有竞争力薪酬和激励机制。点击“阅读原文”可投递10x Team。
Web3天空之城
更新 2 篇#1李录:我们时代的全球价值投资 | 在北大光华管理学院的演讲2024-12-07 | 全文图解
李录2024年12月在北大光华演讲,探讨全球价值投资与时代。他指出当下市场受就业、国际关系等影响,中国处于“2.5文明”,经济增长与社会治理存在落差。观念上,农业文明思维不适用于科技文明,如土地情结、“脱虚向实”是伪命题。现代资本市场核心是信用体系,中国需从国有银行主导转向完善信用中介和法律保障。香港具备现代资本市场内涵,应充分利用。他重新定义财富为经济体中购买力比例,总结价值投资六大信条,强调宏观接受、微观作为,在文明转型中锚定真实价值。
#2“奔跑吧,不要慢行” | 黄仁勋CMU2026届毕业典礼演讲: AI时代的生存与机遇法则
NVIDIA创始人黄仁勋在卡内基梅隆大学2026届毕业典礼演讲,分享自身经历与对AI时代的见解。他回顾从移民洗碗工到科技巨头的奋斗史,指出AI引发计算范式重置,从人类编写转向机器学习。强调AI赋能而非替代人类,能推动美国再工业化。呼吁毕业生以乐观和责任感拥抱AI,利用其力量应对挑战,全身心投入工作,塑造美好未来。
小红书技术REDtech
更新 2 篇#1QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾
本文整理自小红书质效研发部在QCon北京2026的分享,聚焦小红书GUI Agent智能化测试实践。春节大促时用Agent自动跑测试,取得累计自动化执行4.3万+次等成绩。但测试面临用例稳定性和业务理解问题,单大模型难解决。为此采用分层分工思路,按上下文分层、模型分工,将测试流程分业务意图、Agent探索、可执行代码三层,各层有退回机制。还介绍意图理解、路径规划、精确执行的做法,如用Coding Agent+Skill和自研小Agent+ToolCall,构建操作图谱,用双Agent架构等。最后分享踩坑经验,强调评测集非迭代正确姿势,纯探索路线需务实回退,未来将拓展架构应用并前置质量动作。
#2打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路
小红书PMO团队分享项目管理AI Agent 4次迭代探索。过去企业项目管理历经人治、机制化、工具化,AI时代需演进到AI化。团队有两个关键判断,自2025年初开启4轮迭代:1.0阶段将AI作项目管理顾问,产出评测集;2.0提出设计原则,接入内部IM,实现6个场景能力;3.0把项目管理能力打包成Skill,实现长记忆四件套,自建项目注册平台,打通多平台和7个核心功能;4.0为项目组提供共享上下文,基于OpenClaw构建PMOBP Agent,有12项落地能力和主数据底座。团队总结7条经验,展望走向AI主导项目管理阶段。
深思圈
更新 2 篇#1自学成才,3000 元成本,Yoroll 合作创作者做出"全球最佳 AI 短片",好莱坞大佬全网寻人!
中国独立创作者MX - Shell用约3000元成本、十天时间做出AI短片《丧尸清道夫》,在国内外爆火,获数千万观看,引发好莱坞大佬全网寻人。MX - Shell是Yoroll签约创作者,该短片将开发成互动视频游戏。此短片有电影感,标志AI视频从‘生成片段’走向‘创作作品’。Yoroll平台把AI视频变成游戏,降低创作门槛。AI视频游戏改变内容生产等关系,让创作者机会增多、短片生命周期延长、平台获数据闭环。《丧尸清道夫》验证新路径,预示新创作者时代来临。
#2Cursor CEO 最新演讲:AI coding的下一个时代
文章借Cursor CEO Michael Truell演讲,探讨AI coding变革。软件开发成本高,旧代码修改难。发展分三阶段:手工、Copilot、agent时代。如今agent请求超Tab补全,Cursor 30%代码审核由agent独立完成,企业75%代码由AI生成。工程师角色转变为agent管理者,工作是描述任务、检查结果等。管理agent有本地和云端两种模式,云端可并行处理多任务。实验显示agent一周能从零开发浏览器原型。作者认为要重新校准写代码价值,建立可信度评估体系,解决组织管理挑战,软件创业门槛降低,软件教育需重构。
WeaveFox和他的朋友们
更新 2 篇#1WeaveFox AI 全栈应用交付架构解析:Appwrite BaaS
2023 年以来,AI 辅助开发跨越到页面级生成,但仅有前端 UI 的应用不够完善。Weavefox 可通过 Vibe Coding 构建 AI 全栈应用,其背后是 BaaS。WeaveFox 接入 Appwrite 和 Supabase 服务。BaaS 能将环境配置转化为 API 调用,实现更快构建和启动应用。Appwrite 作为 AI 的工程化接口,有持久化存储、身份认证、云函数等核心能力。同时,BaaS 提供行级安全策略保障数据安全,用户可可视化管理数据表权限。未来 WeaveFox 会加入安全检测功能。不过 Vibe Coding 有局限,WeaveFox 采取影子演进策略确保系统稳定性。BaaS 是 AI 应用规模化的加速器,WeaveFox 持续优化全栈应用生成效果。
#2AI 畅销社 08 期:谁会做一个叫「老公好棒」的应用?
作者在WeaveFox上发现用户小牛旺旺的八个应用,包括捡捡漂流瓶、超级数独等。这些应用不解决商业痛点,却回应生活细微角落,体现对身边人的细腻关注。作者认为这是真实创作状态,不是为流量和数据,而是因想法有趣。WeaveFox降低创作门槛,让普通人能将想法变成应用,传递善意。作者强调其价值在于让普通人实现想法,鼓励大家使用该工具。
知危
更新 2 篇#1云业务暴涨38%,阿里这AI还真赌对了
阿里发布2026财年第四季度财报,本季度收入2433.8亿元,同比增3%,经营亏损8.48亿。各业务中,国内电商业务稳中有升,即时零售业务收入增长57%,国际电商业务亏损收窄。云计算表现亮眼,收入416.26亿元,同比增长38%,AI相关产品年化收入破358亿且持续三位数增长。阿里未来资本支出将超3800亿建数据中心,旗下平头哥自研GPU芯片已量产,全栈自研芯片有望提升云计算利润率。
#2Token代表成本,DAA衡量收益:百度给AI经济算了一笔账
文章围绕百度在Create 2026大会提出的DAA展开。指出传统DAU在AI圈已过时,DAA可衡量AI真实价值,弥补Token只衡量消耗的不足。百度此前就锁定Agent主流形态、强调交付结果,此次提出DAA顺应行业趋势。大会上百度芯云模体全面进化,如Dumate通用智能体升级、代码智能体“秒哒”能力增强;还重构AI基础设施,降低智能体算力成本。李彦宏提出AI时代进化论,预测全球日活智能体数将超100亿,DAA为行业提供新思路。
Goodme前端团队
更新 1 篇#1Agent Skills 原理及其在中后台页面中的实践
文章围绕Agent Skills原理及在中后台页面的实践展开。先介绍Agent Skills,它是扩展Claude能力的模块化功能,本质是带边界约束的任务执行单元。对比了它与MCP的区别,指出前者适用于知识型、经验型任务。在中后台页面实践部分,分析业务需求,发现列表页、详情页适合运用skill。以报货业务列表页为例拆解开发流程,创建skill并生成模板,虽页面还原度较高,但存在生成时间长、代码冗余、组件匹配不精确等问题。针对这些问题提出优化方案,优化后的skill生成时间减半,规范性和可拓展性显著提升。最后提出中后台skill长期建设的思考,鼓励探索Skill开发并分享交流。
DeeplearningAI
更新 1 篇#1吴恩达来信:AI 不会摧毁就业市场
吴恩达在信中称不会出现AI“就业末日”,“AI将导致大规模失业”言论在制造恐慌。软件工程受AI影响大,但软件工程师招聘需求仍强劲,AI带来的净新增就业大于消灭的岗位,美国失业率也保持健康。“AI就业末日论”流行,一是前沿AI实验室为凸显AI强大,二是AI公司可借此提高收费,企业也会将裁员包装成AI导致。他承认AI改变工作方式,但认为与就业市场崩塌不同。随着主流媒体质疑,该言论影响力会减弱,他预测将出现AI“就业狂欢”,AI会创造更多优质岗位,现在应鼓励人们掌握AI。
AlibabaDesign
更新 1 篇#1D20 议程来了!
文章描绘了AI融入生活的一天,展现其带来的便利。指出AI Native正在改造世界,AI改造需设计,D20这样的AI设计大会是新的时代命题。D20 2026峰会希望搭建专业、开放、前沿场域,让新机会图谱更清晰。官网持续更新大咖嘉宾和精彩内容,详细议程可在官网查看,购票通道5月20日开启,7月10 - 11日举办,鼓励大家参与。
网易智企-CodeWave
更新 1 篇#1揭秘ISV利润倍增的AI Coding新路径 | 广州站回顾
近日,网易智企与广州市软件协会在广州举办“ISV利润从100W到300W”AI Coding实战沙龙。活动聚焦ISV“增效不增利”困局,为ISV企业带来全方位升级方案。会上,网易智企发布CodeWave可控的企业应用AI Coding平台,以NASL语言为底座,采用SDD模式实现全链路可控,可将软件项目利润提升200%。活动现场设置体验区,吸引众多参会者试用,多家企业提交试用申请。抱谷科技分享实战经验,对比CodeWave与其他工具区别。网易智企还演示6个实用Skill。CodeWave已开放试用,网易智企AI Coding实战六城巡演将继续,5 - 6月将落地杭州等城市。
蚂蚁技术AntTech
更新 1 篇#1阿里巴巴 & 蚂蚁 LoongSuite GenAI 可观测语义规范:从统一数据语言到规模化落地
文章介绍阿里巴巴与蚂蚁联合推出的LoongSuite GenAI可观测语义规范。随着GenAI发展,可观测领域标准缺失、口径混乱。OTel推动GenAI语义规范建设,其SemConv可统一数据语言、支撑治理、降低接入成本。2025年,阿里与蚂蚁团队在OTel基础上建模并推进内部落地,2026年开源为厂商增强标准。该规范新增Entry/Step Span、Skill语义、Token级推理观测,在多场景落地。GenAI Utils封装语义规范,提供简洁API,支持多种框架插桩。未来将在多方面持续努力,推动GenAI可观测建设。
AI 深度研究员
更新 1 篇#1吴恩达:不会有所谓的“AI 就业末日”
2026年4月美国新增非农就业远超预期,失业率稳定,但“AI将导致大规模失业”讨论热度高。吴恩达指出“AI就业末日论”有利益驱动,前沿AI实验室借此让技术更有价值,AI公司改变定价逻辑,企业用其作为裁员公关话术。而数据显示,多数企业认为AI对招聘无实质影响,软件工程师岗位招聘依旧强劲。历史上电子表格软件未使会计师失业,反而创造更多岗位。如今主流媒体开始质疑“就业末日论”,吴恩达认为AI会带来就业大爆发,创造更多AI工程岗位,促使岗位技能结构演变,这是技能重置窗口期,不应将个人职业调整夸大为就业市场崩塌。
AI大模型应用实践
更新 1 篇#1超长 Agent 任务如何不崩盘:Claude Code 上下文管理机制深度拆解。
文章深度拆解Claude Code上下文管理机制。企业级软件任务中,Coding Agent面临上下文管理难题,Claude Code的上下文管理机制至关重要。其上下文至少含七类输入,进入时机和预算逻辑不同,遵循在正确时间、位置放正确粒度信息的原则。预算管理有关键阀值,还有熔断保护机制。加载机制上,规则文件按作用域分层读取,文件加载用LRU缓存+变更感知。卸载机制分五层,从轻到重包括大工具结果落盘、轻量级清理、实验性压缩、全量压缩和“逃生”压缩。最后为长任务Agent开发者提供了不同上下文分开管理、提前规划预算、分级处理工具结果、重建压缩现场、配套卸载机制等启示。
京东技术
更新 1 篇#1抽丝剥茧探穷境!一次数据库JSON字段的深度使用实践
文章围绕数据库JSON字段深度使用实践展开。系统为满足不同业务诉求,将通用与个性字段隔离,用JSON类型字段存储。介绍常用JSON函数后,给出典型案例。扩展字段存储和查询方面,有动态扩展查询和元素包含条件使用案例,前者支持动态增减属性条件过滤库存,后者涉及设备组、批属性、序列号条件。数值管理深度剖析案例中,华冠场景用JSON字段实现重量库存管理,更新时发现诸多问题。如json_set赋值依赖字段非null,需初始化历史null值字段;批量更新时部分明细stockWeight为null会使extend_content被置为null,通过调整代码解决;所有明细stockWeight为null时SQL语法错误,将ELSE改为WHEN THEN解决。此外还提出新的批量更新思路。
思特沃克洞见
更新 1 篇#1智能体 AI 正在重塑客户体验:一场设计范式的永久变革
智能体AI在客户体验领域潜力巨大,正弥合自动化与人工辅助的鸿沟,带来超个性化体验。智能体化客户体验落地需企业数据等具备可访问等特性。其应用从动态个性化开始,核心是对客户旅程编排加速,如助力保险申诉。客户体验格局因AI驱动的购买旅程改变,消费者偏好多元,需赋予选择权。可组合企业是智能体化CX的基石,打破技术孤岛,组件能灵活组装,要设定“护栏”并加强治理,为持续改进提供底层结构。
腾讯云TVP
更新 1 篇#1腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路
4月24 - 25日,腾讯云TVP主办「硬核突围 智见未来」活动,首创“两天三站”模式,走进银河通用、NVIDIA、福田戴姆勒三家企业。在银河通用,展示具身智能成果,分享相关技术与实践;NVIDIA站介绍了前沿场景,还探讨腾讯WorkBuddy及AI Agent相关话题;在福田戴姆勒,参观制造流程,分享AI安全新范式,进行热点话题观点PK。活动串联起AI产业链,强调产业变革需全栈协同,未来腾讯云TVP将继续推动产业进化。
支付宝体验科技
更新 1 篇#1把 UI 生成接进流水线:基于半监督评测体系的 UI 自动化生产实践
文章源于支付宝技术部黄兆嵩在QCon大会演讲。因传统UI生产流程难适应需求,基于AI的生成式UI技术兴起。作者分享实践:一是高质量UI生成,针对prompt管理难、需求描述简单、设计稿还原差、生成结果无品牌特色等问题,提出搭建prompt工作台、需求改写、训练组件检测模块、建风格管理仓库等解决办法;二是在LUI中应用AI生成,采用流式渲染和生成式UI召回方案,解决体验和成本问题;三是实现有效监督与迭代优化,用自动机审和人机协同审核解决人工质检瓶颈,还能自动迭代prompt。最后对生成式UI发展提出思考。
得物技术
更新 1 篇#1BP Claw 破解 AI 编码输入难题 ——FlinkSpec 需求智能化实践|得物技术
文章围绕BP Claw破解AI编码输入难题展开,介绍其在FlinkSpec需求智能化实践中的应用。FlinkSpec是实时数仓的AI工程化底座,BP Claw位于其上游,确保PRD文档质量。BP Claw设计贴合工作流,具备智能需求转化、PRD质量评分、自动拉群等核心能力。在技术上,采用省Token技巧、避免幻觉策略及打磨Skill的方法。与FlinkSpec联动可提升PRD质量,进而提高AI Coding效率。落地运营通过成熟度评分体系、质量趋势追踪和最佳实践沉淀推动产品落地。文章还给出快速上手方法和注意事项,并展望后续发展。
职场Bonus
更新 1 篇#1裸辞九个月,降薪跳槽,一个80后营销人如何“上岸甲方”?|百万年薪系列013
本文讲述80后营销人于成龙的职业逆袭之路。2008年他入行广告业,在资源匮乏环境中磨练基本功。2011年加入正邦,完成从野路子到系统派转变。2015年转至180China,积累电商营销经验并反思乙方模式。2016年他Gap一年后加入南航,发起世界杯营销项目。2020年入职长龙航空,因行业局限于2021年离开。同年加入安恒信息,搭建赛事营销体系,实现从营销操盘手到复合型专家进阶。2023年他辞职创业,成立联盟助力企业出海。2025年担任亚沙会开发处副处长,完成从乙方执行者到赛事组织者的跨越。
墨刀
更新 1 篇#1墨刀AI再进化!基于设计系统生成React代码的App应用
墨刀AI进行重大更新,上线AI生成App能力。它先与用户对齐需求,像产品专家一样询问核心定位等问题。内置行业标杆级设计系统,能基于选定系统生成基于React/HTML代码的App应用,代码结构清晰、遵循规范、可直接交付。生成结束后会给出智能建议,支持导出至墨刀精修。此外,墨刀AI Agent还提供AI生成原型、图片转原型等多个产品设计利器,覆盖产品经理全工作流,让想法到落地形成闭环。
爱奇艺技术产品团队
更新 1 篇#1别让AI瞎猜了:用Harness Engineering 终结无限返工
文章围绕Harness Engineering展开,指出AI编程工具进入研发日常,但交付时遇问题,因任务依据不完整致返工。Harness Engineering旨在让AI融入稳定、可协作的研发流程。理论上,它从写代码转向跑完整链路,强调工程信息对agent的重要性,最小可用harness由任务约束、工具执行等五类组成。方法上,要固定信息落点,明确任务流转链路,模板初始化让agent先解读。实践中,前端分设计、状态、实现三层,后端分依据、验证、实现三层,工具可替换,职责分层要稳定。落地时可从轻量harness开始,分阶段推进,明确其适用边界,强调人仍需参与判断。
淘宝设计
更新 1 篇#1AI会场探索实践
文章围绕AI会场探索实践展开。AI会场是用自然语言生成符合淘天营销标准的会场视觉素材。当会场生产规模扩大,完全人工定制成本高、周期长,单纯用模板又缺乏风格和个性。AI会场需将确定性结构标准化、可变部分参数化。从运营操作看,构建了“输入 - 生成 - 交付”链路,实现聊天即创作的全链路闭环。具体流程上,系统先理解业务需求,将自然语言翻译成视觉参数,通过参数化实现丰富效果。还通过训练自动替换编辑模型解决稳定换品问题,纳入动态生成让画面更生动,并进行多行业泛化验证。AI会场核心是串起从需求到交付的生产链路,解决规模化与个性化的平衡问题,最终目标是形成可复用的系统能力。
滴滴技术
更新 1 篇#1多轮 Agent 场景下,滴滴的 EAGLE-3 训推加速实践
文章围绕多轮 Agent 场景下 EAGLE - 3 训推加速展开。先指出 Agent 场景推理延迟被放大、解码有瓶颈,投机解码需长序列训练。EAGLE - 3 训练有显存问题,源于多层特征融合和 TTT 机制。长序列训练显存瓶颈在中间状态,需序列并行,为此滴滴实现 USP。USP 将 Ulysses 和 Ring 结合,采用“先分支、再融合”解耦计算,兼顾显存、稳定性和吞吐,补齐工程地基,使单机 8 卡可稳定支持 128K 上下文训练。实测 EAGLE - 3 相比 MTP,Accept Len 约为 2.2 - 2.3 倍,P95 TPOT 降低 35% - 44%,Mean TPOT 降低约 59%。最后提出当前挑战及后续规划,相关实践已贡献至 SpecForge 开源社区。
张鹏科技商业观察
更新 1 篇#1DeepSeek 融资后,大模型领域会有什么新格局?
业界传闻 DeepSeek 首轮融资或达 500 亿人民币,已打破纪录且超募。现阶段提升模型智能水平靠近高投入的工程和资本问题,智能也逼近自进化临界点。中国模型领域形成两个共识,一是要尽快跨过临界点,二是比拼持续加速度。中国大模型牌桌可能有三类玩家:科技巨头有强大主营业务,投入模型研发是必然;模型创业公司技术敏锐,但需解决持续投入问题;以 DeepSeek 为代表的第三类玩家有一定业务支撑,且 DeepSeek 开源和整合国产算力的战略站位独特。此外,米哈游创始人创立的 Anuttacon 也可能成为第三类玩家重要力量。
前端充电宝
更新 1 篇#1AI 金瓶梅游戏爆火,前端也能做RPG游戏了!
近期《金瓶梅·西门庆穿越篇》互动游戏爆火,它由普通创作者用Yoroll平台,三天内无代码完成。Yoroll是AI原生互动影游平台,将生成视频和做互动游戏结合,与传统游戏开发不同,能降低创作门槛,让短视频创作者等也能做轻量互动影游。作者试玩发现其操作简单,选择影响剧情走向。作者用ChatGPT写修仙梗概,Yoroll自动完成生成角色、界面、分镜、视频并合成游戏,将创作流程清晰拆分。这表明AI视频正从生成内容转向生成可玩体验,普通人也能创作爆款游戏。
哔哩哔哩技术
更新 1 篇#1bili-fe-workflow —商业化智能开发工作流实践
文章围绕bili-fe-workflow商业化智能开发工作流展开。AI虽在开发各阶段有介入,但缺乏统一工具和标准化流程。为此,从prompt工程演进到Harness Engineering,构建了智能开发工作流。介绍了.workflow知识库,解决AI对项目整体结构化认知不足的问题,与开发流程协作紧密。还阐述了prd - preprocess命令,可将原始需求文档转换为结构化开发文档,减少理解偏差。智能开发工作流分D2C和Dev两条路径,D2C实现设计稿到UI代码的自动化,Dev动态规划执行序列。此外,介绍了自动化测试、AI Mock工作流的实现方案、使用场景和方式。最后指出AI时代前端范式变革,工作流应沉淀为团队能力。
浮之静
更新 1 篇#1浅谈 AI 超级应用
文章探讨AI从模型神话到软件工程秩序回归的趋势。AI正从“回答系统”走向“行动系统”,需接入成熟软件工程结构。以Codex为例,它进入“开发任务组织”阶段,有多轨运行模式和沙盒隔离,采用浏览器双轨控制,实现控制面与执行面解耦。Agentic Web Runtime架构复刻分布式软件分层。Ralph Loop解决长周期任务上下文腐蚀问题。Markdown与HTML在AI输出格式上有争论,Google的A2UI是工程解法。Bun的Zig→Rust迁移体现复杂系统成熟后的秩序重建。AI技术演进是向标准协议回归,驯化复杂智能系统。
Kimi智能助手
更新 1 篇#1Kimi WebBridge:让 AI 帮你操作浏览器
月之暗面推出面向本地AI Agent的浏览器插件Kimi WebBridge,可让AI像用户一样操作浏览器,带着用户登录状态进行点击、滑动等操作,且不占用鼠标键盘。它能自动化完成网页重复性繁琐操作或定时任务,文中分享自动化信息整理和复杂操作自动化两个案例。使用时,安装支持Skill的本地AI Agent的用户,在浏览器应用商店安装扩展插件,再让AI Agent安装本地守护程序和技能即可。若部署Kimi Claw Desktop,可直接使用。还可创建专用CLI工具执行重复任务。
Unity官方平台
更新 1 篇#1Unity中国资源商店推荐系列 | Odin开启高效开发新体验
文章介绍了上架Unity中国资源商店的Odin Inspector & Serializer插件。开发者在Unity开发中面临工具缺乏和代码复杂的矛盾,而Odin能打破这一矛盾。它由瑞典Sirenix Development Studio出品,可提供本地化服务与技术支持。通过可视化设计器,用户能快速构建工具。其核心技术包括零侵入集成、Inspector界面增强、序列化一切、强大工具集等。它适用复杂数据管理场景,经性能优化,能提升开发速度和代码可维护性,激活团队潜能。