231

WAIC 2025 & 扣子开源 & CodeBuddy

WAIC

[甲子光年] 世界人工智能大会 AI产业 国产算力

别只看大模型了!WAIC 2025揭秘:算力、机器人、产业AI……AI的下半场有多燃|甲子光年
本文介绍2025世界人工智能大会(WAIC 2025)。其规模创历届之最,反映出开发者走向舞台中央、机器人让生活更赛博、AI向产业端深入的趋势。H1馆展示算力、模型、智能体,国产算力和模型不断进步;H3馆有具身智能机器人、机械制造及智能硬件创新产品;AI已渗透各领域,如产业智能化、智慧城市、智能驾驶等,AI基础设施为产业渗透提供支持,预示AI变革充满无限可能。

[蚂蚁技术AntTech] 世界人工智能大会 蚂蚁集团 AI应用

又来到 WAIC!带大家逛逛蚂蚁展区
2025世界人工智能大会在上海开幕,本文带读者逛蚂蚁展区。AI健康管家AQ是热点,获多项大奖,提供超100项功能,服务超1亿用户,发力“医生AI分身”技术。现场还有金融、生活等场景创新应用。蚂蚁攻坚AGI,在大模型等层面进展显著且积极开源。面向未来,布局智能体领域,搭建支付基础设施,旗下科技业务助力企业转型,国际业务服务多国。

[阿里巴巴] 世界人工智能大会 阿里巴巴 AI产品

你好,世界人工智能大会
7月26 - 29日,世界人工智能大会展览在上海世博展览馆开展。阿里展区亮点颇多,阿里云百炼入选「镇馆之宝」;夸克AI眼镜首次亮相,还带来AI相机;通义千问AI编程大模型Qwen3 - Coder让小白程序员效率大增;阿里国际AI解决方案Marco获SAIL之星。此外,展会还有“天猫精灵全屋智能”“达医智影”等产品,阿里专注完善AI基建与开源开放促生产力转化。

[京东技术] WAIC 2025 京东AI JoyAI

WAIC 2025,京东AI Joy起来
WAIC 2025上,京东AI带来新亮点。京东大模型品牌全新升级为JoyAI,呼吁大家一起Enjoy AI。现场有机器人、机器狗灵性互动,AI玩具暗藏巧思。物流方面,AR眼镜、无人配送车、无人机展现高效。京东云JoyAgent全面开源,承担京东员工超18%工作。京东云全栈AI基础设施有极致性能与性价比,助力企业重塑生产力,展区让高效智能可感。

[MacTalk] 百度 AI WAIC大会

你以为百度慢了,其实它在走一条最难的路
本文介绍了2025 WAIC上百度的表现。百度展现出“超级有用”的AI策略,构建全栈架构。如萝卜快跑是大模型在物理世界的验证,商业化步伐加快;百度慧播星推出的NOVA数字人技术,在直播场景表现出色。百度还具备稳定算力、灵活开发框架和可落地应用场景,其“从芯到云到端”的全栈布局是长期主义路线,目的是让AI解决实际问题,推动行业可持续发展。

国内

[字节跳动技术团队] TRAE 2.0 SOLO AI开发工具 软件工程

The First Context Engineer:TRAE 2.0 SOLO 发布
7月21日晚,TRAE SOLO正式发布,标志TRAE进入2.0阶段。此前TRAE已有Cue代码补全、Chat问答、Agent代码生成三大核心能力,月活超百万。SOLO作为“Context Engineer”,以“任务中心”为核心,可实现全流程闭环。其架构革新,有SOLO Builder及四大Context工具。现场演示从需求到上线“一键式”交付。圆桌讨论中,各方肯定SOLO优势,对其未来发展充满期待。

[拔刀社] 字节跳动 Coze开源 开发者机会

为什么字节跳动突然开源Coze?背后有哪些机会?

https://github.com/coze-dev/coze-studio
2025年7月27日晚,字节跳动AI智能体开发平台Coze宣布开源,不过并非完全开放,核心组件未放出,部署体验也有不便。开源原因一是盈利瓶颈,平台两端收费难、投入产出失衡;二是战略调整,分离B端工作流与C端产品。未来平台可能加快扣子空间迭代、云服务落地,提升公有云价格,对开源版核心插件收费。开发者可聚焦To B场景开发、成为开源社区建设者。

字节跳动 TrafficRoute GTM 流量调度

揭秘字节跳动内部流量调度与容灾实践【下】
本文介绍字节跳动TrafficRoute GTM的Perf - 智能路由模式。先介绍其依托全球探测节点实现流量质量感知,有GEO - 基础路由和Perf - 智能路由功能。Perf - 智能路由含感知和策略中心,有性能优先、容量优先、负载反馈等模式。还分享内部实践成果,如RTC实时音频业务降低成本、时延,千万QPS业务降成本提性能,302服务提升端上播放质量,助力业务应对超大规模流量。

[Founder Park] AI Coding Trae Cloud IDE

Trae 核心成员复盘:从 Cloud IDE 到 2.0 SOLO,字节如何思考 AI Coding?
文章是 Trae 核心成员对从 Cloud IDE 到 2.0 SOLO 的复盘。团队起初投入 Cloud IDE 技术优化,虽取得技术胜利,但因市场不成熟转向 Native IDE。AI Coding 分辅助编程、结对编程、自驱编程阶段,Trae 在各阶段均有成果。2.0 版本推出以 AI 为中心的 SOLO 模式。作者认为 AI 是高级实习生,未来 IDE 可能不再以代码为中心。

[大淘宝技术] 多模态大模型 淘宝商品理解 家装商品尺寸识别

如何利用多模态大模型进行淘宝商品理解?
文章围绕利用多模态大模型提升淘宝家装商品尺寸识别能力展开。先介绍精准尺寸信息对家装搭配的重要性,提出利用多模态大模型提取知识的目标。接着阐述方法,包括用Prompt工程筛选尺寸图片、总结Prompt构建经验;通过指令监督微调(SFT)让模型学会推理步骤,采用混合训练法;还运用强化学习(RL)如GRPO提升模型性能,最终采用SFT和RL协同优化策略提升模型稳定性和准确性。

[大淘宝技术] 互联网2C业务 分布式框架 Java

面向互联网2C业务的分布式类Manus Java框架
文章介绍阿里巴巴推出的分布式类ManusAgent框架ali-langengine-dflow,用于解决现有Agent架构在互联网2C业务场景的局限。先分析主流架构问题,提出分布式服务端与异构C端混合架构。阐述构建体系指导思想,采用基于Java Monad的DFlow库实现Manus Agent。介绍技术体系架构及组件,给出使用示例和完整架构。最后提及未来完善基础能力、发挥架构优势,探讨AI工程边界问题。

[大淘宝技术] Cursor编程 AutoGPT Claude4.0

我的Cursor编程实践经验分享
本文分享Cursor编程实践经验。其使用效果依赖有效Rules、正确开发流程和标准Prompt,MCP工具可增强功能。介绍标准PE写法、好用的CursorRules及有帮助的rules。指出Cursor在大型需求和深度研究方面不足,可借助DeepResearch、Claude 4.0等。还介绍AutoGPT原理、终止机制和内置Prompt系统,Claude 4.0新功能及双模式优势。

[阿里云开发者] AI编程 代码库索引 Cursor

好奇心之旅:Cursor代码库索引机制的学习笔记
作者作为AI先锋队成员,使用Cursor工具提升研发效率,因好奇其代码库索引机制展开探索。先从Cursor官方文档了解工作过程、隐私安全及功能效果;接着学习Merkle Tree原理和应用,探究turbopuffer架构;又研究开源方案Continue的索引更新和向量检索流程,还发现其sync模块用Merkle tree做代码库检测。虽拓展技术视野,但仍有诸多问题待研究。

[阿里云开发者] 深度学习 模型选型 预训练模型

AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?
文章围绕深度学习模型选型展开。先介绍模型架构与模型的区别,架构是无参数的设计图纸,模型是训练后的实例。接着列举常见架构,如CNN用于计算机视觉、Transformer用于NLP等。选型时多基于预训练模型微调,有标准微调、监督微调等方法。最后以IMDB影评数据集为例,展示用预训练的bert - base - uncased模型进行情感分析的完整流程,包括数据准备、模型训练、评估及自定义测试。

[阿里云开发者] Qwen3 - Coder AI 编程 开源模型

Qwen3-Coder开源:面向世界的智能编程引擎
2025 年 7 月 23 日,通义千问的 AI 编程大模型 Qwen3 - Coder 正式开源。它有卓越代码和 Agent 能力,率先开源 Qwen3 - Coder - 480B - A35B - Instruct 模型。通义团队还开源命令行工具 Qwen Code,其 API 可与 Claude Code、Cline 等协同。该模型在预训练和后训练阶段有技术亮点,还给出与各工具搭配使用方法、API 调用示例,未来团队会继续提升其效果。

[阿里云开发者] AI编程 上下文陷阱 编程工具

AI写代码的“上下文陷阱”:为什么AI总是写错?如何系统性解决?
文章围绕AI写代码的“上下文陷阱”展开。首先介绍充分使用模型能力的要点,包括合理任务分解、完整背景信息、精确指令描述和有效验证反馈。接着阐述AI协作编程方法,如应用级记忆结构和AI辅助记忆维护。还提及代码生成与测试的策略,要平衡效率和质量,对AI进行约束。真实案例展示了记忆维护、方案生成等过程。最后对比编程工具,指出Claude Code能力强但费用高,Cursor放开Pro订阅错位竞争。

[阿里云开发者] AI编码 后端开发 研发流程

AI编码不是梦:手把手教你指挥Agent开发需求
文章聚焦AI编码实践应用,以增删改查为例介绍后端开发流程,包括准备技术方案、工程结构等材料,分层拆解各环节。分析AI编码实际应用的问题,提出在代码设计阶段划分工作,通过技术方案模板、工程结构和Prompt提示词与AI沟通。列举3个生产案例,AI代码生成占比可观。最后表示要践行AI First,程序员应提升能力,未来可探索更高阶AI辅助和自动化任务。

[阿里云开发者] 模型蒸馏 Qwen3模型 模型微调

10分钟微调,让0.6B模型媲美235B模型!免费体验进行中
文章介绍让Qwen3 - 0.6B模型媲美235B模型的方案。先阐述模型蒸馏概念,即借助大模型数据微调小模型。接着说明方案路线,包括数据准备、模型微调和效果验证。还介绍配置计算环境、下载并微调模型的步骤,微调约10分钟。最后通过准备测试数据、设计评测指标等验证效果,微调前准确率14%,微调后达98%,成功完成模型微调。

[阿里云开发者] 上下文工程 智能体 大模型

上下文工程如何重塑智能体的“思考方式”?
文章介绍上下文工程重塑智能体“思考方式”。先以智能体产品经理回复研发为例,说明上下文工程能让智能体像人思考。接着阐述从提示词到提示词工程,再到上下文工程的演进。指出构建上下文工程很必要,因为上下文可能带来中毒、干扰、混淆、冲突问题。然后介绍4种编排流程及优缺点,最后给出智能检索、隔离、修剪、压缩&总结等常见策略,这些策略是构建大模型应用基础。

[腾讯技术工程] CodeBuddy AI辅助开发 腾讯云

任务紧急,CodeBuddy是如何成为“第二双手”的?
文章以容灾中心开发项目为例,介绍CodeBuddy如何成开发者‘第二双手’。项目开发时间紧,前端开发时间受限。CodeBuddy AI IDE参与开发,承担界面代码生成、API定义封装、业务逻辑生成等角色。通过规范配置、原型图输入生成界面代码,开发MCP协议工具生成API。最终提升开发效率和质量。未来规划提升UI精度、发挥MCP和结合Figma能力。7月22日,腾讯云CodeBuddy IDE开启内测。

[腾讯云开发者] AI Search RAG DeepSearch

一文读懂AI Search:从RAG到DeepSearch
文章围绕AI Search展开,从RAG到DeepSearch。因LLMs内在知识有限,检索增强技术RAG应运而生。RAG历经简单固定流程、优化用户问题与检索技术、向自主智能体进化三阶段。Agentic RAG面临知识和能力边界问题。在此基础上发展出DeepSearch,它与Agentic RAG技术范式类似。未来,AI Search将向通用型智能体发展,训练方式也从有监督微调向强化学习后训练过渡。

[京东零售技术] 大模型 电商定价 价格策略

大模型如何算出最优价格?电商定价策略的变革实践
文章介绍大模型算最优价格及电商定价策略变革实践。先设计模仿消费者购物算法,分三步为商品提价格建议,已用于自营新品审核。建模遇覆盖全品类、商品信息复杂、可解释性难题,用 RAG 架构解决。通过过程奖励与树搜索优化模型,经预训练和强化学习。实验显示,此方法准确率从 44%提至 74%,推理速度数秒完成。后续可端到端联合训练及引入对抗学习优化。

[小红书技术REDtech] 小红书 JDK升级 性能提升

小红书JDK升级带来10%整体性能提升,这份升级指南收好了!
文章介绍小红书JDK升级情况。因业务发展,JDK8难满足需求,升级有成本、稳定等多方面收益。升级中G1GC、JVM Bug有优化,也存在兼容性和推进风险。团队采用特定模式升级,通过参数优化、源码改造等解决问题。升级后CPU利用率降10%,GC卡顿降50%,稳定性提升。未来计划以OpenJDK21为底座,投入RedJDK21建设。

[转转技术] AI代码生成 代码知识库 RAG

AI 如何帮你 “挑” 出适合自动化生成的代码?新手也能轻松上手
文章指出 AI 生成代码常“水土不服”,原因是缺乏项目专属逻辑。引入代码知识库与 RAG 可解决此问题,知识库存储结构规范、历史经验和依赖关系等信息。通过解析代码、持续集成和手动补充构建知识库,AI 生成代码前先“补课”,实现包名匹配、依赖补全等。实战表明接入知识库可提升代码质量和复用率,还介绍通义灵码使用方法,知识库能提升效率、显化知识、本地化 AI 能力。

[转转技术] 游戏账号大图 Java开发 性能提升

游戏账号大图生成
转转游戏账号业务为突出账号重点特色,将相关信息生成大图展示。初期前端生成大图,利用浏览器渲染,结合后端物料与Puppeteer截图。但上线后出现超时问题,尤其拼接图片增多时更严重。后改为后端用Java的awt包画图API生成,性能大幅提升,生成耗时从平均2 - 3秒降至毫秒级到秒级。还提升了用户体验,通过模块化实现业务与渲染解耦,已应用于多款游戏。

[奇舞精选] MCP 聊天机器人 学术论文管理

MCP - 了解MCP基础知识并构建论文管理聊天机器人
文章围绕MCP展开,介绍其为简化LLM连接工具和数据源的开源协议。逐步演示构建基于MCP的论文管理命令行聊天机器人,涵盖本地环境配置、MCP概念、构建及测试MCP服务器、使用第三方MCP服务器、创建主机和客户端等步骤。聊天机器人可在arXiv搜索论文、归类文章等。最后总结MCP使构建和维护复杂AI系统更易,并提供相关资源。

前端开发 Cursor 代码影响范围分析

谁说前端改动看不出影响范围?我用 Cursor 找到了隐藏炸弹
文章围绕用 Cursor 进行前端代码影响范围分析展开。先指出维护老项目时前端改动常出现意外,根源是缺乏测试前评估风险能力。对比传统方法与 AI 工具,传统方法难理解语义变更影响。构建基于 Cursor 的半自动化工具,分提取 Code Diff、构造 Prompt、投喂 Cursor 三步。使用体验显示 Cursor 能识别依赖、理解语义变更、前置化预警,但存在 Token 成本高、结果偶有不准确问题,此次尝试展现了 Cursor 在代码分析方面的潜力。

[前端充电宝] 前端安全 npm 攻击 依赖安全

前端扫毒风暴
近半月,npm 社区事故频发,包括多个知名包被篡改、维护者账号被盗、热门包 form - data 现严重漏洞。如攻击者搭建钓鱼网站盗账号发恶意版,is 包被盗用发布恶意版,form - data 因随机数算法问题存 HPP 风险。开发者可通过启用 2FA、锁定依赖版本等降低风险,强调前端开发也需重视安全。

[前端充电宝] 字节跳动 AI代理开发 前端

刚刚,字节跳动开源了这套系统,前端的新方向来了!
2025年7月26日,字节跳动开源AI代理开发平台Coze的两大核心工具Coze Studio和Coze Loop。Coze是今年推出的平台,目标是让不会写代码的人做出AI应用,有无代码工作流等特点。Coze Studio是开发平台,负责搭建AI代理;Coze Loop用于调试和优化。二者配合涵盖AI代理全流程。此次开源或使前端角色升级,是前端开启AI实践时代的新起点。

[前端充电宝] Node.js form - data 漏洞

一行 Math.random(),带崩整个 Node.js 生态?这个周下载超 1 亿次的 npm 包爆出严重漏洞!
本文介绍每周下载超1亿次的npm包form - data的严重漏洞。它是Node.js处理multipart/form - data请求的工具,为Axios间接依赖。漏洞出在4.0.0系列版本,用Math.random()生成multipart边界字符串,该方法不“随机”,攻击者可能猜到边界构造恶意请求。官方将其换成crypto修复。受影响版本有<2.5.4、3.0.0 - 3.0.3、4.0.0 - 4.0.3,建议排查项目依赖,锁定安全版本或用Node原生FormData。

[前端充电宝] Node.js 版本管理工具 前端开发

切 Node.js 版本这件小事,居然也有这么多门道?
文章指出前端开发中 Node.js 版本更新快、项目需求不同,需版本管理工具。介绍多款工具:nvm 老资格,适合老项目开发者;nvm - desktop 有图形界面,适合初学者;fnm 速度快,适合频繁切换者;volta 锁定工具链,适合团队项目;vfox 国产,支持多语言;asdf 插件多,适合多语言项目;mise 是 asdf 现代替代。最后总结各工具适用人群。

[前端充电宝] 前端开发 Ultracite AI协作

再见 ESLint 和 Prettier,用 AI 写代码的新格式化搭档登场!
文章介绍了前端开发新工具 Ultracite。它围绕 Biome 构建,零配置,集代码检查、格式统一等功能于一体。相比 ESLint 和 Prettier,它一行命令完成配置,格式化极速,有现代规则集,对 AI 友好,能与主流开发流程融合。使用时只需四步,适合强调效率、规范和 AI 协同的现代开发场景,值得尝试。

[前端圈] Vue Vite 前端生态

Vue 与 Vite 生态最新进展:迈向一体化与智能化的未来
本文基于 VueConf 2025 尤雨溪演讲内容,介绍 Vue 与 Vite 生态进展。Vue 过去一年增长率达 50%,3.6 版重写响应式系统。Vapor Mode 是全新编译渲染模式,性能提升显著。Vite 周下载量 3200 万,大量框架基于其开发。VoidZero 公司致力于构建一体化工具链,Rolldown-Vite 性能优越,Vite+ 定位类似 Cargo for JavaScript,更 AI 友好。

[MoonWebTeam] 开闭原则 软件设计 代码扩展

开闭原则:软件设计的核心准则与实践权衡
文章深入剖析开闭原则(OCP),它是 SOLID 原则焦点,强调软件实体对扩展开放、对修改关闭。介绍其概念、演变,指出遵循可提升扩展性和维护性,过度使用会致代码复杂。还分析适用与有害场景,澄清常见误解,并给出 TypeScript 示例和代码对比。最后提出应用 OCP 避免过度工程化的实践,强调要平衡使用,发挥其价值。

[AndroidPub] Android IPC 进程间通信

Android IPC 进程间通信全掌握
文章深入剖析 Android IPC 机制,涵盖 Service、AIDL、Intent 等。介绍在独立进程运行 Service 的方法及影响;讲解 AIDL 定义接口、实现服务和客户端绑定;提及 Intent 显式和隐式使用;阐述广播、Messenger、FileProvider、ContentProvider 的使用场景与实现方式。最后指出选 IPC 方式要考虑数据量、复杂度和通信模式,以保障通信高效、安全、易维护。

[数据可视化 AntV] AntV 可视化开发 智能体

AntV 图表专家智能体,轻松搞定可视化需求
文章介绍了AntV图表专家智能体。AntV是企业级数据可视化方案,但开发有门槛。传统开发和通用大模型生码有痛点。而AntV图表专家智能体基于LLM+AntV专家知识库,可自动生成代码,降低开发门槛,支持多轮调优。还介绍了其在WeaveFox智能体市场、VSCode、Cursor中的使用方法,最后欢迎用户加入交流群提建议。

[高级前端进阶] 前端开发 img标签 性能优化

前端开发的你,其实并没有真的掌握img标签!
文章围绕 HTML 标签展开,介绍其核心知识与实战技巧。先阐述基本用法,强调 src 必写、alt 推荐添加。接着详解常用原生属性,如 src 不同路径类型,alt 用于替代文本,width 和 height 防布局抖动等。还提及性能优化,如懒加载、CDN 等技术。最后给出 SEO 与可访问性注意事项及最佳实践,指出合理用属性、关注性能和可访问性是前端开发和 SEO 优化必备技能。

[Miyue的前端圈] 滚动驱动动画 animation - range Saron Yitbarek

滚动驱动动画的animation-ranges动画范围备忘录
文章是滚动驱动动画的animation - ranges备忘录。先介绍animation - range与view()时间轴是拍档,能精准控制动画起止。它是animation - range - start和animation - range - end的简写,可接受timeline - range - name和length - percentage值。接着详细介绍不同timeline - range - name值(如cover、contain等)的含义和效果,还能混合搭配。length - percentage值可进一步定制。最后总结各值默认情况,鼓励发挥创意。

测试开发 CDN稳定性 技术解决方案

测试开发视角:如何用技术破解 CDN 线上稳定性难题?
文章分享测试开发破解CDN线上稳定性难题的实战经验。介绍国际站CDN双架构,即全部出海与动态出海。指出CDN稳定性对测试开发是挑战,有高频变更、数据黑盒、影响用户体验等痛点。从后端接口校验、前端图片检测及进阶优化三方面给出解决方案,如用自动化脚本、数据驱动检测等,最后强调测试开发对保障业务稳定的价值。

AI开发 Kiro Spec驱动开发 工程化

从Vibe coding到Kiro Spec驱动开发模式:为智能研发注入工程确定性
文章介绍了从Vibe coding到Kiro Spec驱动开发模式。在生成式AI浪潮下,Vibe coding由直觉和偶然主导。Kiro开发范式的Spec驱动开发模型是解药,引入Vibe与Spec二元结构。Vibe会话是创意沙箱,Spec会话是工程蓝图。其有外环项目管理层和内环AI运行时层,能解决知识抽象、表示、存储与运行时调用问题,引导AI开发走向确定性可靠,构筑工程化未来。

国外

[谷歌开发者] Gemma 3n 设备端AI模型 开发者

深入了解 Gemma 3n: 创新的设备端 AI 模型
文章介绍了Gemma 3n设备端AI模型。自首个Gemma模型推出,已形成Gemmaverse生态。Gemma 3n全面发布,具有多模态设计、针对设备端优化等新功能。其核心MatFormer架构可预提取模型或自定义调整尺寸,还有逐层嵌入、KV缓存共享等创新。它支持音频理解和先进视觉编码器。社区广泛支持该模型,还举办挑战赛。用户可通过多种方式体验、下载和集成Gemma 3n。

[微软亚洲研究院] 大语言模型 CoR框架 数学推理

CoR:多范式思维加持,大模型也能学会“多思路解题”
大语言模型在数学解题上有短板,因依赖单一推理范式。微软亚洲研究院与清华提出CoR框架,融合自然语言、代码和符号三种推理范式,实现多范式协同推理。该框架有新颖视角,可与单一范式优化叠加。在5个数据集上效果显著提升,如CoR - Math - 7B在定理证明和计算任务成绩超GPT - 4等。其靠精心设计的数据构建与训练策略实现跨范式推理,在多种模型评估中表现优异,为构建强大推理系统提供路径。

[夕小瑶科技说] Claude Code 逆向分析 AI编程助手

Claude Code 遭深度逆向!核心技术架构被 95% 还原
本文介绍Claude Code被民间团队shareAI - lab深度逆向,分析出95%准确度的架构。Claude Code闭源但CLI含混淆代码,逆向者用其分析自身混淆代码得出架构。该架构包括用户交互、Agent核心调度、工具执行与管理、工具生态、存储与持久化系统五层。还提到其两大创新:实时Steering技术让任务调度实时可控,智能上下文压缩以内容关键度重构上下文,展现了有工程厚度的Agent产品。

CSS figcaption布局 解决方案

The Figcaption Problem
文章围绕 CSS 中 <figcaption> 布局问题展开。当图片宽度小于容器时,希望 <figcaption> 与图片等宽。作者起初简单设置 max-inline-size 处理,后介绍 Jeff 博客及 Stephanie Eckles 的完美解决方案:设置 figureinline-sizefit-content 并居中,figcaption 使用 contain: inline-size。还分析了用 min-content 处理 figure 时因 imgmax-width: 100% 导致的问题。

Interest Invoker API Open UI Web开发

A First Look at the Interest Invoker API (for Hover-Triggered Popovers)
Chrome 139 正试验 Open UI 提出的 Interest Invoker API,用于创建悬停交互 UI。该 API 让组件通过 HTML 声明、悬停触发,无需 JavaScript。介绍了兴趣触发器、目标及相关规则,指出其虽基于弹出框但理由存疑。还提及 JavaScript 事件、兴趣延迟及相关 CSS 属性,伪选择器等。不过该功能尚处实验阶段,使用中存在一些问题,如延迟设置有 bug,触摸设备触发方式待明确。

JavaScript ECMAScript 2025 新特性

ECMAScript 2025: The best new features in JavaScript
本文介绍了 ECMAScript 2025 中 JavaScript 的新特性,包括内置全局 Iterator 对象,可对可迭代对象提供函数式操作,提升性能;新增 Set 方法,如交集、差集等;支持直接将 JSON 作为模块导入;正则表达式有改进,能避免注入攻击和灵活设置标志;新增 Promise.try 方法,可统一处理异步和同步错误;还添加了 Float16Array 类型数组及相关方法,适用于高性能计算。

产品

[深思圈] AI 产品颠覆 风险评估

深度长文分析|究竟什么样的产品会被AI颠覆?
文章围绕AI对产品的颠覆展开。先指出AI使Product Market Fit大规模失效,如Stack Overflow受影响。接着介绍Ravi的AI Disruption Risk Assessment框架,从用例、增长模式、防御性、商业模式四个维度18个要素评估产品风险。作者认为这是商业逻辑重构,难以量化价值的产品更安全,网络效应在演变。最后给出计算脆弱性得分方法及应对策略,还指出企业软件、教育培训等行业或被颠覆,应转变思维,构建人文价值。

[数字生命卡兹克] 腾讯 AI编程 CodeBuddy IDE

刚刚,腾讯发布了他们的首个全栈AI IDE。
腾讯发布首个全栈AI IDE CodeBuddy IDE,主打产设研一体。它有诸多亮点,如国际版可免费使用Claude4、能生成文档并部署后端、将设计稿一键转网页等。其降低了独立开发门槛,适用于非技术背景开发者。腾讯云开发者产品总经理认为AI编程将分化成两种范式。目前CodeBuddy在内测,需邀请码,作者获50个邀请码用于抽奖。

[新智元] AI Coding MonkeyCode 长亭科技

无惧封禁!Cursor最佳国产平替诞生,彻底告别代码泄露风险
Cursor对中国大陆用户断供且有代码泄露风险,字节跳动等已禁用。在此背景下,清华系的国产企业级开源AI Coding工具MonkeyCode诞生。它首发支持Kimi K2和Qwen3,有安装便捷安全可控、功能强大、双模合一等优点。实测显示其编程高效,还具备代码智能补全功能,后台可记录审计,后续会集成代码安全扫描引擎。它由长亭科技打造,开源地址为https://github.com/chaitin/MonkeyCode。

[火山引擎] 同声传译模型 AI 国际会议

豆包·同声传译模型2.0来了:3s延迟,实时声音复刻
2025年7月24日,火山引擎发布豆包·同声传译模型2.0并全量上线火山方舟平台。它是接近人类水平的中英语音同传系统,有极低语音延迟、0样本声音复刻、智能平衡节奏等优势。该模型已在多个国际会议应用,获央视点赞。还能用于直播、旅游、新闻等场景。其即将在8月上线Ola Friend耳机,更多信息7月30日公布。

Medium 扭亏为盈 资本重组

CEO 复盘:从每月亏损 260 万美元到实现盈利,Medium 如何「断臂求生」?
文章是 Medium CEO 复盘公司扭亏为盈的过程。2022 年 Medium 每月亏损 260 万美元,付费用户流失,内容质量差,还面临治理结构混乱、投资人失去信心等问题。CEO 从财务、品牌、产品和社区等维度入手,通过增加会员、降低成本、精简团队实现盈利,又进行资本重组,放弃投资人特殊权利。自 2024 年 8 月起公司盈利,有了干净财务和简单结构。

[海外独角兽] Surge AI 数据标注 AI行业

bootstrap 到十亿美元 ARR:Surge AI 这匹黑马如何颠覆 Scale 霸权 ?
本文聚焦 Surge AI,该公司 2020 年成立,专注数据标注,2024 年 ARR 超 10 亿美元,超越 Scale AI。其核心为提供高质量数据标注服务,客户涵盖顶级科技公司。数据标注市场分两类模式,人工与合成数据各有优劣。Surge 由 Edwin Chen 创立,坚守质量原则。文中介绍其底层技术,还列举为 OpenAI、Anthropic 服务案例,其创始人团队实力强,在数据标注行业价值凸显。

[InfoQ] 阿里 Qwen3 - Coder 代码模型

阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了
2025年7月23日阿里发布代码模型Qwen3 - Coder,有多个版本,Qwen3 - Coder - 480B - A35B - Instruct支持358种编程语言。还推出开源命令行工具Qwen Code。借助它新手一天可完成资深程序员一周工作,5分钟能生成官网。模型已在多平台开源获5.1k stars,将接入通义灵码,API上线阿里云百炼。训练分预训练和后训练,开发者反馈有好有坏,官方给出与Claude Code搭配使用方法。

[机器之心] 创智“小红书”,AI平台,认知伙伴

创智「小红书」震撼上线,让AI从效率工具进化为认知伙伴
上海创智学院发布创智“小红书”,这是全球首个可主动构建和积累认知的AI平台。它将认知系统化、平台化,用户收藏认知可提升AI认知,实现“收藏即学习,对话即智慧”。该平台还有认知榜单、个性化订阅等功能。其技术基于《交互即智能》论文,采用认知监督范式。通过实验验证了交互价值,体现了“认知伙伴”优势,开启了认知民主化、智慧社会化、文明加速化时代。

[十字路口Crossing] AI职业社交 Boardy AI 社媒运营

这个产品,我先爱为敬了——VC和Agent通话后直接投了 800 万美元
文章介绍硅谷初创公司 Boardy AI,它以 AI 为内核进行职业社交,通过语音对话帮用户建人脉。其使用简单,在 WhatsApp 等平台就能交互,有自动引荐流程。人脉由创始人积攒。试用体验佳,沟通自然。它融资进展快,或由 AI 自主完成融资。在职业社交赛道,实现双边匹配、有温暖感社交,社媒运营用“纸盒人”IP 塑造差异。

AI编程助手 Trae 2.0 上下文工程

比Vibe Coding强100倍!字节 Trae 2.0 携“上下文工程”登场:一句话,从需求干到上线!
字节跳动 AI 编程助手 Trae 发布 2.0 版本,新增具备上下文工程能力的 SOLO 模式,可基于完整信息实现从代码编写到功能交付的端到端开发,用户用自然语言描述需求即可一站式交付应用。上下文工程热度攀升,其兴起源于开发者对 AI 代码信任不足,关键在于缺乏上下文。Trae 迭代快,从仅支持代码问答发展为功能丰富的智能体系统,在 AI IDE 中占得一席之地。

设计

[甲子光年] AI设计 设计师 阿里巴巴

对话阿里设计青云:最好的AI设计工具,不是技术给我们的|甲子光年
本文是「甲子光年」对阿里设计青云的访谈。青云认为真正设计师不会被AI取代,应与AI协作。AI时代设计师能力模型将重构,技法要求降低,工具学习和审美更重要。设计第一性原理是理解用户,阿里的U - sight可辅助用户研究。此外,阿里有多款AI设计工具,如“淘天AI设计师”“堆友2.0”。青云因热爱和坚持在设计道路取得成就,认为设计不能功利。

[AI产品阿颖] Cursor AI应用 设计师

Cursor首席设计师谈 AI 应用的 UI 和 Cursor 的 UX 经验
本文是对Cursor首席设计师Ryo Lu的访谈。他介绍Cursor设计理念,要理解系统并简化功能,满足不同用户需求。平衡IDE熟悉感与扩展性,让其不限于IDE形态。多Agent管理要考虑用户使用差异和任务流程。他工作中收集信息、优化功能,筛选反馈。认为未来界面动态多样,创作流程更高效,团队协作新范式兴起,设计师要发挥整合优势。

Agent

[京东零售技术] 京东零售 OxyGent 多智能体协作框架

京东零售重磅开源 | OxyGent:像搭乐高一样组装AI团队,实现群体智能
2025年7月23日京东零售Oxygen团队开源多智能体协作框架OxyGent。当前多智能体开发面临生态分散等挑战,OxyGent支持开发者灵活组合系统,有极致扩展性和决策追溯能力。它登榜GAIA评测获高分,能快速搭建多智能体系统、实现智能协作等,具备高效开发、智能协作等特性,适合开发者、企业和用户,还诚邀开发者共建开源社区。

[京东技术] 京东云 开源智能体 JoyAgent

100%开源!行业首个企业级智能体
近日,京东云正式开源行业首个100%开源的企业级智能体JoyAgent。它包括前端、后端等,与平台解耦可本地部署。其有五大核心特性,如100%开源、高可用等。相比通用智能体,它能多智能体协同,上线GitHub三天获超1000星标。对个人开发者和企业级开发者都有便利,已接入多模型,有众多模版和插件,京东内外都有广泛应用。

AI Agent JoyAgent 京东

从京东内部走出的开源Agent,能成为标准定义者吗?
本文介绍京东云开源的AI Agent平台JoyAgent。在WAIC大会上,它成焦点。其完全开源,可本地100%复现,解决企业部署难题。在GAIA榜单成绩优异,应对五大技术挑战。它提供网页版测试Demo,体验接近数字员工,虽有文档待完善等小问题,但在定义行业标准上动作和决心大,京东内部应用案例显示其能提升效率和决策水平,有望成企业级IT基础设施必备模块。

[复旦DISC] 多模态大模型 AutoJudger 评测框架

AutoJudger|一个多模态大模型的自主评测智能体
构建多模态大模型成研究热点,但评测成本高成瓶颈。本文提出 AutoJudger 自动化评测框架,结合项目反应理论与智能采样策略。它先估计题目难度和模型能力,再筛选、推荐问题,还有动态记忆机制。实验表明,在多数基准测试中,AutoJudger 优于基线方法,能动态匹配题目难度与模型能力,保持语义多样性,降低评测成本且结果可靠。其数据和框架已开源。

[极客公园] OPPO AI 小布记忆

AI Agent 第一波浪潮过后,OPPO 是怎么闷声做出第一个爆款的?
文章介绍了OPPO在AI浪潮中,以“小布记忆”成爆款的策略。其AI战略围绕直觉、专属、高效、安全。用物理按键解决激活难题,让操作更直觉;构建个人数据资产,采用端云协同架构保障隐私;借助“小布记忆”沉淀个人上下文,实现应用协同,理解用户意图;与苹果、三星对比,OPPO回归人本,目标是让手机进化为个人智能体。

[硅星人Pro] AI智能体 硅谷活动 创业公司

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动
2025年7月17日,GenAI Assembling第五期硅谷Meetup上,Genspark、Lovart、Simular.ai等公司代表探讨AI Agent发展。大家认为OpenAI入场是利好,能科普智能体概念。还讨论了“vibe working”、未来工作时长、智能体工作流程、效率与体验平衡、成本控制、增长指标等话题,最后对2026年AI智能体发展及开发者提出看法和建议。

[十字路口Crossing] AI Agent 小宿科技 杜知恒

2500万美元ARR的Agent Infra创业者说:我们现在处于Agent元年第一天早上6:05|对谈小宿科技杜知恒
本期播客对话小宿科技杜知恒,其公司 ARR 超 2500 万美金。杜知恒介绍公司是一站式 Agent Infra 平台,有小宿智能搜索和 Skyrouter.ai 产品。他讲到创业契机,提及产品发展三阶段及竞争壁垒。还分析 AI Infra 行业变化,指出从“抢卡”到“抢数据”,看好 coding、办公等场景。此外,分享职业选择从二级市场投资到创业的考量,以及创业心得,如重视战略选择、保持开放心态。

[Founder Park] ChatGPT Agent 通用 Agent 强化学习

ChatGPT Agent 团队专访:基模公司做通用 Agent,和 Manus 有什么不一样?
本文是 ChatGPT Agent 团队专访,介绍了其特点、训练方法及未来规划。ChatGPT Agent 结合多种工具,通过强化学习训练,可在工具间共享状态和灵活切换,能处理复杂任务且运行一小时不失控。其应用场景广泛,适用于 B2C 和 B2B 领域。目前虽已实现多种能力整合,但与现实交互存在风险,团队正构建安全措施,未来将提升准确率和交互体验。

[量子位] AI搜索 Agent 小宿科技

AI搜索一夜变天,专为Agent做搜索的赛道能否诞生百亿美金新巨头?
Bing Search API将于8月11日关停,开发者获取优质搜索源变难。AI搜索价值大,市场规模预计2029年达3472亿。传统搜索引擎厂商倾向ToC,技术生态封闭;创业玩家开辟差异化路径。小宿科技自研小宿智能搜索,能力超Bing且价格低,已服务超半数国内头部AI原生应用,或在Agent Infra市场突围。

[智东西] 腾讯AI IDE CodeBuddy 开发工具

腾讯AI IDE发布!四大智能体,一站式搞定开发全流程
7月22日,腾讯旗下AI编程助手CodeBuddy推出国际版IDE,定位整合全流程的AI工具。它覆盖产品设计前期流程,可自动生成PRD和交互设计。以四大智能体为核心,打通从设计稿到可部署产品全流程。智东西测试“美食灵感”应用,经多轮调优交付可用前端页面,支持多端代码输出和一键部署。该IDE完善“从需求到可交付”闭环,降低非技术用户产品落地门槛。

[独立开发] AI智能体 上下文工程 Manus

AI 智能体的上下文工程:构建 Manus 的经验教训
文章分享构建 Manus 的上下文工程经验。项目初期选择押注上下文工程,能快速发布改进。围绕 KV 缓存设计,提高命中率可降低延迟和成本;使用上下文感知的 logits processor 管理工具可用性;将文件系统作上下文,采用可恢复压缩策略;通过‘复述’引导注意力;保留失败尝试助模型适应;警惕少样本学习陷阱,增加多样性。上下文工程对智能体系统至关重要。

行业

软件3.0 软件工程 人工智能

迎战软件3.0时代:新范式、新挑战、新工程
文章指出我们正步入软件3.0时代,这是由生成式人工智能推动的产业革命。软件范式从1.0到3.0层层叠加、共存融合。软件3.0时代面临操作系统大模型化、知识工程化应用、质量重新定义三大挑战。为此,需构建新型软件工程体系,包括升维工程理念、进化工程实践、融合工程体系。开发者角色也将转变,迎接挑战将带来创造力等方面的进化。

[腾讯研究院] AI Coding 软件开发 非共识

AI Coding⾮共识报告丨AI透镜系列研究
文章指出AI正颠覆编程核心定义,软件开发正经历范式级变革,重新定义编程相关底层问题。AI Coding从消费者端到企业端影响力剧增,在融资和收入增长上表现出色。AI Coding公司以小团队快速实现高收入,冲击大公司模式。同时,在产品形态、模型选择等七个方向存在非共识,这些非共识有助于探寻行业发展原因与未来走向。

人工智能 2025趋势报告 共生伙伴

共生伙伴:2025人工智能十大趋势|2025 WAIC报告重磅发布(附下载)
2025世界人工智能大会·腾讯论坛发布《共生伙伴:2025人工智能十大趋势》报告。AI正从“工具”向“伙伴”演进,其角色从单一工具变为“数字员工”“人生合伙人”,还将进入物理世界。报告指出强化学习、原生多模态生成等十大趋势,涵盖大模型、智能体、行业应用等方面,描绘了AI从工具到共生伙伴演化的宏伟蓝图,关乎技术和每个人的未来。

[新智元] AI教父Hinton AI发展 AI警告

AI教父Hinton首次现身中国,合照全网刷屏!预警AI觉醒临界点已至
AI教父Hinton首次现身中国,与市委书记合影全网刷屏。他出身科学世家,家族与中国渊源颇深。他开发神经网络让机器学会深度学习,获2024诺贝尔物理学奖。如今他多次警告,未来10到20年AI或比人类聪明,可能致人类终结、大批人失业。其最新演讲指出AI觉醒临界点已至,还回顾AI起源与发展,探讨AI是否会消灭人类、有无意识等问题。

[海外独角兽] AI投资 AI市场 并购整合

Elad Gil 复盘 AI 投资:GPT Ladder,AI Agent,AI 领域将迎来大规模整合并购
硅谷AI投资人Elad Gil复盘AI投资,指出过去四年AI从“技术迷雾”到“商业马拉松”,应用层进入收敛周期。基础模型LLMs头部梯队明显,Coding是大市场。GPT Ladder指模型升级解锁新场景;AI Agent推动软件商业模式转变。未来AI领域并购整合将成常态,诸多领域待AI重构,如会计、合规等,AI市场正加速收敛。

开源模型 Kimi K2 中国模型

现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen
文章介绍了 Kimi K2 模型的影响力。它是全球最强开源模型,在 LMArena 社区评分第一,超越 DeepSeek R1。发布后受认可,第三方 token 调用量飙升,下载量可观。硅谷科技媒体将其发布比作「下一个 DeepSeek 时刻」。此前 DeepSeek 爆火为行业带来转折,如今全球最好的开源模型 Kimi、DeepSeek、Qwen 均来自中国。开源对模型公司是双赢,能推动模型完善,带来社区支持。