Prompt=代码 & MCP 蛮荒时代
周刊
国内
[哔哩哔哩技术] 服务器故障管理 自动化方案 B站
服务器故障管理实践
随着B站业务发展,服务器数量爆发式增长,故障管理挑战严峻。文章介绍了故障管理实践,先将故障分为软、硬故障等类型,指出传统管理存在发现滞后等不足。接着阐述自动化故障检测方案,通过带内、带外信息采集及规则管理精准定位故障;又介绍自动化维修方案,实现业务上下线和维修过程自动化。整体架构提升了故障管理指标,未来期待智能化监测等方面完善。
[群核科技用户体验设计] 跨文化设计 多语言字体 本地化网站
跨文化设计实践:多语言字体的文化适配术
文章围绕跨文化设计中多语言字体的文化适配展开。指出多语言支持对国际网站很重要,字体选择易被忽视却关键。介绍选择多语言字体要考虑多语言支持、字体系列多样性等因素。还给出泰国站选无环字体 Kanit、日本站选 Noto Sans JP 的案例。强调跨文化设计中字体是连接文化的纽带,真正全球化设计涵盖多维度,理解文化差异是关键。
[ByteDance Web Infra] Midscene AI 自动化代码 JavaScript
使用 JavaScript 优化 Midscene AI 自动化代码
文章指出使用 aiAction
接口汇聚自动化任务易遇问题,陷入 Prompt 调优怪圈。提出优化路径,即从 v0.16.10 起用 JavaScript 和结构化 API 编写自动化脚本,如 aiBoolean
aiString
等,能拆分复杂逻辑,提升稳定性。还给出多个转换示例,介绍常用 API 方法和即时操作方法,最后说明选用 aiAction
或结构化代码取决于实际情况,并提及可检查缓存功能和查看 API 参考。
[数据可视化 AntV] 智能设计 D2V 提示词工程
提示词工程如何实现 D2V
文章围绕提示词工程实现 D2V 展开。先介绍微调和提示词工程原理,微调是二次训练预训练模型,提示词工程是用文本提示引导模型输出。对比二者优劣,微调能深度学习特定领域知识、性能稳定,但耗资源且灵活性差;提示词工程灵活、低资源消耗,但输出不稳定、难处理复杂任务。还阐述提示词工程在图表类型识别、样式还原、数据解析与呈现方面的应用,最后指出其与微调结合能为智能设计带来高效灵活方案。
[得物技术] 社区造数服务 MCP AI造数
社区造数服务接入MCP|得物技术
文章围绕社区造数服务接入MCP展开。先提出AI造数设想,即按用户输入自动编排生成测试数据。接着介绍社区造数服务技术栈基于FastAPI,用uv管理环境。阐述FastAPI - MCP框架的安装、用法。然后说明接入造数服务的升级改造步骤、接入Cursor方法及实操案例。最后总结实践成果,如实现AI驱动测试数据自动化等,还提及未来优化方向和个人感想。
[有赞coder] 有赞 Agent 技术 零售 SaaS
从概念到落地:有赞 Agent 应用与探索
本文源于有赞 Menlo 发布会分享,介绍 Agent 技术及有赞实践。先解释 Agent 概念、组成和多 Agent 系统设计原则。接着讲有赞案例,如加我助手架构演进与技术优化,智能销售提升线索转出率。还指出 AI 时代产品研发面临四个‘不知道’,软件范式改变,需以数据为中心研发。最后展望 Agent 潜力,建议团队从小做起,有赞将深耕并开放岗位。
[有赞coder] AI自动化测试 研发效能 测试系统
AI自动化测试:助力研发效能提升
文章介绍AI自动化测试助力研发效能提升。传统开发模式在自测环节耗时长、影响面评估不全、手动测试易出错。引入的AI自动化测试系统采用模块化设计,含代码分析、AI测试引擎、自动化执行、报告生成模块。该系统已实现代码发布后自动执行测试、报告自动推送,累计执行几千次,发现几百个有效bug,沉淀几十万个用例入参。未来规划增加AI模拟页面操作和AI驱动的单元测试。
[腾讯云开发者] 腾讯会议 告警治理 错误码设计
万字总结:腾讯会议后台告警治理实践——如何才能避免“事后诸葛亮”
文章结合腾讯会议团队实战经验,介绍告警治理方法。指出告警常存在缺失或误告问题,精确告警和推动治理落地困难。通过规范错误码设计,采用三段式设计满足多目标,遵循使用原则和场景。告警策略以智能被调策略为主、辅助策略为辅。团队推动告警消音分三阶段,最终取得显著成果,但告警治理仍需持续努力。
[腾讯技术工程] XNet - DNN 大语言模型 GPU 推理
微信自研高性能推理计算引擎 XNet-DNN:跨平台 GPU 部署大语言模型及优化实践
本文介绍微信自研推理引擎 XNet - DNN,它基于 RCI 框架构建跨平台 GPU LLM 推理能力,支持多主流硬件与操作系统。文中分析 GPU 发展现状及 LLM 推理现状,阐述 RCI 系统优化,如跨平台高级编程范式、Command Tape 技术。还介绍核心算子优化实践,含 GEMM/GEMV、FlashAttention - 2 等。性能实测显示其在多平台领先,未来将从跟进技术、支持平台、性能优化等方面完善。
[阿里云开发者] 大模型微调 LoRA微调 微调实践
大模型微调知识与实践分享
本文分享大模型微调知识与实践。先介绍微调相关知识,包括大模型结构、参数量、显存、存储,模型微调的prompt工程、数据构造、LoRA微调及强化学习方法。后阐述微调实践与工具使用,给出简化流程,如数据构造、请求模型、训练平台选择、超参调整等,还提及微调模型部署、推理加速、测试集分析及评估迭代等内容,并提供相关工具和平台信息。
[IoT物联网技术] OpenAI 可穿戴设备 AI伴侣
OpenAI 推出无屏可穿戴 AI 伴侣设备,将成为MacBook 和 iPhone 之后的“第三核心设备”
近日,OpenAI首席执行官奥特曼向员工预览与苹果前设计师乔纳森·艾维合作开发的可穿戴AI伴侣设备。该设备脖挂式,类似iPod Shuffle,无屏但有摄像头和麦克风,可语音控制、分析环境,能连手机和PC。计划出货1亿台,2027年量产,旨在成MacBook Pro和iPhone后第三核心设备,虽设计引争议,OpenAI仍对市场有信心,Sam Altman希望其突破屏幕界限。
[蚂蚁技术AntTech] 机器推理 DeepSeek R1 通用人工智能
下一代推理模型大猜想
文章围绕机器推理展开。回顾自然语言技术从处理到理解再到生成的进化,指出推理是人工智能下一里程碑。介绍机器推理定义及要素,提到DeepSeek R1贡献。长思维链在复杂任务效果好,但能耗高。短期推理发展有两条路线,一是推理系统自身演进,需新架构;二是挖掘深度思考价值,未来会有更多应用,R1为通用人工智能打开新门。
[云中江树] AI Meta AI 系统提示词
WhatsApp AI 聊天助手最新系统提示词
文章由云中江树原创,分享了2025年5月28日WhatsApp里Meta AI聊天助手的系统提示词。介绍其基于Llama 4模型,主打自然对话体验。详细阐述了中文及英文提示词内容,强调要贴合用户风格,不表达个人立场,高效回应,理解用户意图,避免说教等,最后作者邀读者点赞关注以获取更多AI相关分享。
[特工宇宙] Genspark Claude AI Agents
Anthropic 官方:Genspark 是如何构建 Agents 的?
Genspark 借助 Claude 打造自适应 AI Agents,改变研究和创建内容方式。其关键成果显著,如 45 天获 3600 万美元年收入等。传统 AI 搜索有局限,Genspark 最初构建的引擎也受困于此。后选 Claude 构建 Super Agent,它能动态协调,结合三项创新,为用户节省时间、增强功能,商业影响良好。Genspark 理念是给予 Agents 灵活性,推动 AI 成为思考伙伴。
[AI产品阿颖] AI编程,强化学习,Cursor团队
Cursor核心成员访谈:我们对AI编程的几个关键判断
本文是 Cursor 团队核心成员关于 AI 编程的访谈。成员们指出编程模型瓶颈在于反馈机制,RL 在编程应用中奖励难定义。奖励方式可结合测试与用户修改反馈,拆分任务能减少奖励稀疏。工具选择要权衡质量与易用性,还可加思考、分析 PR 等工具。长上下文有趋势但要控成本,注意力机制各有特点。记忆工具训练复杂,评估靠基准测试。最佳奖励需真实用户反馈,基础设施搭建有优化点,未来编程 Agent 会更高效。
[PaperAgent] LLM DATA管理 综述研究
一篇LLM × DATA技术最新系统性综述
2025年6月2日上交大等联合发表综述,探讨LLM与数据管理双向关系。DATA4LLM方面,分析了LLM不同阶段数据特征,介绍数据处理、存储、服务的技术与策略,如数据处理含采集、去重等步骤,存储涉及格式、分布等技术。LLM4DATA方面,阐述其在数据操作、分析、系统优化中的应用,如数据操作有清洗、集成等,分析涵盖结构化等数据,系统优化包括配置调优等。
[前端圈] Rolldown-Vite Vite 打包工具
替代 Vite 的 Rolldown-Vite 来啦!
文章宣布 Rolldown-Vite 可替代 Vite,它由基于 Rust 的 Rolldown 驱动。试用时,可在 package.json 中替换 vite 包。早期测试显示,它能大幅缩短构建时间、减少内存占用。目前作为技术预览版,后续将合并到 Vite 主项目。还介绍了使用方法、确保兼容性措施、esbuild 相关情况,展望了开发全量打包模式等未来规划,并鼓励用户试用反馈。
[PaperAgent] 大模型 多工具调用 Tool - Star框架
Tool-Star:赋予大模型结合多工具推理的能力
文章提出Tool - Star框架,旨在解决大模型多工具协同推理问题。先介绍研究动机,指出当前多工具调用研究不足。接着阐述框架贡献,包括允许模型调用多种工具、提出数据合成流程和两阶段训练框架。设计六种工具,介绍数据集构建方法,采用两阶段训练激发模型能力。实验表明,Tool - Star在计算和知识型推理任务上表现优异,具强大推理和泛化能力,未来可探索多模态和多工具扩展。
[MoonWebTeam] 低代码开发 腾讯工程师 开发平台
一文带你简述低代码开发平台
文章由腾讯工程师撰写,介绍低代码开发。先讲概念由来,1982 年提出,2014 年进入大众视野,它是开发模式统称。接着从代码量、适用范围等维度分类低代码。以阿里、无极、魔方平台为例说明构成。指出低代码平台构成可归为布局、交互、数据三步骤。最后强调平台要有兜底策略,用纯代码处理 20% 场景,还有 UI 设计规范等增值功能。
[MoonWebTeam] 分层架构 Web开发 架构演进
分层架构的艺术:从简单到复杂的演变
本文围绕分层架构展开,先介绍其从简单到复杂的演变背景及概念,阐述分层好处。之后详述演进过程,包括两层、三层、四层架构,DDD 架构和整洁架构,分析各架构优缺点。还说明设计要点,如明确分层依据,建立合理依赖关系。最后介绍团队实践的 Monet 框架,强调不同架构各有优劣,开发者需按需选择。
[海外独角兽] AI编程 AI - Native Infra Result - as - a - Service
AI-Native 的 Infra 演化路线:L0 到 L5
本文围绕AI-Native Infra展开,指出AI编程奇点已至,写代码只是开始,现后端系统‘人味’重,不适用于AI。作者提出L0 - L5能力成熟度模型描述其演化路径,AI从模仿人类操作起步,逐步升级为系统主导者。还阐述了每个阶段的特点、面临问题及所需基础设施。最终目标是实现Result - as - Service,需重新设计基础设施栈,这是软件行业的下一次革命。
API 网关 API 管理 大模型
Agent 工程师绕不开的必修课:API 网关 vs API 管理
文章探讨 API 网关与 API 管理的差异、协同及发展趋势。API 网关随软件架构演进历经流量、微服务、云原生、AI 网关阶段,侧重于请求运行时控制。API 管理则从文档化到商业化,关注 API 全生命周期治理。二者起点、使用角色、技术内核不同但需协同工作,如分层架构中各司其职。未来向 AI 网关和 MCP Server 管理演进,以适应大模型应用新挑战。
[DeepSeek] DeepSeek - R1 模型更新 开源模型
DeepSeek-R1 更新,思考更深,推理更强
2025年5月28日,DeepSeek R1 迎来小版本升级,新版本为 DeepSeek - R1 - 0528。它投入更多算力强化深度思考能力,在多基准测评中成绩优异,接近国际顶尖模型。复杂推理任务表现显著提升,如AIME 2025测试准确率提高。此外,在幻觉改善、创意写作、工具调用等能力上有更新。API也同步更新,调整了 max_tokens 含义。模型开源,下载链接已提供。
[机器之心] 美团 AI 零代码工具 NoCode
美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节
美团即将发布 AI 零代码工具 NoCode,无需编程经验,通过自然语言提需求就能生成程序,免费且可一键部署。该工具架构分三层,有 7B 参数的 apply 专用模型。它具备自然语言编程、实时预览等特点。在美团内部,非技术用户多,应用场景丰富,提效明显,当前 AI 生成代码占比达 27%且还在上升。未来,NoCode 将提升稳定性,优化模型,或推出 Dev Mode
国外
渐进式 Web 应用 原生应用 开发决策
When To Use Progressive Web Apps and When To Go Native
文章介绍了渐进式 Web 应用(PWA)的优势及适用场景。如今浏览器支持提升,PWA 可离线运行、推送通知等。从商业角度,它简化代码维护,利于 SEO。Pinterest 等案例证明其能提升用户参与度。PWA 在低连接环境、用户留存等方面表现出色,但无法深度使用特定 API。开发前需考虑用户需求、功能依赖等因素,PWA 是可行替代方案。
Progressive JSON React Server Components 数据传输
Progressive JSON
文章探讨了 Progressive JSON,指出传统 JSON 传输需等全量数据加载完才能处理。提出流式 JSON 解析器,但存在对象不完整、使用困难的问题。而 Progressive JSON 采用广度优先传输,用占位符逐步填充数据,客户端可渐进处理。还介绍了内联和大纲化优化方式,减少重复和支持循环对象。最后说明 React Server Components 运用此机制,结合 控制 UI 展示,呼吁更多工具采用渐进式数据传输。
第三方 Cookie 检测技术 用户体验
Reliably Detecting Third-Party Cookie Blocking In 2025
文章指出随着对隐私和安全的关注,第三方 Cookie 逐渐被淘汰,但许多网页功能仍依赖它。检测第三方 Cookie 阻塞不仅是技术需求,更是保障用户体验的关键。不同浏览器对第三方 Cookie 处理方式不同,增加了检测难度。文中介绍了多种检测技术,如 iframe + postMessage 是最佳方法,还给出了检测步骤及增强检测的方法。最后提供了 Cookie 被阻塞时的回退策略,强调开发者要兼顾技术与用户体验。
[InfoQ] 谷歌 AI应用 用户评价
谷歌突袭发布AI应用,无需Wi-Fi、手机就能跑大模型!网友实测两极分化
谷歌推出实验性应用 Google AI Edge Gallery,可在 Android 设备离线运行 AI 模型,具备本地运行、智能选模等特点,响应快且隐私性好。但网友评价两极分化,有人用后手机崩溃,也有人运行良好。还有人认为它是旧技术包装,比 CoreML 落后多年。其目标受众或为需跨平台部署机器学习模型者。
产品/设计
[百度MEUX] AI设计 科技公司 行业动态
MEUX「五月」AI设计观察
本文为MEUX「五月」AI设计观察,涵盖多家公司动态。苹果推出Matrix3D模型,或推眼动追踪滚动功能;通义千问上线深入研究功能;腾讯推出CodeBuddy3.0插件;字节跳动发布Seed1.5 - VL模型;阶跃星辰开源Step1X - 3D大模型;谷歌更新iOS App图标,将在Chrome浏览器集成Gemini AI助手;上海启动人工智能标识生态联盟;快手可灵2.0模型居全球视频生成榜首。
[老油杂谈] Manus 咨询报告 管理咨询
Manus,困在沙盒中的手办
Manus开放注册标志商业化启动,它瞄准咨询报告市场,但面临诸多问题。其咨询报告多依赖不可靠的网络搜索数据,与用户关系不严肃,产出的报告实用性有限,被“困”在廉价沙盒中。此外,它在复刻顾问用Hypothesis飞轮解题时,存在方法论不匹配、执行不沾业务、对推理质量不负责等问题,只是“手办”级模仿,突破现状需立足于转动飞轮。
[深思圈] AI ERP 财务软件
红杉美国2500万美元的押注:这家公司想用AI-native的ERP,干掉传统财务软件
文章介绍获红杉美国2500万美元A轮融资的Rillet公司,想用AI - native的ERP干掉传统财务软件。传统ERP系统存在诸多痛点,如效率低、集成难、数据导出质量差等。Rillet以AI为核心构建平台,能自动完成复杂会计任务,部署快,支持多实体等。其客户案例显示价值,改变企业选ERP思维框架。AI在财务领域变革显著,推动行业向智能高效发展,Rillet成功或引领新趋势。
[歸藏的AI工具箱] Youware,网页生成,MCP
V0做不到、Bolt搞不定,Youware用MCP一键解决网页生成最大难题
本文介绍Youware的更新内容并教用户使用其创建网页。它可将AI生成网页部署线上,适配MCP解决素材获取难题。更新包括深度适配主流MCP、上线积分系统、首页分类筛选优化、作品页加随机按钮。案例显示其能根据复杂提示完成网页布局和素材填充。创建网页时添加MCP,写清提示词即可,还能通过美化、微调优化页面。此外,网站还有积分奖励及挑战活动。
AI编程 阿里 Lingma IDE
阿里的 AI IDE 登场了,这事绝对有戏
2025年5月30日阿里云发布通义灵码的AI原生IDE Lingma IDE,免费开放,核心功能与Cursor对齐且使用更快。它整合Qwen和DeepSeek系列模型,有感知引擎和自动记忆感知亮点,适配国内生态且有企业版。虽目前整体稍逊Cursor,但阿里有大模型和基础设施优势,且有自研代码模型计划,AI编程竞争激烈,阿里有机会在该赛道成功。
行业
[腾讯研究院] Agent Atypica.ai AI转型
重新理解Agent的边界与潜力|AI转型访谈录
2025年被称为“Agent元年”,Agent未形成统一的定义。特赞创始人范凌介绍Atypica.ai,其创新点是模拟真实的人,用大语言模型研究典型用户,多个AI助手协同做大规模用户访谈。该产品可解决市场洞察、产品共创等商业问题。范凌认为幻觉和准确率对商业研究有两面性,还提到AI会带来组织变革,工作方式从专业化分工走向更全能,产品创新应采用“新瓶装新酒”或“新瓶装旧酒”的方式。
[Datawhale] 吴恩达 AI Agents MCP
最新对话|吴恩达评AI Agents现状!
吴恩达与Harrison Chase对话,探讨AI Agents现状。他认为应关注系统的“代理性”,而非纠结是否为Agent。AI开发需掌握工具组合能力,当前工具变化快。构建Agentic系统核心是任务分解与流程编排,评估体系、语音技术栈和AI辅助编程被低估。MCP虽有价值但尚处早期,Agent间通信更不成熟。此外,他不看好vibe coding的名称,强调编程学习重要性,创业要注重速度和技术能力。
[Founder Park] AI报告 互联网女皇 Mary Meeker
暌违六年、互联网女皇340页AI报告刷屏:AI「太空竞赛」开启,下一个10亿用户市场机会来了!
互联网女皇Mary Meeker暌违六年携340页《AI趋势报告2025》回归,聚焦AI变革。报告指出AI推理成本暴跌,定制化轻量级模型优势凸显;印度成ChatGPT等应用大市场;中国AI模型低成本追赶,性能接近美国顶尖水平;ChatGPT曾17个月增8亿用户,搜索市场份额被OpenAI鲸吞;未来下一个十亿用户或直接进入智能体生态系统,AI发展迎来新周期。
[AI深度研究员] AI 创业 Prompt engineering YC
1 条 Prompt 顶 10 行代码:YC 合伙人讲透 AI 创业护城河
本文摘自 YC《Lightcone》播客合伙人圆桌讨论,指出 Prompt engineering 重要性堪比 1995 年编程。以 Parahelp 为例,说明提示语是任务说明书,其价值在于让模型干活、流程衔接和结果稳定。强调评判标准是护城河,要把“好答案”标准写清。还介绍 FDE 方法,即到客户身边写提示,最后给出 Prompt - FDE 24 小时落地指南,指出 Prompt 是创业护城河。
[有新Newin] AI Agent 吴恩达 构建方法论
Agent 进入工程时代!吴恩达详解 AI Agent 构建全流程,核心不在模型,而是任务拆解与评估机制
在 LangChain Interrupt 峰会上,吴恩达阐述 Agent 构建方法论等内容。他提出‘agenticness 是光谱’概念,让开发者跳出语义纠缠。当前构建者在 Agent 建模经验不足,多处理线性业务流程。构建 Agent 需系统直觉和评估机制,开发者应掌握各类工具。语音栈与 MCP 协议被低估,前者体验可优化,后者能降低维护成本。AI Fund 选合作对象看重技术理解和执行速度。
[InfoQ] 吴恩达 Agent MCP
吴恩达评Agent现状:MCP尚处“蛮荒”,单Agent跑通已是“奇迹”,A2A协作堪称“双重奇迹”
本文是吴恩达与LangChain联合创始人对话的编译内容。他认为应把“代理性”看作光谱,专注构建“Agentic systems”。构建系统时,机会多在线性流程,但拆解任务、设计工作流等能力稀缺。AI工具变化快,评估和语音技术栈被低估。MCP虽补市场空缺,但尚“蛮荒”,Agent间通信更早期。此外,他还谈及编程、创业等看法,鼓励学编程,认为创业关键是速度和技术能力。
[深思圈] 编程 AI Cursor 团队 训练方法
首次揭秘:Cursor技术团队内部深度分析如何训练出超越人类的编程AI agent
文章围绕 Cursor 团队训练编程 AI agent 的内部讨论展开。探讨训练难题,如编程强化学习动作空间大、测试驱动训练有局限。提及工具选择需权衡复杂性与效果,长上下文处理有成本挑战但新架构有突破,内存工具面临信用分配难题。还指出要利用真实世界反馈革新训练方法,构建 RL 基础设施有技术挑战。未来编程 AI 将更智能,转变编程范式。