Agents Are Quietly Transforming FE Development
周刊
国内
[支付宝体验科技] 生成式 UI AI 时代 前端开发
生成式 UI:AI 时代体验技术生产新范式
文章围绕生成式 UI 展开,它是 AI 时代体验技术新范式,能自动生成 UI 界面。虽 AI 能生成惊艳效果,但当前生产仍需大量人工干预,未实现‘千人千面’自动化生产。团队目标是实现 UI 自动化生产和投放,为此针对自动化生产链路、生成定制化 UI、运行时 UI 生成方案展开工作,还介绍了其发展阶段,展望未来构建智能评价体系和建立 UI 生成中心。
[阿里云开发者] AI Code 程序员 Agent
面向六个月后的 AI Code,也许影响的不只是前端
文章探讨未来六个月AI Code发展。起初作者认为AI难取代程序员,后观点转变。提到Agent与Workflow区别,指出Agent适合复杂、有价值、容错高任务,如Coding。还介绍AI编程工具现状,像Cursor、Windsurf等IDE向Agent模式发展。又说明Codebase Indexing、RAG+Function Call及MCP等技术解决AI编程难题。最后提出未来AI代码生成闭环架构,提醒AI对后端开发者冲击或随后到来。
[阿里云开发者] 全栈开发 AI工具 开发记录
我终于成为了全栈开发,各种AI工具加持的全过程记录
本文记录了借助AI工具实现全栈开发的过程。背景是基础平台开发受资源限制,AI工具可解决问题。先做小工具,用Bolt.new生成DeepSeek R1对话页面,再补充JSON修复等小工具。接着完成Dify改进需求,设计数据集管理与评测入口,前端用Cursor开发,不断调试样式和处理报错。最后总结扩宽开发边界需多项技能,复杂功能调试待探索。
[阿里云开发者] OpenManus 智能体 大语言模型
手撕“开源版Manus”
文章围绕开源版OpenManus展开,它是Manus平替。体验上,OpenManus是单agent系统,能实现一般Agent核心能力,但拓展工具箱有成本,执行简单任务准确率和稳定性不高。思考方面,工程整合创新有价值,智能体提效但落地难,专业小模型重要,多智能体架构在垂域有效但有瓶颈,长远看端到端模型上限更高。还给出项目获取、实测情况,分析系统流程及LLM关键作用。
[大淘宝技术] 音频生成技术 淘宝域实践 语音大模型
音频生成技术探索与淘宝域实践
文章围绕音频生成技术探索与淘宝域实践展开。先介绍淘宝AIGC内容生成在多场景落地及系列专题。接着阐述音频生成技术,23年AI歌手用歌声转换,24年AI名人语音用语音合成,其成本降低、表现力提升。还介绍语音合成技术原理,包括风格迁移和语音大模型如VALL - E、CosyVoice等。在淘宝域实践中面临数据挑战,设计清洗链路,还进行音色复刻测试,此外探索音效和音乐合成等应用。
[AndroidPub] 跨平台技术 KMP Flutter
2025 跨平台技术如何选:KMP 与 Flutter 的核心差异
文章对比了 2025 年 KMP 与 Flutter 两种跨平台技术。KMP 采用编译时哲学,将代码编译为原生格式,深度融入原生生态;Flutter 用渲染引擎自绘 UI,构建独立生态圈。二者在技术内核、性能、生态整合、开发体验等方面有差异。选择技术栈要考虑团队基因、性能需求、产品阶段和长期维护等因素,未来‘混合架构’或成主流。
[AndroidPub] 吉卜力风格 AI创作 版权争议
万物皆可“吉卜力”,如何使用 AI 创建你的作品
3月25日OpenAI推出GPT - 4o图像生成功能,可将图片或文本转化为吉卜力风格作品,此风格AI图片在社交媒体迅速传播。吉卜力工作室1985年由宫崎骏等人创立,作品获多项国际大奖。使用GPT - 4o生成图像可指定纵横比等优化,免费用户每会话限三张,付费无限制。生成步骤包括打开ChatGPT、上传图像或描述场景、微调结果、下载分享。不过这引发版权争议,宫崎骏反感AI作画,但网友热情未减。
[AndroidPub] Wear OS 儿童应用 开发指南
打造适合儿童的 Wear OS 应用体验
文章介绍为儿童打造 Wear OS 应用体验。Wear OS 与 Samsung 推儿童版 Galaxy Watch,其功能有无需手机、精选应用、安全通信、位置共享等。还发布新设计原则和指南,设计要积极有趣,内容需精心构思。开发指南涵盖降低电池消耗、选开发环境、创建表盘等。发布应用要注意年龄内容分级、独立功能等。开发者可借此接触新用户群体,参与生态建设。
[腾讯技术工程] DeepSeek R1 本地训练 人工智能
DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”
文章聚焦DeepSeek R1本地训练,解决适配难题。先介绍环境搭建,明确cuda12.4要求及显卡驱动适配要点,给出conda创建虚拟环境步骤。接着指出训练踩坑点,如OOM报错原因及解决办法,强调reward函数形参命名要与数据集列名一致。还说明了开启训练的要点,包括准备业务数据、更改数据读取方式、自定义reward函数和启动训练命令,最后公开让14B模型在A100上跑通R1的配置参数。
[搜狐技术产品] iOS 静态代码检查 Clang
iOS静态代码检查方案解读
文章围绕iOS静态代码检查方案展开。介绍了SonarQube、Infer、SwiftLint等市面开源方案,分析了SonarQube和Infer的优缺点。还阐述了Clang静态分析器的优势与不足,通过综合对比,凸显其在底层问题检测等方面的优势。此外,讲解了静态分析原理及使用方法,最后项目选用Clang Static Analyzer做可持续集成和自动化,通过脚本筛选更新文件、分析日志并格式化展示。
[大转转FE] 代码影响范围分析 前端开发 框架差异
代码变更暗藏危机?代码影响范围分析为你保驾护航
文章围绕代码影响范围分析展开。先介绍其概念、背景价值及与代码覆盖率区别。架构流程含项目依赖树构建、代码变更分析、影响范围标记和结果展示。核心技术实现包括依赖树构建(判断项目类型、解析路由、AST解析)、代码变更分析(获取diff、标记文件变更、提取函数变量、对比分支变更)、影响文件标记及输出依赖树(补充节点、标记父节点)和影响可视化。最后指出不同框架分析有差异。
[GSYTech] Flutter 2025 Roadmap 热更新
Flutter Roadmap 2025 发布,快来看看有什么更新吧
文章先回顾 Flutter 2024 Roadmap 完成情况,有多项完成,也有部分未达成,且 2024 还有不少特性更新。接着介绍 2025 Roadmap:性能上 iOS 要删 Skia,Android 高版本默认 Impeller;移动平台 iOS 支持新系统和迁移 SwiftPM,完善控件,Android 适配新系统、迁移构建逻辑;Web 改进核心、删遗留库、推出 hotload;Desktop 由 Canonical 负责;Dart 改进代码生成和探索序列化支持;官方不提供热更新,推荐相关方案。
LLM GenAI 基准测试
探索LLMs领域:GenAI中基准测试的重要性
文章指出大型语言模型(LLM)在GenAI应用中功能强大,能支持多种场景,但存在幻觉、成本高等风险。模型制作者提供的模型卡有局限性,如训练来源不明、测试结果数据有限等。因此,组织需为LLM创建定制独立基准和自定义评估框架,其好处包括测试场景更贴合产品、无训练数据污染风险、可对不同模型同类比较等,能让相关人员以数据驱动做选择。
[潦草学者] GPT - 4o OmniGen 图像生成
浅析GPT-4o画图背后的技术OmniGen
文章围绕GPT - 4o画图展开。它因出图效果好、玩法多而爆火,其图像生成打破了Stable Diffusion系列限制。作者推测其背后技术是OmniGen,介绍了Transformer和Diffusion两个技术架构,指出之前图像与文字生成架构不同。OmniGen架构简洁通用,用VAE和Transformer,支持多模态输入,在X2I数据集训练,生成效果与GPT - 4o接近,但处理长文本有局限。
[InfoQ] Agent 模型驱动 技术挑战
从“人驱动”到“模型驱动”:聊聊 Agent 在 2025 年的爆发与挑战
本文探讨 Agent 在 2025 年的爆发与挑战。模型技术进步推动产品进步,如推理、多模态、代码能力提升,模型更能认知自身局限。产品进步也推动理论发展,Devin 开创通用 Agent 时代,Cursor 和 Cline 开创本地 IDE 上的 Agent 模式。通用 Agent 实施面临工程和模型挑战,如大脑构建、评估、记忆处理,以及模型指令跟随、长上下文和推理规划能力不足等问题。不过,通用 Agent 不会被模型取代,而是共生关系。
[CAMEL AI] 多智能体系统 OASIS 模拟社会
Project OASIS:多智能体系统最大的潜力,或许藏在“模拟社会”中
当前智能体系统研发多聚焦“自动化”,“基于智能体的模拟”较冷门。而模拟系统应用场景广泛,有潜力催生革命性产品。为此推出开源社会模拟环境 OASIS,可模拟百万智能体在社交媒体的行为,有高度可扩展性等四大特性。它能复现社会科学研究,未来可通过强化学习释放潜力。基于 OASIS 的 Matrix 可进行营销测试等,OASIS 灵活可扩展,为探索社交动态提供可控环境。
[AI工程化] MCP协议 Streamable HTTP HTTP SSE
MCP社区新提案:Streamable HTTP 将取代HTTP SSE
MCP社区提议用Streamable HTTP取代HTTP+SSE方案。新协议简化增强HTTP使用,如移除/sse端点、统一消息入口等。替代原因是SSE存在不支持会话恢复等局限,Streamable HTTP有支持无状态服务器、纯HTTP实现等优势。团队曾考虑但放弃WebSocket,因开销大等。客户端生成Mcp - Session - Id引发讨论,最终方案待确定。此变更有助于提升MCP竞争力。
[极客之家] 后端开发 APIJSON 腾讯
腾讯出品:后端开发的“零代码”神器来了!
腾讯开源的 APIJSON 项目为后端开发带来“零代码”解决方案。它是基于 JSON 的网络传输协议和 ORM 库,能动态解析 JSON 请求生成 SQL 语句。核心功能包括为后端提供万能接口、零代码操作等,为前端定制数据等。有开发效率提升 20 倍、高性能轻量化等优势,还能与 APIAuto 配合管理测试 API。它解决了前后端协作痛点,提升开发效率,开源地址为 https://github.com/Tencent/APIJSON 。
Cursor、编程工具、MDC文件
Cursor是越来越难用了!逼着我写mdc文档比代码还多
本文作者分享了使用 Cursor 编程工具时遇到的问题,尤其是从 0.45 版本开始,Cursor 的智能性明显下降,上下文感知能力变弱,甚至出现乱改文件的情况。为了解决这些问题,作者通过编写 <font style="color:rgb(6, 6, 7);">.mdc</font>
(Markdown Cursor)文件来规范 AI 在编码时的行为和约束。<font style="color:rgb(6, 6, 7);">.mdc</font>
文件基于 Markdown 语法,可以为不同类型的文件或任务创建专门的规则文件,AI 会根据正在编辑的文件自动选择适用的规则。作者还展示了几个 <font style="color:rgb(6, 6, 7);">.mdc</font>
文件的示例,包括 TypeScript 项目规范、企业级全栈架构规范和微服务架构设计规范等,这些规范帮助提升了 AI 生成代码的质量,并且便于团队协作和项目迁移。
设计哲学、创造力、团队建设
深度|Cursor首席设计师:伟大的事物是自然发生的;不要过早聚焦,也不要将规划凌驾于实践之上
本文探讨了如何塑造伟大的事物和团队,强调伟大的创造往往源于自然发生的过程,而非过度规划。作者指出,伟大的团队应由一群充满好奇心、渴望迎接挑战的“朝圣者”组成,而非仅仅依赖职位和头衔。文章还提到,伟大的事物在诞生时往往带有熟悉感,因为它们揭示了我们内心深处早已察觉的可能性。作者建议不要过早聚焦,而是要广泛探索,通过实践而非理论来学习技艺,保护新生想法免受过早批判,并以敏捷的态度持续前进。
AI、Agent、大模型、英伟达
开发 Agent 简单,让它好用难;如果大模型成为流量入口;英伟达的推理故事丨AI 月报
本期 AI 月报聚焦于 2025 年 3 月的全球 AI 重要趋势,探讨了 Agent 的开发现状、大模型成为流量入口的可能性以及英伟达在推理领域的布局。文章指出,虽然开发 Agent 的门槛降低,但要让其真正好用仍面临挑战,包括大模型自身的局限和系统设计的复杂性。同时,大模型应用成为流量入口的趋势日益明显,OpenAI 的平台愿景正在逐步实现。此外,英伟达在推理领域的技术创新和市场策略也成为关注焦点,其 GPU 的优势和推理模型的优化正在推动 AI 应用的发展。
很抱歉,我刚才没有按照要求完成任务,现在我重新生成。
GenSpark、智能体、技术发展
GenSpark 发布超级智能体,Manus 似乎变得不再重要了
GenSpark 公司推出新一代超级智能体,无需激活码即可使用,性能超越 Manus 和 OpenAI Deep Research。其模型具有多种尺寸和工具,训练数据质量高,执行速度快,引发对 AI 发展的思考。
DS 和清华新论文
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
DeepSeek 发布新论文,提出一种新的学习方法 Self-Principled Critique Tuning(SPCT),用于提升通用奖励模型在推理阶段的可扩展性。通过基于规则的在线强化学习和元奖励模型指导投票,显著提高了奖励模型的质量和可扩展性,为大语言模型的推理能力发展提供了新思路。
AGI、人工智能、技术发展
大模型非共识下,什么是 AGI 的主线与主峰?
文章探讨了在大模型发展的非共识下,AGI(人工通用智能)的主线与主峰,强调智能提升是唯一主线,智能本身就是最大应用。同时分析了预训练的重要性、Coding的意义以及AGI时代组织和文化竞争力的核心地位。
前端开发、AI工具、编程效率
网页版 Cursor 发布!前端再一次被针对了!
介绍了网页版 Cursor(DeepSite)的发布,这是一款基于 Hugging Face 平台的应用程序,能够将自然语言描述瞬间转化为代码,显著提高前端开发效率,支持多种应用类型且完全免费。
AI绘图、SVG、内容创作
文章和 PPT 配图有救了!SVG 绘图专家智能体大揭秘
分享了如何使用 DeepSeek-V3-0324 和 Claude 3.5 或 3.7 绘制高质量的图片,适用于文章配图和 PPT 配图,通过优化提示词和模型能力,实现高效创作。
MCP、UE开发、工具化
MCP开发实战-如何使用MCP真正加速UE项目开发
介绍了MCP(Model Context Protocol)在UE项目开发中的应用,通过构建LLM与异构软件系统间的通用指令交互框架,实现工具的快速调用和开发效率的提升,提供了详细的开发实战案例。
软件测试、开发流程、测试左移
大厂不再招测试?软件测试左移开发合理吗?
探讨了大厂减少测试工程师岗位的现象,分析了软件测试左移和右移的概念、原因及实施方法,强调测试左移符合软件发展历史规律,同时讨论了测试自动化的必要性。
内存管理、浏览器性能、技术原理
浏览器崩溃的第一性原理:内存管理的艺术
深入分析了浏览器崩溃的内存管理问题,介绍了V8引擎的内存分配、垃圾回收机制以及常见的内存泄漏场景和优化方法,帮助开发者更好地理解和优化代码。
前端开发、AI工具、开发流程优化
Cursor 在前端需求开发工作流中的应用|得物技术
分享了Cursor在前端需求开发中的应用,通过规划和执行阶段的协作流程,帮助开发者提升开发效率,减少重复劳动,并在现状分析、方案设计和影响评估中发挥重要作用。
国外
前端开发 AI代理 技术变革
How AI Agents Are Quietly Transforming Frontend Development
文章指出AI代理正悄然改变前端开发。它从辅助工具转变为自主团队成员,能执行任务、定义子任务。AI代理不仅能生成代码,还可成为设计大脑、UX策略师等。它为开发者带来便利,解决开发复杂性问题,但也存在训练数据、信任和设计意图等挑战。未来,AI代理将更智能,改变前端开发定义,实现更高效协作。
JavaScript 同步 await 异步编程
Could JavaScript have synchronous await?
文章探讨 JavaScript 同步 await 的相关问题。指出异步和同步代码差异带来诸多问题,如功能重复、API 开发难题。介绍异步 await 通过执行上下文实现暂停和恢复执行。提出同步 await 设想,若实现可提升可用性,且不阻塞主线程,但存在性能下降、并发问题两大弊端,还提及语法上或需 sync 关键字,且仍依赖 Promise,WebAssembly 有栈切换提案。
WebGPU 扫描效果 深度图
WebGPU Scanning Effect with Depth Maps
本文介绍利用深度图、自定义着色器和 WebGPU 渲染实现扫描效果的创意演示。通过 Three.js 和 react - three - fiber 用 WebGPU 渲染场景,用 TSL 着色器增强视觉深度。效果基于基础图像和深度图结合,利用深度信息使图像产生视差扭曲。还包含程序生成网格、扫描动画等,有三种视觉变体,展示不同素材和深度数据对效果的影响。
JavaScript Web API 分享功能
Simplify sharing with built-in APIs and progressive enhancement
文章介绍利用 Web Share API 和 Clipboard API 简化分享功能。传统社交分享按钮有隐私、性能问题,而这两个 API 能提供更好体验。开发时采用渐进增强方法,先以 HTML 实现最小可行体验,再用 JavaScript 扩展,创建 ShareActions
类并定义多个 getter 方法。通过 connectedCallback
渲染按钮,编写事件处理方法,实现分享和复制功能。最后用 CSS 解决提示元素样式问题,实现用户友好的分享功能。
AI开发者工具 技术分析 工具选择
Making Sense of the AI Developer Tools Ecosystem
文章介绍AI开发者工具生态演变,从早期GitHub Copilot等自动补全工具到如今多样工具。按AI在工作流的定位分为“AI at arm’s length”“Integrated AI”“AI-first”“Task - focused AI”。分析各类工具,如自动补全和聊天工具、ChatGPT等通用工具、AI 驱动的 IDE、快速原型工具和智能代理工具,指出其能力、优缺点,建议开发者先确定AI在工作流的定位再选择工具。
[Android 开发者] Gemma 3 开发者指南 AI模型
Gemma 3 开发者指南 | 快速集成与部署,轻松释放 AI 潜力
文章介绍了Gemma 3开发者指南。Gemma 3是Gemma开放模型系列最强大版本,有新功能如多模态、长上下文等。它通过蒸馏等技术构建,后训练用4组件提升能力。指令版本对话格式与Gemma 2同,多模态集成视觉编码器。还有4B图像安全分类器ShieldGemma 2。最后给出快速入门步骤,包括体验、下载、学习整合、用工具和灵活部署。
[AIDC-AI] AI LangEngine OpenManus
LangEngine硬核开源!24小时极限复刻OpenManus
文章介绍LangEngine v1.2.1推出openmanus-preview的Java版本,能24小时极限复刻OpenManus。Monica.im公司的Manus引发行业震动,开源界有类似功能框架但多基于Python,而LangEngine是纯Java框架。文中阐述Manus能力,介绍LangEngine开源地址及OpenManus For Java工作原理、工具集合,包括BrowserUse等多种工具,还展示框架使用代码与用例,最后指出虽初步具备规划执行能力,但从技术原型到成熟产品需技术沉淀。
产品/设计
[钉钉用户体验] 智能审批流 企业效率 数字化转型
智能审批流:重塑企业效率与体验
文章指出传统审批方式存在操作繁琐、沟通低效等问题,介绍智能审批流提升企业效率与体验的方法。限时审批通过时间管理缓解拖延;审批自动化安排智能助手,实现流程无缝衔接与数字化转型;动态流程和并行分支应对复杂场景,灵活调整审批路径;自定义摘要提炼重点,审批意见模板规范回复。智能审批流将颠覆传统模式,未来还会融入更多创新元素。
[Z Finance] ChatPods 张月光 AI 播客
ZPedia|妙鸭创始人张月光全新之作,ChatPods想让播客"开口说话",半年狂卷3亿融资
本文介绍了妙鸭创始人张月光的新作品 ChatPods。它是创新 AI 播客平台,可实现主播与听众实时双向互动,有集成聊天等特色功能。张月光履历丰富,曾打造妙鸭相机。他认为产品开发要多维度布局,中国企业出海有优势也有挑战。沐言智语半年获近 3 亿融资,但 AI+播客赛道面临技术投入与变现、规模化生产与价值稀缺性的矛盾。
[阿真Irene] AI设计 卡片制作 提示词技巧
DeepSeek V3和Claude3.7制作设计感卡片教程,放进飞书多维表格修改使用,附教程和表格模板
本文分享用Claude3.7和DeepSeek V3制作设计感卡片的教程。展示二者制作的卡片,给出DeepSeek V3玄学提示词模板。介绍反推卡片与复用svg代码方法,提供飞书多维表格模板。还给出让AI生成更具风格设计的提示词技巧,如指定视觉元素、加入设计风格等,最后推荐了一些实用工具。
AI 科技动态 三月观察
MEUX「三月」AI设计观察
本文是MEUX「三月」AI设计观察,介绍多个AI动态。2月28日,OpenAI推GPT - 4.5,百度文库和网盘上线DeepSeek - R1;3月1日腾讯元宝发布电脑版;3月4日智谱开源CogView4;3月6日国产通用AI Agent Manus刷屏;3月12日谷歌Gemini推原生图像生成功能;3月13日阿里推出新夸克;3月Meta发布Aria Gen 2;近日Kimi新模型曝光,代码能力强;DeepSeek应用于医疗服务或颠覆传统。
[Founder Park] AI浏览器 Dia浏览器 互联网
Arc浏览器团队新品Dia一手体验:为什么最牛的AI应用开发者,都在做AI浏览器?
本文介绍了The Browser Company团队新品Dia浏览器。该团队曾凭借Arc浏览器吸引大量用户,后将重心转向全新AI浏览器Dia。Dia以AI为核心构建,体验极简优雅,能个性化定制。它与Manus思路不同,前者重设计交互逻辑,后者为AI单独打造浏览器。当下众多创业公司和大厂都在布局AI浏览器,其发展有清晰路线,未来谁能颠覆传统体验仍未知。
即梦 AI 3.0
即梦AI 3.0版本更新,带来了图片和文字精细度的显著提升。文章通过与2.1版本的对比,展示了3.0版本在多个方向上的优化,包括文字与设计、中式美学、卡通动漫、人像动物和材质质感等方面。测试结果显示,新版本在文字精度、设计细节、风格呈现和质感表现上都有明显进步,为用户提供了更强大的设计工具。作者还分享了相关的提示词和网址,鼓励读者尝试并探索更多创意玩法。
行业
[Microsoft资讯] 微软 腾讯 应用合作
微软 + 腾讯重磅合作 !
2025年4月3日消息,微软与腾讯展开重磅合作,将在Microsoft Store上推出腾讯应用宝专区。这是微软在中国首次给第三方开放系统级入口和资源组件,会把移动应用引入Windows 11/10操作系统,让用户能在系统上获得丰富的移动应用体验,推动Windows生态新飞跃。
[GLM大模型] 智谱 AutoGLM沉思 AI智能体
智谱推出 Agentic GLM 系列矩阵,全栈布局AI智能体生态
2025年智谱在中关村论坛发布「AutoGLM沉思」,推动AI Agent进入「边想边干」阶段。其技术演进路径明确,核心链路模型4月14日开源。该模型融合多种能力,有深度思考、感知世界和工具使用特性。同时介绍了GLM系列新版基座、推理、沉思等模型情况,各有优势。智谱战略聚焦Agentic GLM研发,携手多领域伙伴推动落地,还推动大模型出海。
[机器之心] Meta Llama 4 开源 AI
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
Meta 深夜开源 Llama 4 系列,含 Scout、Maverick 和 Behemoth 三款。采用 MoE 架构,计算效率高。Scout 和 Maverick 可下载,前者有 1000 万 token 上下文,适配单 GPU;后者性价比高,竞技场表现佳。Behemoth 仍在训练,性能超 GPT - 4.5 等。预训练尝试新方法,后训练改进流程,各模型在多方面表现出色,Behemoth 训练面临挑战但有创新提升。
[MacTalk] 钉钉换帅 阿里巴巴 AI
聊聊钉钉换帅的事
文章围绕钉钉换帅展开。阿里巴巴拟收购无招创办公司投资人股份,无招将出任钉钉CEO,现任总裁不穷回归阿里。无招是钉钉创始人,因不认同云钉一体战略离开创业,但其创业公司成绩不佳。如今阿里押注AI,钉钉构建AI应用生态。不穷也为钉钉贡献大,带领其从管控工具向生产力工具转变,且积极拥抱AI,钉钉在AI领域未落后。
[深思圈] AI行业 创业 播客盘点
红点美国最新深度讨论:AI行业大盘点
作者结合创业梳理AI产品PMF,分享Redpoint对AI行业盘点播客内容。过去一年模型能力突破,开源模型企业采用率低。被高估的有代理框架,被低估的是AI内存系统和PCC。已证明有PMF的应用如编程助手等,还有崛起领域。建立AI应用层防御可依靠网络效应、品牌价值和执行速度。基础设施有代码执行等机会。AI领域未解问题包括强化学习应用等。创业者要注重执行力和差异化。
[腾讯研究院] 大模型 发展趋势 行业应用
大模型下半场:7个趋势判断
文章对大模型下半场发展给出7个趋势判断。算力投入模式未到顶,但中国高端芯片供给受限;慢思考与多模态成标配,各领域或迎‘AlphaGo时刻’;开源与开放协议成新竞争力;打造可信大模型迫在眉睫;个人应用有望开启马太效应,终点是超级智能助理;智力即服务是行业落地终极方向,各行业应用正走深,优质数据是提效关键。
[腾讯研究院] AI 互联网广告 实时生成广告
“千人千面”的广告时代将被AI终结
文章指出AI正深刻影响互联网广告。它创造新广告与产品形态,提升素材生产效率,让手机语音助手成新入口。AI将重塑广告格局,硬件厂商有机会打造新生态,电商等平台面临挑战。广告形态上,社交娱乐等场景变化大,素材制作提效且回归创意。广告引擎中,AI在召回、数据处理等方面应用多。实时生成广告虽有问题待解,但一旦上线将重塑行业。