211

AI & 低代码

国内

[快手大前端技术] 快手 前端 静态托管服务

快手前端通用静态托管服务KFX演进历程:从崎岖土路到平坦高速
快手前端通用静态托管服务KFX历经四年发展,经历三个阶段从‘崎岖土路’发展到‘平坦高速’。2022年春基础能力初步建成,之后解决诸多问题不断演进,2023年进行稳定性治理,2024年朝着‘扩、稳、控’方向扩展能力,各阶段提升资源利用率和效率,满足业务需求,未来将继续优化架构提升稳定性和运维效率。

[快手大前端技术] 快手 小程序模拟器 性能优化

秒开率从18%到64%,我们对小程序模拟器做了什么?
快手小程序模拟器性能差,24年Q2启动优化专项,秒开率从18%提升到64%,FCP P90从4.4s提升到1.9s。介绍优化过程,包括手动打点分析确定方向,将双进程改为单进程,缓存复用,按需加载编译产物并解决断点失效问题,优化调试器逻辑等内容。

[哔哩哔哩技术] 前端开发、React、代码范式

从 React 看前端 UI 代码范式革命
文章以React为切入点,回顾前端UI代码范式的发展历程。从2013年React发布引发第一次组件化革命,到类组件问题催生第二次函数组件革命,再到探讨当前Hooks API的优缺点并对比其他框架的改良方案,最后提及React融合前后端代码的新趋势。强调范式革命背后是亲密性原则的驱动,并非简单的开历史倒车。

[AndroidPub] Android启动速度优化

深入研究 Android 启动速度优化(下)
文章深入研究Android启动速度优化,涵盖Application和Activity阶段、业务、进阶、黑科技优化方案,以及启动监控和防劣化机制。介绍多种优化方案如异步、延迟、线程、子进程等优化,阐述各方案的原理、操作步骤、注意事项等,并提及多种工具辅助优化,强调优化要注重用户体验而非单纯追求指标。

[InfoQ] 网易云音乐 日志数据 ClickHouse到Apache Doris

从 ClickHouse 到 Apache Doris:在网易云音乐日增万亿日志数据场景下的落地
网易云音乐日增万亿日志数据,早期以ClickHouse构建日志库面临诸多问题,后引入Apache Doris替换。文章介绍了迁移思考、调优实践,包括架构、存储、写入、查询等方面的改造优化,还提及监控运维、升级收益和未来规划等内容。

[DAMO开发者矩阵] 数字人技术、金小刚、达摩链接

虚拟角色的 AI 未来:从肖像编辑到三维生成,技术如何重塑数字人生态|达摩链接
文章介绍了数字人技术在多领域广泛应用,随着AI兴起制作门槛降低但也有挑战。从人脸肖像编辑和生成(如胖瘦调整、双下巴去除等工作)、文生三维肖像(金小刚团队2024年工作及相关流程)、人体动画(如高精度求解器、运动补间等工作)三个维度展开阐述,还介绍了达摩链接生态讲座旨在促进技术交流等内容。

[大淘宝技术] 电商内容创作、内容分析Agent、淘天团队

大模型时代的内容分析Agent解决方案与业务实践
在电商环境下,内容创作面临诸多挑战,如不确定如何吸引用户等。本文介绍了内容分析Agent,包括内容特征体系生成、细粒度标注、优质内容特征挖掘等模块,各模块有其背景、方案设计和应用效果。Agent能在内容分析与生产间建立桥梁,提升效率和效果,已在手淘外投业务取得良好成果,最后介绍了淘天内容AI团队的工作和展望。

[大淘宝技术] 淘宝 虚拟试衣 产品化

视频级虚拟试衣技术在淘宝的产品化实践
本文介绍了淘宝视频级虚拟试衣技术的产品化实践。对比图像换衣,视频换衣在多方面价值更高但难度和成本也更高。该技术任务可分解为单帧结果和动作连贯性两方面,针对早期方案的局限性对整体框架进行了升级。在产品能力建设上,进行了模版库建设包括真实风格模版生成和模版与服饰匹配能力,还进行了产品形态建设,包括平台、商家、买家三个层面的产品介绍及其效果展示,最后介绍了团队相关情况。

[阿里云开发者] 本地聊天助手 联网搜索 模型部署

LLM 联网搜索,到底是咋回事?
文章展示了从零搭建本地聊天助手的过程,包括模型部署、搜索逻辑设计、内容提取与整合等步骤以实现联网搜索能力。先建立本地模型环境,如用Ollama配置环境并下载DeepSeek R1 32b,再建立Docker环境和配置Dify。之后阐述搜索能力建立的流程,包括判断是否搜索、生成关键词、进行搜索、网页获取、内容提取等,还进行了测试并指出存在的问题,最后提及优化方向。

[阿里云开发者] DeepSeek模型 强化学习 模型训练

使用A10单卡24G复现DeepSeek R1强化学习过程
本文主要描述DeepSeek三个模型的学习过程,重点展示DeepSeek - R1 - Zero模型的强化学习算法。介绍了环境信息、依赖安装、训练过程、奖励函数、训练参数,还进行了过程日志分析、推理验证,并分享了思考,包括训练数据分析和冷启动问题等内容。

[阿里云开发者] DeepSeek模型、技术先进性、行业影响

一篇关于DeepSeek模型先进性的阅读理解
文章以DeepSeek模型为核心,阐述其技术先进性、训练过程与行业影响。DeepSeek通过强化学习实现新范式,突破传统限制,具有高性价比。其训练及蒸馏过程包括四阶六步,李飞飞团队低成本复现R1。开源冲击行业,数据是关键,同时指出其安全问题,如遭受攻击暴露安全滞后于业务的情况。

[ByteDance Web Infra] Midscene.js 千问模型 UI自动化

Midscene.js 接入千问模型 - UI 自动化成本下降 80%
Midscene.js从v0.12开始适配千问Qwen - 2.5 - VL模型,相比GPT - 4o,其输出结果正确性不变且能与更多元素交互,运行成本可降低80%以上。文章阐述了Midscene.js开源后的用户反馈,对比了Qwen 2.5与GPT - 4o的token消耗和花费,介绍了Qwen 2.5的特性、接入使用方法、Midscene适配新模型后的特性,还解答了常见问题,并对比了Midscene已支持的多种模型。

[京东零售技术] 京东 京点点AIGC平台 电商

35W+京东商家共同选择的京点点AIGC平台,内容生成妙在哪里? | 京东零售技术实践
京东零售技术自研的京点点AIGC平台已被35万+商家选用。它基于多种AI能力改变内容生产模式,有AI商品图生成和营销文案生成能力。为解决电商AI内容生成的技术问题进行了技术创新,如先进文生图基底等。应用成效显著,内容制作效率提升95%以上,成本降低99%以上。还将在生成式技术等多方面继续投入资源打造提升。

[货拉拉技术] 货拉拉、大模型应用、悟空平台

货拉拉大模型应用开发体系演进与实践
以ChatGPT为代表的生成式AI浪潮下,企业落地面临困境。货拉拉基于自身积累打造悟空平台,已在多个业务场景探索和落地大模型应用,但仍面临数据、场景、落地等挑战。为此,货拉拉在开发体系上进行技术突破,包括悟空平台介绍、多模态知识引擎、Agent Workflow智能引擎、稳定性建设等方面,且大模型应用已在办公Copilot、车险报价、智能体广场等场景落地,最后对未来进行了展望与规划。

[得物技术] Rust应用 进阶之路 得物技术

一个Rust小白发布生产级Rust应用的进阶之路 | 得物技术
文章讲述了Rust小白发布生产级Rust应用的进阶之路。首先介绍了Rust的核心特性,包括所有权、生命周期和引用等。接着阐述了构建生产级应用的要点,如合理利用引用减少数据拷贝、FFI和Tokio的使用。然后说明了Rust应用发布的流程,包括上传镜像、发布和上监控。最后指出迁移到Rust虽有挑战但收益更大。

[vivo互联网技术] vivo HTTPDNS、端到端优化、互联网技术

vivo HTTPDNS 端到端体验优化实践
随着手机应用访问量增多,DNS解析要求提高,HTTPDNS成为主流。vivo构建了HTTPDNS端到端一体化解决方案,从SDK、服务端、调度网关和全链路监控4个模块进行能力及架构优化,包括域名解析、业务建连、统一接入方案等方面的优化,还介绍了服务端优化、可视化监控、业务效果,最后对vivo HTTPDNS建设进行总结并展望未来。

[搜狐技术产品] Android、View、图片生成

Android 根据View生成图片
文章介绍了在Android中根据View生成图片的相关内容,包括实现步骤、分类、各类View生成图片的代码原理、实际应用中的存储问题以及版本兼容等方面的知识。

AI体验、Flutter开发、代码迁移

吹爆 AI ?Flutter 开发在 Cursor & Trae 不一样的 AI 真实体验
文章主要讲述了作者使用Trae和Cursor进行Flutter项目状态管理框架迁移的AI体验。Claude 3.7 Sonnet发布后,作者借此机会对比两者。Trae在迁移过程中存在诸多问题,如思考速度慢、修改不完整、代码存在冲突等;Cursor虽生成速度和思考能力较强,但也不能完全自动完成迁移。最后作者提到AI虽有帮助但没那么强力,并提及其他AI如DeepSeek、Grok 3等的体验。

[code秘密花园] Claude 3.7、编程能力、AI

Claude 3.7 实测:在实际编程任务中提升到底有多大?
文章对Claude 3.7 Sonnet在实际编程任务中的提升进行了测试,包括UI还原能力、项目理解能力、架构设计能力和物理规律理解能力等四个方面,并与Claude 3.5等模型对比,结果显示Claude 3.7在各方面均胜出,最后还提到了Claude的演进路线图。

[前端充电宝] 前端开发、浏览器、谷歌翻译

用了这个浏览器功能,前端页面直接崩溃了,咋搞啊?
文章讲述了使用浏览器功能(如谷歌翻译)后前端页面崩溃的问题。解释了谷歌翻译修改页面结构导致问题的原理,包括状态更新失效和应用崩溃两种场景,并分别举例说明。最后给出了一些解决方案,如阻止部分翻译、完全禁用翻译、使用Error Boundary隔离错误、进行国际化等。

[前端圈] Agents构建 LLM 实用建议

如何构建高效的 Agents,Claude 官方实用建议
文章分享了构建高效Agents的经验与实用建议。首先阐述了Agents的定义,指出Agentic系统有工作流程和Agents之分。然后讨论何时使用Agents,强调应先找简单方案,必要时增加复杂性。接着介绍了构建Agentic系统的框架,建议先使用LLM API。还探讨了构建块、工作流程(如提示链、路由等)和Agents的特点、适用场景等,最后总结构建Agents的三个核心原则。

[iCSS前端趣闻] CSS Anchor Positioning Popover

浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
文章从Chrome 125开始支持的Anchor Positioning特性入手,先介绍传统Popover功能及其核心逻辑,指出其依赖JavaScript计算的局限性。接着详细阐述Anchor Positioning的概念、核心API,包括anchor - name、position - anchor、anchor()、anchor - size()等属性。还介绍了锚点定位中的候补位置,如@position - try规则和position - try - fallbacks属性,最后展示如何用锚点定位实现极简版Popover弹窗。

AI机器人 ESP32 开源

拆解 | 88元, 国产开源ESP32小智AI机器人,搭载DeepSeek、通义Qwen2.5-Max
文章介绍了88元的国产开源ESP32小智AI机器人,它基于乐鑫ESP32 - S3核心板,搭载多种开源AI大模型。阐述了其通信协议、对话交互、多语言识别等功能,包括可灵活切换LLM模块、支持多种TTS接口等,还介绍了其智能交互能力、3D打印外壳、硬件核心设计、供电管理、电路设计等,最后提及硬件源码和服务端源码。

国外

[W3C资讯] W3C、联合身份、数字凭证

W3C联合身份工作组新增规范:数字凭证API
W3C联合身份标准工作组近期更新章程,新增数字凭证规范Digital Credentials API,其基于凭证管理规范,用于协调数字凭证访问展示。工作组去年3月成立,正在开发包括FedCM API、Login Status API等规范,还计划编写相关文档、创建威胁模型等,并欢迎参与标准化讨论。

AI Deno Jupyter

The Dino 🦕, the Llama 🦙, and the Whale 🐋
作者作为CTO Labs的首席技术专家,出于对新兴技术影响的关注,探索用Deno、Jupyter等工具在本地与大型语言模型交互,介绍了相关组件如Ollama框架、DeepSeek R1模型等的设置使用,以及LangChain.js简化交互、zod验证输出的功能,最后发现Deno和Jupyter为本地AI实验提供了有趣且高效的环境。

AI模型 alt - text 图像识别

Comparing local large language models for alt-text generation
作者为解决网站上大量图片无alt - text的问题,测试了12个大语言模型(10个本地模型和2个云模型)生成alt - text的准确性。介绍了模型评估、图像到文本模型工作原理、不同AI模型比较、测试图像、模型准确性等内容,本地模型中Llama变体和MiniCPM - V表现较好,云模型GPT - 4o和Claude 3.5 Sonnet表现近乎完美,最后探讨了下一步可能的操作及权衡。

WebGPU 流体模拟 实时渲染

WebGPU Fluid Simulations: High Performance & Real-Time Rendering
文章介绍了使用WebGPU进行高性能、实时流体模拟的相关技术。作者通过WebGPU实现了WebGPU - Ocean和WaterBall两个流体模拟项目,分享了开发过程中在模拟和渲染方面的技术见解。模拟方面介绍了不同的流体模拟方法,如粒子法、网格法和混合法,重点讲述了SPH和MLS - MPM方法;渲染方面介绍了Marching Cubes和Screen - Space Fluid Rendering方法,作者采用了后者。最后总结了WebGPU在浏览器物理模拟中的优势和前景。

TypeScript JavaScript 编程

What is TypeScript? An overview for JavaScript programmers
这篇文章面向JavaScript程序员介绍了TypeScript相关知识,包括TypeScript代码与JavaScript代码的区别、运行方式、在IDE编辑中的帮助等,还讲述了如直接运行、打包、转译等运行TypeScript代码的方式,以及TypeScript模块的文件名扩展、发布到npm的相关文件、源映射、DefinitelyTyped库、编译工具、类型剥离、孤立声明、JSR等内容,也提及了在IDE中编辑TypeScript及对JavaScript文件的类型检查。

Element.matchContainer() StyleObserver Martin Winkler

Solved by StyleObserver : Element.matchContainer()
Martin Winkler发布了一个polyfills Element.matchContainer()的包,它能在容器查询匹配/不匹配时在脚本中得到通知,底层使用StyleObserver。文中介绍了Window.matchMedia(),并将Element.matchContainer()与Window.matchMedia()进行类比,还阐述了StyleObserver底层的工作原理,给出了使用示例和演示,最后表示希望Web平台能内置原生的StyleObserver。

产品/设计

[钉钉用户体验] 低代码 宜搭AI 体验设计

用低代码探索AI体验设计
文章介绍了宜搭低代码平台AI体验设计的三个阶段:智能搭建、智能使用、智能应用,分享了低代码领域做AI体验设计的5个心得,包括自然冷启动、适时人工干预、AI辅助操作、LUI+GUI、选择适合的交互模式等,最后表示未来将继续挖掘AI与低代码的融合潜力。

[钉钉用户体验] ToB需求挖掘、产品共创、钉钉

ToB 场景下用户需求挖掘与产品共创
文章阐述了ToB场景下用户需求挖掘与产品共创的要点。由于ToB场景复杂,准确识别用户需求是产品成功关键。包括理解业务背景、确定目标公司与用户、共创前准备问题等步骤,共创过程中挖掘痛点、辨别真需求、产出通用解决方案并进行概念验证,最后总结强调深入业务场景、闭环角色链路痛点,快速产出原型共创打磨产品细节的重要性。

[58UXD] 豆包浏览器 AI办公 多功能工具

一个工具拥有全部 AI 办公神器 零门槛无痛上手
豆包是一个自带AI功能的浏览器,能一站式解决多种办公和生活中的问题,如AI办公工具寻找、AI生图、扩图、视频工具会员、调研报告阅读、内容搜索等。它的图片功能强大且免费,还有AI阅读、电脑端便捷操作、播客和视频处理、语音通话以及其他功能如AI编程和写作等。

[58UXD] Deepseek、AI产品、设计领域

Deepseek 强到离谱!AI 产品强强联合,解锁无限可能!
文章讲述了Deepseek与其他AI产品强强联合,在设计领域解锁无限可能。在3D建模、PPT制作、短视频制作方面,Deepseek分别与即梦、Tripo、通义、剪映等合作,简化流程,提高效率,让设计师将更多精力放在创意构思上,最后展望未来会有更多强大工具组合推动设计行业变革。

[蚂蚁集团设计] AI设计、会话设计、Ant Design

探索卓越 AI 产品体验——RICH 设计范式(04 会话)
本文是Ant Design X——RICH AI设计范式系列文章第4/5篇,主要介绍了会话设计相关内容。包括会话设计的定义、为何要做会话设计、会话交互组件的重要性、对话交互的原则(信息充分且真实、话术要清晰易懂、自然友好并且尊重用户),还介绍了对话流程的七个主要环节,并提及Ant Design设计团队有一个视觉待招名额。

[海涛AI智能体] 飞书 视频工作流 多维表格

视频工作流再升级!Coze+多维表格实现自动化批量视频制作
飞书多维表格上线DeepSeek R1模型,社区活动受其启发。文章介绍结合飞书多维表格与之前分享的视频工作流,实现批量化视频制作,包括视频文案提取工作流,以及如何串联视频工作流并发布到多维表格的流程细节,最后提到这种搭配可打造高效流程,后续还有更多玩法。

[百度MEUX] AI资讯

MEUX 「二月」 AI设计观察
本文主要介绍了2025年2月的一些AI相关的资讯,包括OpenAI首个智能体Operator测评、腾讯在AI领域的布局、字节OmniHuman - 1人体动画生成突破、2025年项目管理工具对比、DeepSeek爆火后的影响、微软SWE Agent首次曝光、山姆·奥特曼的AI经济学观察、华为小艺版DeepSeek和R1差别、硅谷大佬青睐的AI产品以及OpenAI的全新VI设计指南等内容。

行业/思考

[腾讯云开发者] DeepSeek模型 人工智能 技术演进

万字长文解构DeepSeek V1/V2/V3/R1进化史:从算法革命到推理涌现!
本文介绍了DeepSeek的LLM(V1 - V3)系列和R1系列模型的发展历程、技术创新、训练方法、评估结果等。包括各模型在数据、架构、预训练、对齐、优化等方面的特点,以及R1系列在推理能力提升、蒸馏实验、存在问题和复现项目方面的情况,展现了DeepSeek模型的演进与技术突破。

[海外独角兽] OpenAI Deep Research Agent

Deep Research 团队:Agent 的终极形态是所有任务 All-in-one
本文介绍了OpenAI的Deep Research。它是OpenAI的第二个Agent,能搜索多网站生成报告。源于对模型长时任务处理能力探索,目标是实现终极Agent。其有澄清流程,底层是O3微调版,通过端到端训练具备Agent能力。优势是处理详细需求和找冷门事实,劣势是难有新见解。使用场景广,适合知识型工作者。OpenAI希望它未来能嵌入图像、扩展数据源、提升准确性并融入Agent路线图,Agent在2025年将有新发展。

[Gartner公司] Gartner、中国企业、AI价值

Gartner发布2025年及未来中国企业实现AI价值的重要预测
Gartner发布2025年及未来中国企业实现AI价值的重要预测。包括到2027年80%企业将使用多模型策略,采用复合型AI的企业将更早实现AI落地;2028年企业对人工智能就绪型数据投资将达2024年的20倍;2029年60%企业将把AI融入主要产品和服务推动收入增长等内容。

[腾讯研究院] AI时代、人才培养、教育变革

AI时代的教育之问IV:人才培养
文章围绕AI时代的人才培养展开,阐述了培养目标、方式的转变,面临的新困境以及对人才培养的展望。培养目标从知识填鸭转向思维塑造,方式从统一流水线转向个性化等多种变革。同时指出存在如高校与企业脱节、认知能力退化等困境。展望未来,强调培养人机协同的复合型人才,建立新的教育范式等。

[腾讯研究院] AI、文科、教育

文科生会被AI淘汰?专家建议掌握这4层能力
文章围绕AI平权时代展开讨论,探讨了AI平权的内涵、影响及挑战。指出AI平权更多是起点平等,实际可能强者愈强。在教育方面,AI影响巨大但也带来诸多问题。文科虽面临挑战但不会被淘汰,文科教育可能转型。技术重新定义天赋,要担心人类像机器而非被机器取代,还谈及对AI的恐惧源于拟人化想象、碎片化思维等,最后专家建议从四个层次提升能力以适应AI时代。

[晚点LatePost] 字节跳动 即梦 曹大鹏

晚点独家丨字节跳动即梦考虑接入 DeepSeek,移动端新负责人曹大鹏到岗
字节跳动的AI视频生成产品即梦近期有新移动端负责人曹大鹏,他向剪映负责人张楠汇报。即梦正在考虑使用DeepSeek,春节前后即梦用户数增长迅速。曹大鹏有丰富的工作经历,即梦是剪映旗下的AI创作平台,字节跳动重视模型研发,行业对模型能力和产品关系有不同看法。