210

AI 引领变革 & 前端领域大模型

国内

[阿里巴巴终端技术] AI研发、前端领域、WeaveFox

面向未来的 AI 研发和前端领域大模型
文章介绍了蚂蚁前端团队自研的AI工具WeaveFox,它基于蚂蚁百灵多模态大模型打造,能根据设计图生成前端源代码。该工具可应用于多种主流应用类型,提升开发效率。还提到2024年AI技术的多维突破,前端技术领域面临双重变革,2025年是前端领域智能产业升级重要一年,D2大会将探讨前端新机遇并分享技术开放计划。

[阿里云开发者] LLM、3D世界、阿里云

基于LLM打造沉浸式3D世界
阿里云DataV团队在虚幻引擎内结合通义千问打造基于LLM的实时可交互3D世界方案。文章阐述LLMs与3D结合的意义、面临的障碍,介绍3D模型表示、场景理解、世界交互三个核心模块的构建方法,还展望了LLMs与3D结合在自动驾驶、具身智能、3D生成等领域的潜力。

[大淘宝技术] 天猫新品 画布引擎 AIGC

天猫新品业务画布引擎
天猫新品创新(TMIC)业务推出画布引擎,其基于Canvas的UI框架,整合前端渲染与AIGC算法模型接口。该引擎兼顾专业与易用性,基于Konva库实现多种功能且已应用于TMIC和产业AI平台。文章还介绍了引擎的产品设计、技术实现、质量保障、使用方式、不足与展望等内容,以及背后团队的工作内容。

[大淘宝技术] AIGC技术、淘宝、春晚

【首度揭秘】淘宝2025春晚云参演证背后的AIGC技术
本文主要介绍了2025年淘宝春晚云参演证背后的AIGC技术。包括项目背景、算法开发、工程实施、项目成果与问题等。项目为响应春晚全民参演需求,采用多种技术实现创新玩法。算法开发面临流量、用户体验和多样性适配挑战,开发过程涵盖模板开发、前置链路开发、换脸算法模块开发等环节。工程实施解决了大流量、高可用、低耗时等技术挑战。项目成果显著,但也存在一些问题,最后展望了未来的改进方向。

[DAMO开发者矩阵] 视频编解码技术、DAMO266、H.266

码率减半,画质翻倍!新一代视频标准 DAMO266 技术应用全解析
本文主要解析新一代视频标准DAMO266技术应用。先介绍视频编解码技术发展历程,H.266是最新标准,达摩院在其中贡献颇多并自研DAMO266编解码器。接着阐述DAMO266编码器业务应用,包括性能优势和技术创新。然后讲述解码器业务应用,面临挑战及优化成果。还提到H.266编解码技术应用优势,如为平台节省成本、提升用户体验等,最后总结DAMO266推动H.266成为流行的视频应用底层标准。

[阿里云开发者] 系统稳定性、内容风控、架构升级

系统稳定性建设三件事
文章作者于2024年初接手内容风控团队稳定性负责人工作,分享了在系统稳定性建设方面的经验。先明确稳定性定义,分析遇到的问题、挑战和期望目标,然后从事前降发生(高可用、高质量、勤自查)、事中降影响(早感知、快定位、急止损)、事后优改进三个方面阐述具体措施,最终取得多项成果,还总结了建设过程中的思考并展望未来架构升级方向。

[支付宝体验科技] 支付宝 集福活动 动效技术

支付宝集福视觉盛宴背后的动效技术
支付宝集福活动背后的动效技术Galacean Effects发挥着重要作用。它具有所见即所得、支持多种动画类型等优势,从效果还原度、动效组成、数据动态化等维度实现动效制作。如集福活动中的IP动画用到Spine骨骼动画、粒子特效、透明视频等。同时还介绍了实时渲染下的千人千面、多人协同功能,以及面临的技术挑战如中低端设备渲染性能、加载速度等,最后阐述了Galacean Effects的价值等内容。

[哈啰技术] Java组件化 流程编排 架构设计

JAVA流程组件编排术中之道
文章从组件化和流程编排的设计实践出发进行探讨。首先阐述组件化是对抗复杂性的有效途径,介绍了组件的定义,包括拆分原则、复用、职责单一、解耦设计并给出组件示例。接着讲述流程编排,涵盖上下文、DSL静态编排、流程阻断、动态性设计(含流程配置化、与规则引擎结合)等内容。最后总结构建组件化架构面临熵增挑战,强调归纳和演绎相辅相成,理想架构设计应兼具适应性和灵活性。

[字节跳动技术团队] 微信聊天记录 自动化导出 Trae

3周→3小时——我用 Trae 实现微信聊天记录自动化导出
前端开发者r1ader一直想实现微信聊天记录自动化导出,前期自主开发困难重重,数周未完成。尝试Trae后,3小时就完成了全流程开发,包括聊天记录导出、长图拼接和OCR识别。Trae的Builder模式和All in One功能提升了开发效率,作者还分享了与AI协作的‘潜规则’以及和Trae的‘聊天记录’。

[字节跳动技术团队] MarsCode 模型升级 编程助手

MarsCode 编程助手模型升级至豆包大模型1.5,同时支持切换DeepSeek R1 / V3!
MarsCode编程助手模型升级为豆包大模型1.5,同时支持切换DeepSeek R1/V3。新模型全免费、不限量、免部署,开箱即用。还介绍了新用户在Visual Studio Code和JetBrains中下载安装/更新MarsCode插件的步骤。

[京东零售技术] 京东 广告 Agent技术

AI Agent实战:打造京东广告主的超级助手 | 京东零售技术实践
文章介绍了京东广告产研团队在Agent应用方面的探索与实践。首先阐述Agent在京东广告投放中的落地,包括应用场景、工程能力实现(如RAG和Function Call能力构建)以及京准通智能助手能力展示。接着讲述基于业务沉淀Agent搭建平台,包括Agent设计器和Agent引擎的实现。最后总结京东广告在Agent应用上的工程化实践成果,并提及未来将推动多Agent架构升级。

[滴滴技术] 技术债务 滴滴国际化 项目治理

欠下技术债怎么还?滴滴国际化落地实践经验分享
本文以滴滴国际化外卖骑手侧H5项目为例,阐述技术债务的产生、分类,详细介绍偿还技术债的解决方案,包括冗余代码清理、公共方法标准化、调试工具完善等,还分享了治理技术债的心得体会,强调协作的重要性,治理成果提升了代码质量并为团队提供经验积累。

[快手大前端技术] 动效资源 快手 Vision平台 准入准出

动效资源交付的突破:Vision平台准入准出方案
快手动效Vision平台为解决动效资源交付问题引入准入准出检测机制。文章分析了动效交付流程痛点,阐述了平台针对交付链路的改善措施,详细介绍了包括静态检测SDK、动态检测服务、检测标准、平台检测流程等具体方案,还提及了落地实践情况与收益,最后对系列文章进行了回顾。

[快手大模型] 视频生成 可灵AI 快手大模型

可灵AI深度解析:开源数据集 Koala-36M、Scaling Law以及通用世界模型
可灵团队公开多项研究成果,包括开源数据集Koala - 36M、将Scaling Law引入视频生成领域、与清华合作提出Owl - 1视频生成范式。Koala - 36M在多方面改进提高文本视频一致性,Scaling Law为视频生成优化提供指导,Owl - 1通过通用世界模型实现长视频生成。快手大模型团队不断探索创新推动视频生成技术发展。

[哔哩哔哩技术] 流媒体 算法赋能 点直播业务

基于流媒体点直播业务的算法赋能探索
文章从B站流媒体点直播业务出发,介绍了算法赋能业务的情况。包括点播业务中的优化转码决策、转码资源预估、转码耗时预估,以及直播业务中的弹幕语义分析等实例,阐述了各业务中算法的应用背景、模型构建、效果等,最后提出模型存在提升空间,需持续迭代,还在搭建模型训练测试框架,挖掘更多算法赋能业务。

[哔哩哔哩技术] ClickHouse、B站商业化、DMP

ClickHouse BSI与字典服务在B站商业化DMP中的应用实践
文章介绍了B站商业化DMP中的业务背景、需求及遇到的问题,阐述了基于bitmap的人群圈选原理、问题,ClickHouse字典服务的应用、优化效果,BSI原理、功能实现,以及BSI+字典服务方案的落地、效果、收益等,最后对未来进行了展望。

[MoonWebTeam] 前端技术 2024年盘点 2025年展望

2024年前端技术盘点与2025年技术展望
本文对2024年前端技术进行盘点并展望2025年的发展。阐述了前端语言、框架、基础建设、运行时、跨端、低代码、D2C、WASM、音视频技术等多方面内容。如TypeScript增长迅猛,前端框架相互借鉴趋同,Rust在前端基建趋势加强,Node.js生态难以被挑战者回避,一码多端是跨端技术发展方向,AI在多领域变革前端开发等。

[Goodme前端团队] 古茗 接口开发 大模型

从抓包到 Mock,Plug 工具如何让开发更智能
古茗供应链项目开发需完成多业务场景开发和自测,现需接口工具。文章介绍了之前尝试的接口抓包和Mock工具的优缺点,提出新接口工具plug的需求,阐述plug功能、实现原理、与大模型结合的探索,包括两种结合方案的优劣,最后总结plug结合大模型解决Mock数据不真实问题,虽有不足但会持续优化。

[得物技术] 得物 多场景建模 搜索推荐

多场景建模在得物交易搜索下的创新与实践
2024年得物算法团队围绕交易搜索开展多场景建模工作,成果被顶级会议录用。文章从得物App整体和搜索多场景出发,指出多场景学习在电商搜索推荐系统中的发展,分析得物搜索多场景建模的两个主要问题。阐述了SACN、SAINet、DSWIN三种优化思路和模型结构、问题定义、具体方法、实验部分等内容,通过大量实验证明模型有效性,最后对多场景建模提出进一步思考,如人群、行业的泛化和多模态信息融合。

[数据可视化 AntV] AntV S2 数据可视化 下钻分析

数据探索再进一步 - 使用下钻对数据进一步分析
文章介绍了AntV S2组件,它是多维交叉分析领域的表格解决方案。以四川疫情走势展示为例,引出S2下钻分析能力的需求,如不同地域用户对数据展示的不同需求。团队以云贵川渝疫情数据展示了S2下钻功能,包括表格初始化状态、下钻菜单的三种方式等,下钻可让行头数据更灵活。最后阐述下钻能力有助于用户逐层分析、增强洞察力、快速反应和优化决策,并给出相关参考链接。

[GSYTech] Flutter Android PlatformView

Flutter 正在推进全新 PlatformView 实现 HCPP, 它又用到了 Android 上的什么黑科技
文章主要讲述Flutter正在推进的全新PlatformView实现HCPP,回顾了Flutter在Android上的PlatformView实现模式,包括VD、HC、TLHC三种模式的特点与协同工作方式。重点介绍了HCPP模式,它需要Vulkan和API 34环境,通过SurfaceControl构造新Surface解决绘制时混合覆盖问题,还提及了HCPP与其他模式的区别、Engine相关逻辑、当前状态等,并与iOS端进行了对比。

[Android 开发者] Jetpack Compose CameraX Google

在 Jetpack Compose 中解锁 CameraX 的强大功能
文章是'相机与媒体Spotlight Week'系列内容之一,介绍了在Jetpack Compose中解锁CameraX强大功能。先添加库依赖项,再通过Accompanist权限库授予相机权限,创建管理相机预览的ViewModel,最后实现相机预览界面,构建出一个功能齐全的全屏取景器。

[AndroidPub] Android开发、AI工具

Android 开发实用 AI 工具汇总
文章介绍了在Android开发中不同领域发挥作用的AI工具,包括代码补全与生成(GitHub Copilot、JetBrains AI、Gemini in Android Studio)、AI智能体(Cursor、Cline、Junie)、测试(Arbigent)和应用开发(ComposeFlow),指出这些工具能提升开发效率,在各开发环节选择合适工具可实现高效、高质量开发。

[谷歌开发者] vivo Google Cloud AI体验

vivo 携手 Google Cloud,推出更安全、便捷的 AI 体验
vivo经过多年AI技术积累,面向海外推新机,主打安全、便捷、智能。其采用端侧AI技术有性能和隐私优势,选择Google Cloud合作,Google Cloud有多种优势,其技术赋能vivo的AI功能,助力vivo全球发展,二者合作旨在为海外用户带来更好AI体验。

[前端圈] Electron、误解、开源项目

人们对 Electron 的误解
本文作者为Electron联合维护者Felix Rieseberg,文章主要讨论人们对Electron的常见误解,包括认为Electron让JavaScript与原生代码对立、Web应用程序不好、操作系统WebView性能更优、包大小很重要等,还提到Electron存在的意义并非竞争而是填补空白,若想击败它需要提供更好的体验。

数据库发展 2024 朱洁

2024 中国数据库十大发展趋势总结
文章从市场环境、产品技术、厂商发展等维度总结了2024年中国数据库发展的十大趋势,包括公有云稳定盈利但产品缺乏创新、向量数据库国内市场未打开、云数据库渗透比例提高等,还展望了2025年,如AI数据库可能成为研究热点、数据库将在AI原生应用中发挥作用等,同时提到创业公司生存艰难等现状。

[InfoQ] OPPO 应用分发 存量市场

深度解读 OPPO 全渠道增长解决方案,破解存量时代应用分发难题
随着移动互联网增量市场红利消退,开发者转向存量市场运营,传统应用分发模式存在难题。OPPO于1月推出全渠道增长解决方案,含四大能力。2月20日OTalk活动中,OPPO高级产品运营经理深入解读。四大能力包括应用跨平台同步、统一链接OneLink、下载赋能、更新赋能,各能力有其优势,且更多能力将陆续上线,开发者可通过多种方式了解详情并申请权限。

[TesterHome社区] 人工智能 软件工程 OpenAI

AI可以修复bug,但无法找到它们:OpenAI 的研究凸显了软件工程领域LLMs的局限性
OpenAI研究人员开发SWE - Lancer基准测试,用1488项Upwork任务检验大语言模型在现实软件开发任务中的表现。测试发现模型虽能解决程序漏洞但不理解原因且会再犯错,无法完全取代人类工程师,在管理任务上表现更好。论文还介绍了基准测试的构建、实验结果、局限性和未来工作等内容。

Trae AI、编程、小册

独家首发,免费|Trae 从入门到实践,开启 AI 编码新征程!
字节跳动IDE团队打造的Trae AI对标Cursor,为解决编程难题而生。小册《Trae从入门到实践:AI编码的妙笔生花》上线,新手可免费学,加入学习可获掘金月度会员,参与笔记活动有机会赢奖品。小册内容涵盖Trae AI的基础到进阶用法、实践等,还介绍了活动的相关规则、时间、参与对象和奖励等。

国外

[Hugging Face] AI艺术、技术创新、开源模型

AI 艺术工具通讯
本文是AI艺术工具通讯的创刊号,回顾了2024年AI艺术领域在图像、视频、音频生成等方面的关键突破与创新工具,如Flux.1等开源图像模型的发布,开源视频模型的爆发以及音频模型的进展。还介绍了一些创意工具,最后展望2025年AI艺术趋势,包括开源社区在视频、动态与音频模型领域的发展,以及多模态创新等,并宣布将开启月度资讯精选订阅。

[DevOps] 微软 开源 OmniParser

微软开源创新框架:可将DeepSeek,变成AI Agent
微软发布视觉Agent解析框架OmniParser V2.0,可将DeepSeek - R1、GPT - 4o、Qwen - 2.5VL等模型变为AI Agent,与V1版相比有性能提升。还开源了omnitool。OmniParser V2.0将界面元素‘标记化’解析,OmniTool由V2、OmniBox和Gradio组成,OmniParser有多个模块协作完成视觉信息到结构化数据的转化。

网络带宽 页面速度 资源竞争

How Does Bandwidth Competition Impact Page Speed?
文章阐述网络带宽对网页加载速度的影响,解释带宽概念,通过示例展示不同情况的带宽竞争如何影响页面加载时间,如多图像竞争带宽使下载时间增加,还介绍了现实中的带宽竞争实例,最后提出减少资源竞争的方法,包括标记高优先级资源、懒加载视口外图像、减小图像文件大小等。

WebP Cloudflare 图像格式

False Promises of WebP Support
文章讲述了BigCommerce和WP Engine声称支持WebP图像格式,但实际上由于Cloudflare Polish的无损设置,很少自动将图像转换为WebP。分析了Cloudflare Polish的工作原理,指出无损设置下JPEG转换为WebP是有损操作所以不会转换,建议BigCommerce和WP Engine关闭无损设置或者停止声称支持WebP,还探讨了Cloudflare可能存在的问题及改进措施。

LLMs React Design

Designing backgrounds with LLMs and React
作者分享了使用LLMs设计背景的经验,包括制作交互背景的React+Tailwind代码示例,如不同样式的网格背景、星夜天空背景等,还指出LLMs擅长编写特殊语法,虽然LLMs不会很快取代设计师,但在设计独立组件方面能力令人印象深刻,且在代码中设计更强大,可以做出动态效果。

欧洲无障碍法案 开发者 可访问性

Meeting European Accessibility Act (EAA) Standards: A Developer’s Checklist
本文介绍了欧洲无障碍法案(EAA),包括其适用范围、合规期限、不遵守的后果等,还为开发者提供了一份遵循EAA标准的清单,涵盖从初始的可访问性审计到持续改进工作流程的各个方面,并阐述了EAA对开发者的重要性,包括法律、财务、业务风险和面向未来等方面。

TypeScript JavaScript 编程语言对比

TypeScript vs JavaScript: Which One to Choose in 2025?
文章比较了TypeScript和JavaScript,介绍了两者的定义、特点、优缺点、关键差异等。JavaScript是动态类型、易于快速开发,适用于小项目;TypeScript是静态类型、利于维护,适用于大型项目。还提及了各自的适用场景、性能、语法、文件扩展名等方面的区别,最后指出选择哪种语言取决于项目需求。

JavaScript 单元测试 最佳实践

How to write effective and clean unit tests in JavaScript
文章分享了JavaScript编写单元测试的最佳实践,包括使用it()而非test()、关注行为而非实现、用describe()提供上下文、拆分复杂测试等,这些实践有助于提高代码质量和可维护性,使测试易于理解、维护和扩展,确保测试的可靠性和有效性。

分形 GLSL 模拟理论

Rendering the Simulation Theory: Exploring Fractals, GLSL, and the Nature of Reality
文章作者Yohei Nishitsuji分享了自己在物理学、数学、地球与行星科学背景下对分形、GLSL和模拟理论的探索。他阐述了万物皆为波的观点,认为分形存在于各个感官体验中,其性质可能与量子物理或数学的未知领域有关。他还提到通过宗教和哲学也能得出类似结论。作者通过艺术作品表达了模拟理论,介绍了GLSL相关工具和自己的一些作品,以及在创作过程中的感悟,最后讲述了因艺术表达而结识的人以及自己回归绘画世界的经历。

Open Source Linting Parsing

ESLint now officially supports linting of CSS
ESLint正式支持CSS的代码检查。2024年7月计划成为通用检查工具,10月支持JSON和Markdown检查,如今增加CSS支持。CSS检查通过@eslint/css插件实现,介绍了其安装配置、内置规则,如禁止重复导入等。还提到宽容解析、自定义语法支持、创建自定义规则和代码浏览器的使用,这使ESLint成为更通用、灵活的工具,有助于提升代码质量。

Deno 技术更新 软件开发

Deno 2.2: OpenTelemetry, Lint Plugins, node:sqlite
本文主要介绍了Deno 2.2的更新内容,包括内置OpenTelemetry、Linter更新、支持node:sqlite、对各种工具(如deno check、deno lsp等)的改进、依赖管理、权限检查放松、性能提升、与Node.js和npm兼容性改进等多方面的更新,还提及了TypeScript和V8的版本升级、长期支持版本、致谢贡献者等内容。

frontend web - llm llm

What is WebLLM
WebLLM由MLC - AI团队实现,可在浏览器中完全本地运行LLMs。文章介绍了WebLLM的工作原理,包括利用WebAssembly和WebGPU等技术,还对比了云LLMs和浏览器内WebLLM的特性,如离线支持、性能、隐私等方面。此外,讲述了如何在网站中实现WebLLM,包括安装、创建引擎、调用API等操作,最后提到可在特定网站体验WebLLM的运行。

Color HTML JavaScript

A Color Input That Also Shows the Value
HTML原生颜色选择器有一定便利性,但关闭选择器后不显示所选颜色的值存在不足。作者构建了一个Web组件来显示颜色,其基于HTML并扩展功能,同时探讨了文本输入处理多种颜色格式、与颜色输入值的关系,以及OS颜色选择器支持更多格式的可能性。

产品/设计

[腾讯设计族] 触感体验、产品设计、数字化

用户界面之外:触感体验
文章探讨了触感反馈在产品设计中的融入。首先阐述关注触感的原因是数字化生活让我们远离现实世界,而触感是物理属性的回归。接着介绍了触感的表达,包括分类和语义表达。然后从通知型、交互型、模拟型、无障碍型等方面讲述设计触感体验,还给出了实践建议,如建立用户心智、满足个性化需求等。最后展望了触感体验的发展,如更精细的表达、更真实的虚拟体验等。

[AlibabaDesign] 巴黎奥运会 阿里云 AIGC

AIGC设计点亮巴黎奥运AI科技之旅
阿里云作为巴黎奥运会独家云服务商,《巴黎之旅》设计团队依托其平台AI技术,为奥运会提供设计支持。该系列视频荣获两项金奖,文章还介绍了主创团队、视频简介、剧集内容、方案制作关键点、技术难题与优化策略等内容。

[58UXD] B端认证 流程优化 用户体验

B端认证流程优化——打造极致用户体验,提升转化率
招聘企业在58上招聘流程中,认证环节让近半数用户流失。通过调研发现用户在产品选择、信息理解、操作上成本高。于是从信息语义、页面结构和认证步骤三方面简化改造认证的前中后流程,包括优化认证方式选择、减少用户教育内容、提升操作效率、优化认证审核方式、改进失败结果页等,最终实现认证提交率和成功率翻倍。

[百度MEUX] 设计组件库、百度搜索、设计团队

关于设计组件库,我们有一些新思考
文章介绍百度搜索设计团队在设计组件库升级过程中的心得。先阐述搜索业务对‘好的设计组件’的要求为‘好懂、好用、好维护’,接着从构建组件、组件使用、组件维护三方面分享实用思路,包括组件搭建流程、提升使用体验的方法和基于数据监控的维护方式,最后表示将继续探索设计系统工具化等以全方位提效。

[钉钉用户体验] 钉钉多维表、AI办公、效率提升

钉钉多维表 × AI 办公王炸组合!效率直接飚升300%
钉钉多维表在「字段模板」中集成AI能力,其字段模板是系统预设字段,可提升数据表创建和管理效率。在AI支持下,能力更突出,有多种强大模板。使用字段模板只需三步,且AI字段模板可用于多种场景,如内容创作、用户调研分析、分析线索商业价值等,还能让工作更有趣,在更多场景发挥作用。最后诚邀大家体验钉钉多维表的新功能。

[钉钉用户体验] 钉钉AI助理 职场助手 工作场景

钉钉AI助理:“懂你”的AI,才叫真智能
文章介绍了钉钉AI助理,强调其更懂用户工作,能基于工作数据给出精准解决方案。还列举了智能周报生成、项目复盘、职业成长规划、员工绩效考核等工作场景中的应用,接着说明了在电脑端和移动端的使用方法,最后提到正在招募AI先锋,邀请读者体验钉钉AI助理开启职场外挂。

行业/技术/思考

知识库管理、知识与数据、企业管理

从DeepSeek到腾讯ima:为什么每个人都需要一个知识库管理系统?
文章探讨了知识库管理系统的必要性。从数字驱动业务出发,阐述算法与数据的局限性,指出推理模型+知识可提升效率。以自动订货软件为例说明企业知识管理的重要性。介绍腾讯ima和企业级知识管理的要求,提及员工入职离职时知识管理的流程。还阐述了知识与数据的区别,从多个维度分析二者的特性、对待策略等,并给出简化易懂的解释和日常应用示例。

[腾讯云开发者] DeepSeek技术 人工智能 腾讯云

万字长文详解DeepSeek核心技术
本文主要介绍了DeepSeek系列模型的技术创新,包括DeepSeek MoE架构、GRPO、MLA、MTP、混合精度框架等,还阐述了DeepSeek R1 - Zero和R1模型的突破、技术细节及其意义。DeepSeek MoE架构有细粒度专家划分和共享专家分离等创新,GRPO可降低计算资源消耗,MLA能减少KV Cache,MTP可提升训练效率等。R1 - Zero仅用强化学习训练,R1采用多阶段训练策略,这些模型开源且低成本,对行业发展有重要意义。

[海外独角兽] AI制药、Chai Discovery、药物研发

Chai Discovery:OpenAI 投资的 AI4Sci 公司,AlphaFold 最快追赶者
文章介绍了Chai Discovery公司,该公司获3000万美元种子轮融资。其模型Chai - 1采用Diffusion模型做结构预测,在结构预测上领先。还分析了药物研发市场,AI在其中的作用,Chai - 1的产品特性、技术路线、收费模式、竞争对手和团队融资情况等内容。

[腾讯技术工程] DeepSeek - R1论文 强化学习 模型训练

细致扒一下DeepSeek-R1论文到底讲了些什么
文章主要探讨了DeepSeek - R1论文的相关内容。首先介绍了DeepSeek - R1 - Zero通过强化学习自我进化,包括其采用的GRPO算法、奖励建模、训练格式等,虽有推理能力但结果可读性差。接着阐述DeepSeek - R1的训练,包含冷启动、推理导向强化学习、针对所有场景的强化学习等过程。还提到模型蒸馏,以及对比蒸馏和强化学习,分享了不成功的尝试案例,最后提及未来工作等内容。

[王吉伟] DeepSeek AI Agent 人工智能

聊聊DeepSeek大模型对AI Agent的影响,附相关智能体项目与学习资料包
DeepSeek大模型自推出后下载量攀升、日活用户增多,吸引众多企业合作。它对AI Agent有多方面影响,包括性能提升、应用拓展、推动多模态任务发展等,还改变行业竞争格局。其开源特性降低AI技术应用门槛,加速在垂直领域的普及。文中介绍了基于DeepSeek构建的AI Agent的特点,还列举了部分已接入或支持DeepSeek的AI Agent项目。

[腾讯研究院] AI协作、腾讯、余一

与AI协作2000小时后:发现人类对大模型能力的挖掘,还不足10%
腾讯青腾AI&全球化项目经理余一分享与AI协作2000小时后的认知。她通过多个案例,如班车对话、购买包包决策、工作场景中的AI协助等,阐述AI不仅是工具,能提供情绪价值、辅助决策、提升工作效率。还提到与AI协作需打破工具和软件思维,要有非完美思维,编写提示词应关注人的特质。最后谈到与AI协作的几种视角,以及AI协作带来的重新理解陪伴、领导力和自身等收获。

[腾讯研究院] 人工智能 徐雷 发展历程

专访上海交大讲席教授徐雷:人工智能走了20年弯路之后|AI&Society百人百问
本文是对上海交通大学讲席教授徐雷的专访。徐雷教授阐述了人工智能的发展历程,指出人工智能诞生初期走了20年弯路,逆自然演化方向发展,后来神经网络研究兴起使其回归正轨。还探讨了中西方语言文字演化对思维的影响、AlphaGo和ChatGPT成功的思维结合因素、推理和推断的区别、Scaling Law的问题、DeepSeek成功的结构原因、大模型的‘幻觉’等,并对人工智能发展瓶颈、突破方向以及应用前景等问题进行了分析。