arXiv AI 每日精选

227 篇论文
🤖人工智能(综合)(106篇)
cs.CLcs.AIcs.LG

#1扩散语言模型的汇点感知剪枝

Sink-Aware Pruning for Diffusion Language Models

扩散语言模型(DLMs)由于迭代去噪过程而产生高昂的推理成本,这推动了高效剪枝的研究。现有的剪枝启发式方法主要继承自自回归(AR)大型语言模型,通常会保留注意力汇聚标记,因为AR汇聚标记充当稳定的全局锚点。我们发现这一假设并不适用于DLMs:在整个生成轨迹中,注意力汇聚位置表现出显著更高的方差(通过...

Aidar Myrzakhan, Tianyi Li 等 5 人
2026/02/19
cs.AIcs.CLcs.IR

#2CLEF HIPE-2026:评估多语言历史文本中准确高效的人物-地点关系抽取

CLEF HIPE-2026: Evaluating Accurate and Efficient Person-Place Relation Extraction from Multilingual Historical Texts

HIPE-2026是一个CLEF评估实验室,致力于从嘈杂的多语言历史文本中提取人物-地点关系。该实验室在HIPE-2020和HIPE-2022活动的基础上,通过针对多种语言和时间段中的人物-地点关联识别任务,将该系列扩展到语义关系提取领域。系统需要对两种类型的关系进行分类——$at$(“该人物是否曾...

Juri Opitz, Corina Raclé 等 7 人
2026/02/19
cs.LGcs.AIcs.IT

#3MARS:具有自优化功能的边际感知奖励建模

MARS: Margin-Aware Reward-Modeling with Self-Refinement

奖励建模是现代对齐流程(包括RLHF和RLAIF)的核心组件,为PPO和TRPO等策略优化方法提供支持。然而,训练可靠的奖励模型严重依赖人类标记的偏好数据,这类数据成本高且数量有限,因此激发了数据增强的应用。现有的增强方法通常在表示或语义层面操作,且不考虑奖励模型的估计难度。在本文中,我们提出了MA...

Payel Bhattacharjee, Osvaldo Simeone 等 3 人
2026/02/19

还有 103 篇论文

🧠机器学习(92篇)
cs.CLcs.AIcs.LG

#1扩散语言模型的汇点感知剪枝

Sink-Aware Pruning for Diffusion Language Models

扩散语言模型(DLMs)由于迭代去噪过程而产生高昂的推理成本,这推动了高效剪枝的研究。现有的剪枝启发式方法主要继承自自回归(AR)大型语言模型,通常会保留注意力汇聚标记,因为AR汇聚标记充当稳定的全局锚点。我们发现这一假设并不适用于DLMs:在整个生成轨迹中,注意力汇聚位置表现出显著更高的方差(通过...

Aidar Myrzakhan, Tianyi Li 等 5 人
2026/02/19
cs.LGcs.AIcs.IT

#2MARS:具有自优化功能的边际感知奖励建模

MARS: Margin-Aware Reward-Modeling with Self-Refinement

奖励建模是现代对齐流程(包括RLHF和RLAIF)的核心组件,为PPO和TRPO等策略优化方法提供支持。然而,训练可靠的奖励模型严重依赖人类标记的偏好数据,这类数据成本高且数量有限,因此激发了数据增强的应用。现有的增强方法通常在表示或语义层面操作,且不考虑奖励模型的估计难度。在本文中,我们提出了MA...

Payel Bhattacharjee, Osvaldo Simeone 等 3 人
2026/02/19
cs.LGcs.AIcs.CL+1

#3通过细粒度细节靶向突破黑盒LVLM攻击前沿

Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting

对大型视觉语言模型(LVLMs)的黑盒对抗性攻击具有挑战性,因为缺乏梯度且存在复杂的多模态边界。虽然先前的最先进迁移式方法(如M-Attack)通过源图像和目标图像之间的局部裁剪级匹配表现良好,但我们发现这会导致跨迭代的高方差、近乎正交的梯度,违反了连贯的局部对齐并破坏了优化稳定性。我们将此归因于(...

Xiaohan Zhao, Zhaoyi Li 等 5 人
2026/02/19

还有 89 篇论文

💬计算语言学(51篇)
cs.CLcs.AIcs.LG

#1扩散语言模型的汇点感知剪枝

Sink-Aware Pruning for Diffusion Language Models

扩散语言模型(DLMs)由于迭代去噪过程而产生高昂的推理成本,这推动了高效剪枝的研究。现有的剪枝启发式方法主要继承自自回归(AR)大型语言模型,通常会保留注意力汇聚标记,因为AR汇聚标记充当稳定的全局锚点。我们发现这一假设并不适用于DLMs:在整个生成轨迹中,注意力汇聚位置表现出显著更高的方差(通过...

Aidar Myrzakhan, Tianyi Li 等 5 人
2026/02/19
cs.AIcs.CLcs.IR

#2CLEF HIPE-2026:评估多语言历史文本中准确高效的人物-地点关系抽取

CLEF HIPE-2026: Evaluating Accurate and Efficient Person-Place Relation Extraction from Multilingual Historical Texts

HIPE-2026是一个CLEF评估实验室,致力于从嘈杂的多语言历史文本中提取人物-地点关系。该实验室在HIPE-2020和HIPE-2022活动的基础上,通过针对多种语言和时间段中的人物-地点关联识别任务,将该系列扩展到语义关系提取领域。系统需要对两种类型的关系进行分类——$at$(“该人物是否曾...

Juri Opitz, Corina Raclé 等 7 人
2026/02/19
cs.LGcs.AIcs.CL+1

#3通过细粒度细节靶向突破黑盒LVLM攻击前沿

Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting

对大型视觉语言模型(LVLMs)的黑盒对抗性攻击具有挑战性,因为缺乏梯度且存在复杂的多模态边界。虽然先前的最先进迁移式方法(如M-Attack)通过源图像和目标图像之间的局部裁剪级匹配表现良好,但我们发现这会导致跨迭代的高方差、近乎正交的梯度,违反了连贯的局部对齐并破坏了优化稳定性。我们将此归因于(...

Xiaohan Zhao, Zhaoyi Li 等 5 人
2026/02/19

还有 48 篇论文

👁️计算机视觉(49篇)
cs.LGcs.AIcs.CL+1

#1通过细粒度细节靶向突破黑盒LVLM攻击前沿

Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting

对大型视觉语言模型(LVLMs)的黑盒对抗性攻击具有挑战性,因为缺乏梯度且存在复杂的多模态边界。虽然先前的最先进迁移式方法(如M-Attack)通过源图像和目标图像之间的局部裁剪级匹配表现良好,但我们发现这会导致跨迭代的高方差、近乎正交的梯度,违反了连贯的局部对齐并破坏了优化稳定性。我们将此归因于(...

Xiaohan Zhao, Zhaoyi Li 等 5 人
2026/02/19
cs.CVcs.AIcs.CY+1

#2动态主动适应:用于地理空间发现的带潜在概念的相关性引导在线元学习

Adapting Actively on the Fly: Relevance-Guided Online Meta-Learning with Latent Concepts for Geospatial Discovery

在许多现实场景中,如环境监测、灾害响应或公共卫生领域,由于数据收集成本高、难度大且环境动态变化,在资源紧张的情况下,从未观测区域进行战略性采样对于高效发现隐藏目标至关重要。然而,稀疏且有偏差的地理空间地面真值限制了现有基于学习的方法(如强化学习)的适用性。为解决这一问题,我们提出了一个统一的地理空间...

Jowaria Khan, Anindya Sarkar 等 4 人
2026/02/19
cs.CVcs.AI

#3复制像素追踪与复制检测中的块亲和力正则化

Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection

图像复制检测(ICD)旨在通过鲁棒的特征表示学习识别图像对之间的篡改内容。虽然自监督学习(SSL)推动了ICD系统的发展,但现有的视图级对比方法由于缺乏足够的细粒度对应学习,难以应对复杂的编辑操作。我们通过两项关键创新,利用编辑内容中固有的几何可追溯性来解决这一限制。首先,我们提出PixTrace—...

Yichen Lu, Siwei Nie 等 6 人
2026/02/19

还有 46 篇论文

🦾机器人学(16篇)
cs.ROcs.AIcs.LG

#1流形感知谱空间上的条件流匹配用于自动驾驶中的连续异常检测

Conditional Flow Matching for Continuous Anomaly Detection in Autonomous Driving on a Manifold-Aware Spectral Space

目前,4级自动驾驶汽车(AVs)的安全验证受到瓶颈限制,原因是无法使用传统基于规则的启发式方法来扩展对罕见、高风险长尾场景的检测。我们提出了Deep-Flow,这是一种用于安全关键异常检测的无监督框架,它利用最优传输条件流匹配(OT-CFM)来表征专家人类驾驶行为的连续概率密度。与在不稳定、高维坐标...

Antonio Guillen-Perez
2026/02/19
cs.CVcs.AIcs.RO

#2使用多模态高斯溅射的3D场景渲染

3D Scene Rendering with Multimodal Gaussian Splatting

3D场景重建和渲染是计算机视觉的核心任务,其应用涵盖工业监控、机器人技术和自动驾驶等领域。近年来,3D高斯溅射(GS)及其变体的研究进展在保持高计算和内存效率的同时,实现了令人印象深刻的渲染保真度。然而,传统的基于视觉的GS流水线通常依赖足够数量的相机视图来初始化高斯基元并训练其参数,这在初始化过程...

Chi-Shiang Gau, Konstantinos D. Polyzos 等 5 人
2026/02/19
cs.AIcs.HCcs.RO

#3IntentCUA:学习意图级表示以实现计算机使用代理中的技能抽象和多代理规划

IntentCUA: Learning Intent-level Representations for Skill Abstraction and Multi-Agent Planning in Computer-Use Agents

计算机使用代理在嘈杂的感知、多窗口上下文和不断变化的环境状态下进行长期操作。现有的方法,从基于强化学习的规划器到轨迹检索,常常偏离用户意图并重复解决常规子问题,导致错误累积和效率低下。我们提出IntentCUA,这是一个多智能体计算机使用框架,旨在通过与意图对齐的计划记忆来稳定长期执行。规划器、计划...

Seoyoung Lee, Seobin Yoon 等 7 人
2026/02/19

还有 13 篇论文

📊统计机器学习(9篇)
cs.LGcs.AIstat.ML

#1何时信任廉价检查:推理的弱验证与强验证

When to Trust the Cheap Check: Weak and Strong Verification for Reasoning

在大型语言模型(LLMs)中进行推理时,越来越多地在更广泛的验证循环中展开。在内部,系统使用成本较低的检查,例如自一致性或代理奖励,我们称之为弱验证。在外部,用户检查输出并通过反馈引导模型,直到结果可信,我们称之为强验证。这些信号在成本和可靠性上有显著差异:强验证可以建立信任,但资源密集;弱验证则快...

Shayan Kiyani, Sima Noorani 等 4 人
2026/02/19
cs.LGcs.AIstat.ML

#2面向随时有效的统计水印

Towards Anytime-Valid Statistical Watermarking

大型语言模型(LLMs)的激增使得区分机器生成内容与人类文本的高效机制成为必要。尽管统计水印已成为一种有前景的解决方案,但现有方法存在两个关键局限性:缺乏选择采样分布的原则性方法,以及依赖固定时间范围的假设检验,这排除了有效的提前停止。在本文中,我们通过开发首个基于e值的水印框架——锚定电子水印(A...

Baihe Huang, Eric Xu 等 5 人
2026/02/19
math.STcs.LGstat.ML

#3岭回归中的最优无约束自蒸馏:严格改进、精确渐近性和一次性调优

Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning

自蒸馏(SD)是指使用相同的架构和训练数据,在真实标签和教师模型自身预测的混合数据上重新训练学生模型的过程。尽管经验表明自蒸馏通常能提高泛化能力,但其形式化保证仍然有限。我们研究了无约束设置下的岭回归自蒸馏,其中混合权重$ξ$可能超出单位区间。在以训练数据为条件且不做任何分布假设的情况下,我们证明:...

Hien Dang, Pratik Patil 等 3 人
2026/02/19

还有 6 篇论文

🎯博弈论与AI(4篇)
quant-phcs.AIcs.GT

#1用人工智能辅助的确定性博弈论扩展量子理论

Extending quantum theory with AI-assisted deterministic game theory

我们提出了一个人工智能辅助框架,用于预测复杂量子实验的个体运行,包括情境性和因果性(自适应测量),这是我们发现扩展量子理论的局域隐变量理论长期计划的一部分。为了规避不可能定理,我们用一种较弱的、兼容主义版本的“偶然自由选择”取代了自由选择(测量独立性和参数独立性)的假设。我们的框架基于将复杂量子实验...

Florian Pauschitz, Ben Moseley 等 3 人
2026/02/19
cs.LGcs.GTcs.MA+1

#2通过额外预测实现延迟反馈博弈中的线性收敛

Linear Convergence in Games with Delayed Feedback via Extra Prediction

在现实世界的多智能体学习中,反馈延迟是不可避免的。已知反馈延迟会严重降低性能,即使对于双线性博弈,反馈延迟下的收敛速度仍然不明确。本文推导了加权乐观梯度下降 - 上升(WOGDA)算法在无约束双线性博弈中的线性收敛速度,该算法通过额外的乐观性来预测未来奖励。为了分析该算法,我们将其解释为额外近似点(...

Yuma Fujimoto, Kenshi Abe 等 3 人
2026/02/19
cs.MAcs.GT

#3测试时的算法合谋:元游戏设计与评估

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

算法合谋的威胁以及其是否值得监管干预仍存在争议,因为现有的对其出现的评估往往依赖于较长的学习周期、关于交易对手采用合谋策略的理性假设,以及参与者之间超参数和经济环境的对称性。为了研究合谋风险,我们引入了一种元游戏设计,用于在测试时约束下分析算法行为。我们将智能体建模为拥有具有不同战略特征(例如竞争性...

Yuhong Luo, Daniel Schoepflin 等 3 人
2026/02/19

还有 1 篇论文

🧬神经网络与进化计算(0篇)
📄
暂无论文
⚙️系统与控制(0篇)
📄
暂无论文