cs.AI 篇论文 | Gist.Science

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

该论文通过大规模人工验证揭示，现有“LLM 作为裁判”的框架因无法应对红队测试中的分布偏移，导致其评估结果往往退化为随机猜测，并指出许多攻击实则是利用了裁判模型的缺陷而非真正产生了有害内容，为此作者提出了更可靠的基准测试与裁判压力测试数据集以改进评估体系。

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan Günnemann2026-03-10💬 cs.CL

Distributionally Robust Geometric Joint Chance-Constrained Optimization: Neurodynamic Approaches

本文提出了一种基于神经动力学的双时间尺度方法，通过三种投影方程求解分布鲁棒几何联合机会约束优化问题，该方法无需传统求解器即可概率收敛至全局最优，并成功应用于形状优化与电信问题。

Ange Valli (L2S), Siham Tassouli (OPTIM), Abdel Lisser (L2S)2026-03-10🔢 math

Building the ethical AI framework of the future: from philosophy to practice

该论文提出了一种将伦理原则转化为可执行控制机制的“伦理设计”架构，通过在每个 AI 生命周期阶段实施包含性能、合规及可持续性指标的“三重门”机制，填补了现有治理框架在端到端操作控制方面的空白，从而为构建可验证、可落地的未来 AI 伦理治理体系提供了实践基础。

Jasper Kyle Catapang2026-03-10💻 cs

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

本文提出了一种名为 FuzzingRL 的强化模糊测试方法，通过结合视觉与语言模糊变换及对抗性强化微调，自动生成旨在诱导视觉语言模型（VLM）产生错误回答的多样化问题，从而有效揭示并降低目标模型的性能。

Jiajun Xu, Jiageng Mao, Ang Qi, Weiduo Yuan, Alexander Romanus, Helen Xia, Vitor Campagnolo Guizilini, Yue Wang2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

该论文揭示了数据重复性具有尺度依赖性，即随着模型能力提升，语义重复文档的梯度对齐度增加且语义碰撞加剧，导致大模型在有限独特语料上训练时出现性能退化并偏离预期扩展规律，进而提出了相应的扩展定律以修正预测。

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

该论文通过构建一系列逐步增加复杂度的多智能体干扰博弈任务，利用大规模 SUMO 生成数据集系统解耦并评估了 C-V2X 网络中多智能体深度强化学习资源分配面临的关键挑战，发现策略在多样化车辆拓扑下的鲁棒性与泛化能力是主要瓶颈，并开源了代码与基准测试套件以推动该领域的可复现研究。

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

该论文提出了名为“双桥地图套件（Two-Bridge Map Suite）”的开源基准，旨在通过移除经济机制并聚焦于长距离导航与微操战斗，填补《星际争霸 II》全游戏与微型游戏之间的复杂度空白，从而为在有限算力下进行强化学习研究提供可访问的中间环境。

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

该论文指出，在缺乏外部验证的领域，通过增加推理计算量（如多数投票或集成策略）无法提升大语言模型的真实性，因为模型间的错误高度相关且自我置信度不可靠，导致聚合结果往往只是强化了共同的误解而非验证真理。

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo2026-03-10🤖 cs.LG

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

本文提出了一种名为 OptiRoulette 的随机元优化器，它通过在训练过程中动态选择更新规则，在多个图像分类基准测试中显著提升了收敛速度和最终准确率，并实现了比单一 AdamW 基线更可靠的训练目标达成率。

Stamatis Mastromichalakis2026-03-10🤖 cs.LG

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

该论文提出了一种名为“退火协同生成”（ACG）的框架，通过将高维联合建模解耦为低维成对建模，并利用三阶段退火过程耦合共享变量，从而在无需额外训练的情况下实现了高效且一致的多元科学数据协同生成。

Hantao Zhang, Jieke Wu, Mingda Xu, Xiao Hu, Yingxuan You, Pascal Fua2026-03-10🤖 cs.LG

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

本文提出了 RACER 方法，通过将大语言模型路由问题建模为 $\alpha$ -VOR 问题并利用有限样本浓度界限进行校准，实现了在无需分布假设的情况下对误路由风险的控制，从而在降低成本的同時显著提升了下游任务的准确性。

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

本文提出了名为 Evo 的新型大语言模型，该模型通过构建连续潜变量轨迹，将自回归与扩散生成范式统一为自适应平衡的语义演化框架，在保持高效推理速度的同时，于多项基准测试中实现了卓越的语言理解、推理及代码生成性能。

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin2026-03-10🤖 cs.LG

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

该论文提出了一种拓扑感知框架，通过结合领域基础模型、拓扑感知图分词器及知识蒸馏策略，有效解决了多路生物网络中结构序列信息整合困难及未见实体零-shot 交互预测的挑战，并显著提升了预测性能。

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

cs.AI

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

Distributionally Robust Geometric Joint Chance-Constrained Optimization: Neurodynamic Approaches

Building the ethical AI framework of the future: from philosophy to practice

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

Scale Dependent Data Duplication

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

Not all tokens are needed(NAT): token efficient reinforcement learning

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

Grouter: Decoupling Routing from Representation for Accelerated MoE Training

Photons = Tokens: The Physics of AI and the Economics of Knowledge