cs.LG 篇论文 | Gist.Science

One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries

该论文提出了一种名为"One Supervisor, Many Modalities"的代理 AI 框架，通过中央协调器动态分解并路由文本、图像、音频等多模态任务至专用工具，在保持准确率的同时显著降低了响应时间、对话重做率和成本。

Mayank Saini Arit Kumar Bishwas2026-03-13💬 cs.CL

Multi-Task Anti-Causal Learning for Reconstructing Urban Events from Residents' Reports

该论文提出了多任务反因果学习（MTAC）框架，通过利用跨任务不变性来学习共享因果图并重构潜在原因，在利用居民报告重建城市事件（如停车违规、废弃房产和卫生状况）的任务中显著提升了准确性。

Liangkai Zhou, Susu Xu, Shuqi Zhong, Shan Lin2026-03-13🤖 cs.LG

CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time

本文提出了一种名为 CAETC 的新方法，通过结合对抗表示学习与自编码架构，在时间序列数据中构建部分可逆且治疗不变的表征，从而有效解决时间依赖混淆偏差问题并显著提升反事实估计的准确性。

Nghia D. Nguyen, Pablo Robles-Granda, Lav R. Varshney2026-03-13🤖 cs.LG

Survival Meets Classification: A Novel Framework for Early Risk Prediction Models of Chronic Diseases

该论文提出了一种将生存分析与分类技术相结合的新框架，利用大规模电子病历数据成功构建了五种常见慢性病的早期风险预测模型，其性能优于或媲美主流模型，并经由临床专家验证了生成的解释性。

Shaheer Ahmad Khan, Muhammad Usamah Shahid, Muddassar Farooq2026-03-13🤖 cs.LG

Hybrid Energy-Aware Reward Shaping: A Unified Lightweight Physics-Guided Methodology for Policy Optimization

本文提出了一种名为 H-EARS 的混合能量感知奖励塑形方法，通过将基于势函数的奖励塑形与能量感知动作正则化相结合，在无需完整系统动力学模型的情况下实现了线性复杂度，从而显著提升了深度强化学习在连续控制任务中的收敛速度、稳定性及能效。

Qijun Liao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Jue Yang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yiting Kang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Xinxin Zhao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yong Zhang (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China), Mingan Zhao (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China)2026-03-13🤖 cs.LG

AutoScout: Structured Optimization for Automating ML System Configuration

AutoScout 提出了一种面向机器学习系统配置（涵盖训练、微调及推理）的通用优化框架，通过混合离散/连续优化与分层依赖建模，结合自适应特征优先级排序及多保真度模拟器集成，在显著降低配置搜索成本的同时实现了比专家调优快 2.7 至 3.0 倍的训练加速。

Jimmy Shong, Yuhan Ding, Yihan Jiang, Liheng Jing, Haonan Chen, Gaokai Zhang, Aditya Akella, Fan Lai2026-03-13🤖 cs.LG

Fractional Rotation, Full Potential? Investigating Performance and Convergence of Partial RoPE

该论文系统研究了部分旋转位置编码（Partial RoPE）对 Transformer 模型训练动态和收敛性的影响，发现仅需对约 10% 的隐藏维度应用 RoPE 即可在保持与全量 RoPE 相当性能的同时实现高达 10 倍的显存节省，并为平衡效率与训练稳定性提供了实用指导。

Mohammad Aflah Khan, Krishna P. Gummadi, Manish Gupta, Abhilasha Ravichander2026-03-13🤖 cs.LG

Shape-of-You: Fused Gromov-Wasserstein Optimal Transport for Semantic Correspondence in-the-Wild

本文提出了名为"Shape-of-You"的新框架，通过结合 3D 基础模型与锚点线性化的融合 Gromov-Wasserstein 最优传输方法，在无需显式几何标注的情况下解决了语义对应中的几何歧义问题，并在 SPair-71k 和 AP-10k 数据集上取得了最先进性能。

Jiin Im, Sisung Liu, Je Hyeong Hong2026-03-13🤖 cs.LG

Personalized Federated Learning via Gaussian Generative Modeling

本文提出了基于高斯生成建模的个性化联邦学习方法 pFedGM，通过解耦特征提取与分类器、利用加权重采样建模客户端异质性，并引入受卡尔曼增益启发的双尺度融合框架，在兼顾全局协作与局部个性化的同时实现了优越的泛化性能。

Peng Hu, Jianwei Ma2026-03-13🤖 cs.LG

Simple Recipe Works: Vision-Language-Action Models are Natural Continual Learners with Reinforcement Learning

该论文通过系统性研究揭示，对于大型预训练视觉 - 语言 - 动作（VLA）模型而言，结合低秩适应（LoRA）的简单序列微调策略在持续强化学习中表现卓越，不仅能有效避免灾难性遗忘并保留零样本泛化能力，其效果甚至优于复杂的持续学习方法。

Jiaheng Hu, Jay Shim, Chen Tang, Yoonchang Sung, Bo Liu, Peter Stone, Roberto Martin-Martin2026-03-13🤖 cs.LG

Context-dependent manifold learning: A neuromodulated constrained autoencoder approach

本文提出了一种名为神经调节约束自编码器（NcAE）的新方法，通过引入神经调节机制动态调整几何约束参数，成功实现了在多变环境条件下解耦全局上下文与局部流形表示的自适应降维学习。

Jérôme Adriaens (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Guillaume Drion (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Pierre Sacré (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège)2026-03-13🤖 cs.LG

Entropy-Preserving Reinforcement Learning

该论文指出传统策略梯度算法在训练过程中会自然降低熵值从而限制探索多样性，因此提出通过 REPO 和 ADAPO 等显式熵控制机制来维持策略的多样性，从而提升模型性能并增强其在后续环境中的持续学习能力。

Aleksei Petrenko, Ben Lipkin, Kevin Chen, Erik Wijmans, Marco Cusumano-Towner, Raja Giryes, Philipp Krähenbühl2026-03-13🤖 cs.LG

Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2

本文提出了一种名为“因果韵律中介”的新型文本转语音框架，通过结合结构因果模型与反事实训练目标，在 FastSpeech2 架构中成功解耦了情感与语言内容，实现了可解释且可控的情感韵律编辑，显著提升了合成语音的情感表现力与跨说话人一致性。

Suvendu Sekhar Mohanty2026-03-13🤖 cs.AI

Decomposing Observational Multiplicity in Decision Trees: Leaf and Structural Regret

本文针对决策树模型中因标签随机性导致的观测多重性，提出了叶节点遗憾与结构遗憾两种互补度量并建立理论分解框架，实验表明结构遗憾是多重性的主要驱动因素，且利用该度量进行选择性预测可显著提升模型安全性。

Mustafa Cavus2026-03-13📊 stat

EvoFlows: Evolutionary Edit-Based Flow-Matching for Protein Engineering

本文提出了 EvoFlows，一种基于进化编辑流匹配的变长序列到序列蛋白质建模方法，它通过控制插入、删除和替换操作来预测突变及其位置，在保持与主流掩码语言模型相当的序列分布建模质量的同时，展现出从模板蛋白生成非平凡且自然类突变体的更优能力。

Nicolas Deutschmann, Constance Ferragu, Jonathan D. Ziegler, Shayan Aziznejad, Eli Bixby2026-03-13🤖 cs.LG

Cross-Resolution Attention Network for High-Resolution PM2.5 Prediction

该论文提出了 CRAN-PM 模型，这是一种利用跨分辨率注意力机制高效融合全球气象数据与局部高分辨率 PM2.5 信息的视觉 Transformer，能够在单张 GPU 上快速生成全欧洲 1 公里分辨率的 PM2.5 预测图，并显著提升了预测精度及复杂地形下的偏差表现。

Ammar Kheder, Helmi Toropainen, Wenqing Peng, Samuel Antão, Zhi-Song Liu, Michael Boy2026-03-13🤖 cs.LG

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

本文提出了 CINDI 框架，这是一种基于条件归一化流的无监督概率方法，通过统一异常检测与插补任务，有效恢复了受噪声和异常值破坏的电力网格等多变量时间序列数据的完整性。

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI

Mitigating the Multiplicity Burden: The Role of Calibration in Reducing Predictive Multiplicity of Classifiers

本文基于九个信贷风险基准数据集的实证分析表明，后验校准（特别是 Platt 缩放和等温回归）能有效降低分类器在 Rashomon 集合内的预测多重性，从而缓解算法任意性并提升程序公平性。

Mustafa Cavus2026-03-13🤖 cs.LG

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

该论文提出了一种基于条件归一化流的异常检测方法，通过在潜在空间引入显式归纳偏置并约束其遵循预设的时间动态，将异常检测转化为对潜在轨迹分布的统计一致性检验，从而有效解决了传统基于观测空间似然的方法难以识别违背时序结构异常的问题。

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

本文提出了一种基于自由能的社会多臂老虎机学习算法，使智能体能够在无需奖励信息或先验规范的情况下，自主评估并有效利用非专家及多样化同伴的行为策略，从而在保持对数遗憾的同时显著提升个体学习性能。

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat