cs.LG 篇论文 | Gist.Science

Proposing a Framework for Machine Learning Adoption on Legacy Systems

本文提出了一种基于 API 的实用框架，通过将机器学习生命周期与生产环境解耦，使企业无需升级遗留系统或停机即可安全、低成本地部署模型，从而赋能领域专家并提升制造竞争力。

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

本文提出了 SMoPE 框架，通过将共享提示组织为稀疏混合专家（MoE）架构，利用动态专家选择、自适应噪声机制及基于原型的损失函数，在显著降低计算与存储成本的同时，有效解决了提示式持续学习中任务特定提示开销大与共享提示干扰严重的权衡问题，实现了性能与效率的双重提升。

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

RADAR 是一种受心理测量学启发的轻量级可解释路由框架，它通过学习查询难度与模型能力之间的响应模型，动态将高难度查询分配给高能力配置，从而在多个推理基准测试中实现了优于现有方法的性能与成本平衡。

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

本文提出了名为 Composer 的模块化混合神经网络架构搜索框架，通过在小规模上探索并借助扩展策略将最优架构放大，成功发现了在 350M 至 3B 参数规模下性能超越 Llama 3.2、显著提升下游任务准确率并优化训练与推理效率的新型混合大语言模型架构。

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

本文提出了 MIG-Vis 方法，通过结合变分自编码器与互信息引导的扩散模型，从灵长类颞下皮层神经群体中成功识别并可视化了具有清晰语义选择性（如物体姿态、类别间变换及类内内容）的结构化潜在子空间，从而直接揭示了高级视觉皮层中特征信息的组织原则。

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

该研究表明，在解决多智能体协作问题时，简单的通信协议比课程学习更为可靠，因为后者若设计不当（如强调背叛均衡）可能引发“习得性悲观”，从而削弱智能体的协作能力。

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

本文首次系统评估了自监督学习在可穿戴 EEG 睡眠分期中的应用，提出了一种专用流程，证明其仅需 5% 至 10% 的标注数据即可实现超过 80% 的临床级准确率，显著优于监督基线及通用 EEG 基础模型。

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

该研究基于 2018 至 2025 年 42 个经济体的数据，揭示了地缘政治冲击通过直接渠道重定价主权违约风险，而地缘经济冲击则通过货币政策预期和全球金融周期传导，两者形成“剪刀差”模式，并据此提出流动性供给可缓解金融周期传导的利差扩大，但无法消除地缘政治风险溢价中的持久成分。

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

本文提出了一种名为 HyWA 的新方法，利用超网络为语音活动检测（VAD）模型中的特定层生成个性化权重，从而在保持架构统一的同时，显著提升了个性化语音活动检测（PVAD）的平均精度并优化了部署效率。

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

该论文提出了一种名为“揭示 - 修订”的可解释性偏差感知生成框架，通过融合跨模态注意力、Grad-CAM++ 归因及迭代反馈机制，在多个基准测试中实现了超越现有基线的生成质量、鲁棒性及公平性。

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

该论文提出了一种新颖的绝对聚类指标，通过定义簇的紧致性函数和簇间邻域点集来量化簇的紧致性与可分性，从而有效确定数据中的真实簇数量，并在多种数据集上验证了其优于传统相对指标的性能。

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

该论文提出了一种基于数据协方差矩阵和目标函数多项式分解的“厄米特征结构假设”（HEA）理论框架，能够仅利用原始数据统计量准确预测真实数据集上的核回归学习曲线，并发现多层感知机在特征学习阶段也遵循该假设所预测的厄米多项式学习顺序。

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

该论文通过基于几何的统一分析，证明了在存在唯一且单链最优策略的假设下，价值迭代算法在折扣奖励和平均奖励两种设定下均具有比现有理论更优的几何收敛速度，从而解释了其实际表现优于传统理论预测的现象。

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

本文提出了 KVTC，一种基于主成分分析、自适应量化和熵编码的轻量级变换编码方法，能够在保持大语言模型推理精度和长上下文能力的同时，实现高达 20 倍（特定场景下 40 倍以上）的 KV 缓存压缩，从而显著降低显存占用并支持缓存复用。

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

该论文针对能源市场中连续发生的机制转换及现有方法缺乏因果解释的局限，提出了一种结合神经因果发现与多变量时序数据的增强型时间序列因果模型（ATSCM），旨在通过可解释的因子和动态因果图实现对电价形成机制的深入理解及反事实推理。

Dennis Thumm2026-03-12📊 stat

Towards Causal Market Simulators

本文提出了一种结合变分自编码器与结构因果模型的时序神经因果模型（TNCM-VAE），通过引入有向无环图约束和因果 Wasserstein 距离，成功生成了既保留时间依赖性又符合因果机制的金融合成数据，从而显著提升了反事实概率估计的准确性并支持更可靠的金融压力测试与情景分析。

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

本文提出了一种结合图神经网络与 Transformer 的 DGET 多任务学习框架，以解决混合射频 - 光通信物联网网络中在部分信道观测和能量约束下 NP 难的双技术调度问题，实现了近最优的吞吐量与年龄信息（AoI）联合优化。

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

本文提出了 STREAM-VAE 模型，通过双路径编码器分离车辆遥测数据中的慢速漂移与快速尖峰动态，从而在多种工况下实现比现有基线方法更鲁棒的异常检测。

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

本文提出了一种针对医疗数据隐私风险的层次化双策略遗忘框架，通过几何约束梯度更新与概念感知令牌级干预相结合，在仅修改 0.1% 参数的情况下实现了 82.7% 的遗忘率与 88.5% 的知识保留，有效平衡了敏感信息移除与基础医疗能力保持的需求。

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

本文提出了 CostNav，这是首个结合行业标准监管与财务数据及物理仿真的经济导航基准，通过量化分析揭示现有导航方法在真实商业部署中均无法实现经济可行性，从而挑战社区开发以经济成本为核心指标的导航策略。

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI