cs.LG 篇论文 | Gist.Science

Warm Starting State-Space Models with Automata Learning

该论文证明了 Moore 机可精确实现为状态空间模型，并发现虽然纯数据驱动的状态空间模型在恢复符号结构时效率低下，但通过利用自动机学习进行符号化初始化，可显著提升模型在复杂系统中的训练速度与最终精度。

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

该论文通过建立基于主纤维丛的几何框架，揭示了随机点积图中学习网络演化微分方程所面临的规范自由度、可实现性约束及轨迹恢复伪影等根本障碍，证明了动力学结构可解决规范模糊性，并阐明了谱隙如何同时控制几何曲率与统计推断难度。

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

该论文指出，人工智能在地球系统科学中的快速应用若缺乏干预，将因算力与数据基础设施的全球南北差异而加剧气候信息领域的不平等，因此呼吁通过转向以数据为中心的开发模式、建立气候数字公共基础设施以及推动知识共同生产，来确保 AI 革命真正促进全球系统韧性而非加剧不公。

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

该研究提出了一种利用无监督域适应（UDA）技术，通过最小化最大均值差异（MMD）将基于合成数据训练的伽马能谱放射性核素识别模型成功适配到真实实验环境的方法，显著提升了模型在未知目标域上的泛化性能。

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

该论文通过引入更贴近实际的胜率指标重新审视 Best-of-N（BoN）采样，证明在最小假设下其具有统计最优性，并提出一种能消除奖励黑客攻击且保持最优性能的改进变体。

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

Full Dynamic Range Sky-Modelling For Image Based Lighting

本文提出了名为 Icarus 的全天气天空模型，该模型能够学习全动态范围（FDR）物理捕获的户外图像曝光范围，通过条件生成支持用户控制太阳与云层位置及纹理，从而在基于图像的照明（IBL）中实现超越现有深度学习方法的高精度、高保真度且光照方向准确的自然天空模拟。

Ian J. Maquignaz2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

本文提出了 MIRACL，一种结合结构化子问题分解与基于帕累托适应策略的分层元多目标强化学习框架，旨在解决多目标多级组合供应链优化中动态环境下的任务重训与高计算成本问题，并实现了显著的泛化性能提升。

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

本文提出了分数引导的近端投影（SGPP）框架，通过构建平衡保真度与真实性的能量景观，将整流流（RF）模型的编辑任务统一为具有几何收敛保证的近端优化问题，从而在无需训练的情况下实现了从严格身份保持到生成自由度的连续可控调节，并涵盖了现有主流方法。

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

本文介绍了 TML-Bench，这是一个针对 Kaggle 风格表格机器学习任务的自主数据科学智能体基准，通过评估 10 个开源大语言模型在不同时间预算下的端到端表现，发现 MiniMax-M2.1 模型综合性能最佳且性能随时间预算增加而提升。

Mykola Pinchuk2026-03-09🤖 cs.AI

Bridging Domains through Subspace-Aware Model Merging

该论文提出了一种名为 SCORE 的新方法，通过计算各模型主奇异向量的共享正交基并剪枝冲突分量，有效解决了多领域微调模型合并时的子空间冲突问题，从而显著提升了模型在未见领域上的泛化性能。

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

该论文提出了“解耦安全假设”（DSH），通过几何分析揭示大语言模型中“识别有害性”与“执行拒绝”机制在深层解耦的现象，并据此开发了能实现“只知不行”状态的双差分提取与自适应因果引导方法，进而提出了具有 SOTA 攻击成功率的“拒绝擦除攻击”（REA）。

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

本文提出了一种面向分布式随机约束极小极大优化的首阶 Softmax 加权切换梯度方法，通过单循环原变量机制在放宽假设下实现了更紧的超参数下界与高概率收敛保证，有效解决了传统方法中的超参数敏感与震荡问题，并在公平分类等任务中验证了其优越性。

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

该论文指出传统评估指标因缺乏时间敏感性而严重误判多智能体协作质量，通过引入“完美轮替”参考系及六种新型轮替指标，揭示了在“前任之战”变体中即使传统公平性指标很高，Q 学习智能体的实际协作表现仍可能远低于随机基线，从而强调了在分析多智能体动态时采用时间感知观测量的必要性。

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

Sparse Crosscoders for diffing MoEs and Dense models

该研究利用交叉编码器（Crosscoders）对参数量相等的混合专家（MoE）模型与稠密模型进行对比分析，发现 MoE 模型倾向于学习更少但激活密度更高、更专业化的特征，而稠密模型则表现出更广泛、通用的特征分布。

Marmik Chaudhari, Nishkal Hundia, Idhant Gulati2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

该论文通过对 DeepSeekMoE 模型的系统性分析，揭示了混合专家模型（MoE）中专家知识的高度集中特性，即少数专家主导了大部分路由决策且单专家输出能高度近似全模型预测，从而为通过针对性剪枝优化推理效率提供了理论依据。

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

本文提出了名为 MaCS 的架构无关正则化框架，通过联合优化逻辑空间中的分类间隔与局部预测一致性，在无需额外数据或架构改动的情况下，显著提升了视觉模型的校准度、鲁棒性及泛化能力。

Salim Khazem2026-03-09🤖 cs.AI

Self-Auditing Parameter-Efficient Fine-Tuning for Few-Shot 3D Medical Image Segmentation

该论文提出了一种名为 SEA-PEFT 的自审计参数高效微调方法，通过在线搜索、评估与分配适配器的自动化循环，在极少样本条件下显著提升了 3D 医学图像分割的 Dice 指标，同时解决了临床领域缺乏专业 AI 工程师进行手动调优的难题。

Son Thai Ly, Hien V. Nguyen2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

该论文通过实证研究揭示了多示例提示（Many-Shot Prompting）在结构化任务中的有效性及其对示例选择策略的高度敏感性，同时指出了其在开放生成任务中的局限性，并对比分析了动态与强化 ICL 等替代策略，从而界定了输入空间测试时适应的实际边界与适用场景。

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

ReflexiCoder 提出了一种基于强化学习的框架，通过将生成、反思与自修正的完整轨迹内化至模型权重中，使大语言模型能够在无需外部反馈或执行引擎的情况下实现自主代码调试，从而在多项基准测试中达到甚至超越 GPT-5.1 的性能，同时显著降低了推理计算开销。

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

Stochastic Event Prediction via Temporal Motif Transitions

本文提出了名为 STEP 的随机事件预测框架，通过将时序链接预测重构为连续时间下的序列预测问题，利用泊松过程建模离散时序模式转换，从而在无需修改现有架构的情况下显著提升了事件预测精度并降低了运行时间。

\.Ibrahim Bahadır Altun, Ahmet Erdem Sarıyüce2026-03-09🤖 cs.LG