cs.LG 篇论文 | Gist.Science

Adaptive Active Learning for Regression via Reinforcement Learning

本文提出了一种名为加权改进贪婪采样（WiGS）的新方法，通过强化学习动态调整探索与利用的平衡，从而在回归主动学习中克服了传统静态乘积规则的局限性，显著提升了在数据分布不规则场景下的采样效率与预测精度。

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick2026-03-12📊 stat

GGMPs: Generalized Gaussian Mixture Processes

本文提出了一种名为广义高斯混合过程（GGMP）的新方法，通过结合局部高斯混合拟合、跨输入分量对齐及分量异方差高斯过程训练，在保持计算可行性的同时实现了针对多模态、异方差及强非高斯数据的条件密度估计。

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. Noack2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

该论文指出大语言模型低比特训练中的数值不稳定性主要由秩一均值偏差驱动，并提出通过简单的均值减法消除该偏差，从而在无需复杂 SVD 分解的情况下显著提升了 FP4 量化训练的稳定性与性能。

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models

该论文提出了一种基于代理的无提示实例遗忘方法，利用图像编辑、时间步感知加权和梯度手术技术，使扩散模型能够精准遗忘无法通过文本提示指定的特定实例（如人脸或文化误读），同时保持模型其余功能的完整性。

Kyungryeol Lee, Kyeonghyun Lee, Seongmin Hong, Byung Hyun Lee, Se Young Chun2026-03-12🤖 cs.LG

Brenier Isotonic Regression

该论文提出了一种名为“布伦尼尔等距回归”的新型多输出回归方法，它利用最优传输理论将循环单调性约束转化为凸势函数优化问题，从而在概率校准等任务中展现出优于现有基线的性能。

Han Bao, Amirreza Eshraghi, Yutong Wang2026-03-12📊 stat

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

该研究提出了一种多分辨率 ConvLSTM 集成框架，通过融合不同时间尺度的输入数据，有效缓解了误差累积问题，显著提升了基坑开挖过程中挡土墙变形的长时序预测精度与稳定性。

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG

Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

该论文通过建立基于 Vlasov-Poisson 系统的动力学场论框架推导了强流带电粒子束的朗缪尔波色散关系，并利用 Prometheus 无监督学习模型验证了等离子体频率、异常束展宽及弗里德尔振荡等集体振荡特征。

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

该研究提出了一种将肌肉协同先验嵌入强化学习的生理信息框架，通过低维协同基约束控制，显著提升了预测性肌骨步态模拟在不同速度、坡度和地形下的生物力学保真度与泛化能力。

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

该论文研究了过参数化线性模型中双空间预条件梯度下降（涵盖归一化梯度下降、梯度裁剪和 Adam 等优化器）的收敛性，证明了其迭代序列总能收敛至完美拟合数据的解，并揭示了各向同性预条件器下的隐式偏差特性及其与标准梯度下降解的等价关系。

Reza Ghane, Danil Akhtiamov, Babak Hassibi2026-03-12📊 stat

JEDI: Jointly Embedded Inference of Neural Dynamics

本文提出了名为 JEDI 的层次化模型，该模型通过在循环神经网络权重上学习共享嵌入空间，实现了从有限且嘈杂的神经记录中跨任务、跨情境地联合推断和统一建模神经动力学，从而成功揭示了大脑灵活性的潜在机制。

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality

本文提出了一种基于最近邻距离比率的通用内在维度估计器，该方法不仅计算简单且无需分布假设，还从理论上证明了其收敛性，并在基准流形和真实数据集上取得了最先进的性能。

Eng-Jon Ong, Omer Bobrowski, Gesine Reinert, Primoz Skraba2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

本文提出了 VERI-DPO 框架，通过利用声明验证器从检索增强证据中挖掘偏好数据并结合直接偏好优化（DPO）技术，显著提升了临床摘要的忠实度，将不支持的声明率从 10.7% 大幅降低至 1.9%。

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

A New Tensor Network: Tubal Tensor Train and Its Applications

本文提出了一种结合 t-积代数与张量列车低阶核心结构的新型张量网络分解——管状张量列车（TTT），并介绍了其两种计算策略、误差界以及在图像和视频压缩、张量补全和高光谱成像等任务中的实际应用。

Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki2026-03-12🔢 math

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

该论文提出了一种将图注意力自编码器与大型语言模型（GPT-4o-mini）相结合的轻量级混合框架，通过利用结构推理对 LLM 生成数据进行去噪并优化蒙特卡洛树搜索，在资源受限条件下实现了在亚马逊棋游戏中超越基线及教师模型的高性能决策。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

该论文提出了名为 IH-Challenge 的强化学习训练数据集，旨在解决大语言模型指令层级冲突的鲁棒性难题，通过微调显著提升了模型在对抗攻击下的安全性与指令遵循能力，并开源了该数据集以推动相关研究。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

cs.LG