cs.LG 篇论文 | Gist.Science

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

本文提出了名为 OptEMA 的自适应指数移动平均优化器及其两个变体，通过引入闭环、无需 Lipschitz 常数的机制，在标准随机梯度下降假设下实现了噪声自适应的收敛率，并在零噪声情形下无需手动调整超参数即可达到近乎最优的确定性收敛速度。

Ganzhao YuanWed, 11 Ma🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

该论文从谱分析和变分视角揭示了生成漂移与得分匹配之间的本质联系，通过线性化麦基恩 - 弗拉索夫动力学和形式化最优传输梯度流，不仅解释了高斯核的频域瓶颈并提出了指数带宽退火策略，还从理论层面证明了停止梯度算子在训练稳定性中的必要性。

Erkan Turan, Maks OvsjanikovWed, 11 Ma🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

本文提出了名为 SignalMC-MED 的多模态基准，利用包含 22,256 次就诊的同步单导联 ECG 和 PPG 数据评估生物信号基础模型，发现领域专用模型优于通用模型、多模态融合优于单模态输入，并揭示了长信号段、小模型及手工特征在特定场景下的优势。

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. CliftonWed, 11 Ma🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

该论文提出利用过拟合 - 欠拟合指示器（OUI）作为早期信号，通过分析 PPO 中隐藏神经元的激活模式变化来区分学习率设置，从而在训练初期高效筛选出最优策略并避免全量训练。

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-OrtíWed, 11 Ma🤖 cs.AI

Towards a Neural Debugger for Python

该论文提出了“神经调试器”这一新概念，通过微调大语言模型或从头预训练小模型，使其能够像传统调试器一样支持断点设置和步进操作，从而实现对 Python 程序正向执行预测与逆向状态推断的可靠建模，为构建具备模拟调试能力的智能体编程系统奠定了基础。

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

该论文通过引入具有层可组合性的均值归一化算子范数，将 AdamW 和 Muon 等优化器统一为矩阵算子范数下的最速下降法，从而提出了能实现宽度无关平滑度保证及跨宽度超参数迁移的 MOGA 优化器，并在 GPT-2 和 LLaMA 的大规模预训练中展现出比 Muon 更优的效率与稳定性。

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

该论文提出了 C2FMAE，一种通过语义、实例和像素三级粒度协同学习及渐进式掩码策略来解决自监督视觉预训练中全局语义与局部细节矛盾的新型分层掩码自编码器，并在大规模多粒度数据集上验证了其在多种视觉任务中的卓越性能。

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin ChenWed, 11 Ma🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

该论文通过新颖的道德权衡数据集发现，与人类不同，推理过程能显著提升大语言模型的诚实度，其根本原因在于欺骗性回答在表征空间中处于亚稳态，而推理生成的思维链通过遍历该空间将模型推向更稳定的诚实默认状态。

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja FilippovaWed, 11 Ma🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

该论文通过引入“词袋超叠加”（BOWS）实验环境，揭示了在真实数据中特征相关性可使干扰变为建设性，从而促使模型将特征按共激活模式排列以形成语义聚类和循环结构，弥补了传统超叠加理论仅关注稀疏无相关特征的不足。

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. MedianoWed, 11 Ma🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

该论文提出了任务感知调制与表示学习（TAM-RL）框架，通过结合时空表示学习、知识引导的编解码架构以及基于碳平衡方程的损失函数，有效克服了现有数据驱动方法在泛化性和区域偏差上的局限，显著提升了全球陆地碳通量上推的精度与鲁棒性。

Aleksei Rozanov, Arvind Renganathan, Vipin KumarWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

本文提出了两种基于神经网络和在线学习的变化点检测方法，它们具有线性计算复杂度，在合成及真实数据集上的实验表明其性能优于现有方法，并证明了算法的收敛性及其在特定条件下优于离线方法的优势。

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

本文提出了一种结合群智能优化算法的白盒支持向量机框架，通过分析主轴振动特征并利用递归特征消除进行筛选，实现了对铣刀磨损及断裂等故障的实时监测与状态评估。

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. PatangeTue, 10 Ma🤖 cs.LG

cs.LG

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Towards a Neural Debugger for Python

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Think Before You Lie: How Reasoning Improves Honesty

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Online Neural Networks for Change-Point Detection

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Automated Reinforcement Learning: An Overview

Explainable classification of astronomical uncertain time series

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks