cs.LG 篇论文 | Gist.Science

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

本文提出了涵盖多场景的 MSKernelBench 基准测试及多智能体硬件感知系统 CUDAMaster，旨在突破现有 LLM 仅优化机器学习算子的局限，实现了在科学计算等广泛领域内媲美甚至超越 cuBLAS 等闭源库的 CUDA 内核自动化优化。

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

该论文提出了一种名为“塑造参数贡献模式”（SPCP）的方法，通过训练期间动态抑制过高的参数贡献，促使分类器学习更密集的边界导向型参数依赖模式，从而有效缓解深度模型因过度依赖少数主导参数而导致的分布外（OOD）检测过自信问题。

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

本文提出了一种双图时空图神经网络代理模型，通过耦合节点级运动学与单元级历史相关变量的双分支结构，高效且准确地预测了变加载位置下钢筋混凝土梁在四点弯曲工况下的非线性时程响应。

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

本文提出了名为 wDPO 的鲁棒大语言模型对齐方法，通过利用 DPO 训练中的隐式边际信号实施分层干预策略（针对硬噪声进行数据级稀疏修正，针对模糊比较进行梯度级软截断），从而有效区分并处理不同类型的偏好噪声，显著提升了模型在含噪数据下的对齐质量与鲁棒性。

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

该研究提出了一种基于 SonicGuard 可穿戴传感器和 Audio Spectrogram Transformer 模型的自动化肠音分割与分类系统，通过为健康人和患者分别训练专用模型，实现了高精度的肠音模式识别，显著减少了人工标注时间并为胃肠道功能提供了客观的定量评估工具。

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

该论文证明了在任意度量空间中，只要间隔足够大（ $R>3r$ ），基于间隔的学习即可仅依赖三角不等式实现，并揭示了此类学习存在一个通用常数阈值，同时否定了其总能通过嵌入线性空间来解释的观点，进而建立了巴拿赫空间的可学习性分类及其样本复杂度与间隔参数的多项式关系。

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

该论文通过构建高质量思维链蒸馏数据集 ODA-Fin-SFT-318k 和难例可验证强化学习数据集 ODA-Fin-RL-12k，证明了在金融垂直领域，数据的质量与难度分布对模型性能起决定性作用，并据此训练出的 ODA-Fin-RL-8B 模型在多项基准测试中超越了同规模开源金融大模型。

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

LightMedSeg 提出了一种结合解剖先验与自适应上下文建模的模块化轻量级 3D 医学图像分割架构，通过引入锚点条件特征调制、局部结构先验及计算优化策略，在仅消耗极低参数量和计算量的情况下实现了与重型 Transformer 基线模型相当的分割精度。

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

该论文提出了一种基于深度条件变换模型（DCTM）和交叉拟合的改进型条件秩 - 秩回归方法，通过估计协变量调整后的条件秩来有效解决非线性、高阶交互及离散有序结果下的代际流动性测量难题，并建立了相应的渐近理论，在模拟与实证研究中均展现出优于传统方法的准确性与解释力。

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

该论文提出了 PT-RAG 框架，通过引入一种结合 GenePT 嵌入与 Gumbel-Softmax 采样的两阶段可微检索机制，实现了细胞类型感知的上下文检索，从而显著提升了基因扰动下细胞反应预测的准确性，并证明了在该领域可微检索对于避免性能下降至关重要。

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

该论文提出了名为 WeDas 的框架，通过引入查询 - 结果对齐评分和少样本探测机制，使智能体能够感知并适应网络内容的分布结构，从而有效弥合了深度推理与底层检索之间的差距，显著提升了多基准测试中的子目标完成度与准确性。

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

该研究针对肺癌幸存者二次原发癌症预测中本地数据受限及多源数据融合难题，提出了一种利用外部 SEER 数据并通过损失融合机制解决特征异构与隐私保护问题的水平联邦学习框架（LF2L），显著提升了模型的预测性能。

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

该论文提出了两种互补的符号预测器（SyNF 和 SyTF），能够从混沌时间序列数据中学习显式且可解释的代数方程，在保持与深度学习相当的短期预测精度的同时，克服了黑盒模型缺乏科学洞察力的局限。

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Margin in Abstract Spaces

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

Fast and Flexible Audio Bandwidth Extension via Vocos

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models