cs.LG 篇论文 | Gist.Science

Inverse Neural Operator for ODE Parameter Optimization

本文提出了逆神经算子（INO）框架，通过结合条件傅里叶神经算子重构轨迹与摊销漂移模型在参数空间进行无梯度优化，实现了从稀疏观测中高效、准确地反演常微分方程参数，在保持高精度的同时将推理速度提升了 487 倍。

Zhi-Song Liu, Wenqing Peng, Helmi Toropainen, Ammar Kheder, Andreas Rupp, Holger Froning, Xiaojie Lin, Michael Boy2026-03-13🤖 cs.LG

Multi-Station WiFi CSI Sensing Framework Robust to Station-wise Feature Missingness and Limited Labeled Data

该论文提出了一种面向多站部署的 WiFi 信道状态信息（CSI）感知框架，通过结合跨模态自监督预训练以学习对站点特征缺失具有不变性的表征，并引入站点级掩码增强策略，有效解决了实际应用中站点特征缺失与标注数据稀缺的双重挑战。

Keita Kayano, Takayuki Nishio, Daiki Yoda, Yuta Hirai, Tomoko Adachi2026-03-13🤖 cs.LG

On the Role of Reversible Instance Normalization

该论文通过识别时间序列预测中的三大分布偏移挑战，利用消融研究揭示可逆实例归一化（RevIN）中部分组件的冗余或负面影响，从而提出了提升其鲁棒性与泛化能力的新视角。

Gaspard Berthelier, Tahar Nabil, Etienne Le Naour, Richard Niamke, Samir Perlaza, Giovanni Neglia2026-03-13🤖 cs.LG

FlexRec: Adapting LLM-based Recommenders for Flexible Needs via Reinforcement Learning

FlexRec 是一种基于强化学习的后训练框架，通过引入基于反事实交换的因果项级奖励和不确定性感知的批评引导缩放机制，有效解决了大语言模型推荐系统在序列奖励稀疏噪声下的训练难题，从而实现了针对动态需求的灵活适应与显著性能提升。

Yijun Pan, Weikang Qiu, Qiyao Ma, Mingxuan Ju, Tong Zhao, Neil Shah, Rex Ying2026-03-13🤖 cs.LG

Causal Representation Learning with Optimal Compression under Complex Treatments

该论文针对多治疗场景下的个体治疗效应估计难题，提出了一种基于最优压缩的因果表示学习框架，通过推导新的泛化界确定最优平衡权重，并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM，在显著降低计算复杂度的同时实现了高精度的估计效果。

Wanting Liang, Haoang Chi, Zhiheng Zhang2026-03-13📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本文提出了 EnTransformer，一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架，通过引入随机噪声并优化基于能量的评分目标，在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测，并在多个基准数据集上展现出优于现有模型的校准性能。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Chem4DLLM: 4D Multimodal LLMs for Chemical Dynamics Understanding

该论文针对现有化学理解任务局限于静态分子表征的不足，提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解（ChemDU）”新任务，并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM，以推动动态化学理解与多模态科学推理的研究。

Xinyu Li, Zhen Zhang, Qi Chen, Anton van den Hengel, Lina Yao, Javen Qinfeng Shi2026-03-13💬 cs.CL

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA，旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战，实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

该论文提出了 ProtoSR 方法，通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库，进而指导结构化报告生成模型进行预测修正，从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Exhaustive Circuit Mapping of a Single-Cell Foundation Model Reveals Massive Redundancy, Heavy-Tailed Hub Architecture, and Layer-Dependent Differentiation Control

该研究通过对 Geneformer 单细胞基础模型进行全电路映射、高阶组合消融和因果轨迹引导实验，揭示了其内部存在严重的特征冗余、重尾枢纽架构以及未注释的生物学偏差，并证实了模型层位置对细胞分化方向具有因果控制作用。

Ihor Kendiukhov2026-03-13🤖 cs.LG

Causal Matrix Completion under Multiple Treatments via Mixed Synthetic Nearest Neighbors

本文针对多处理设置下合成最近邻（SNN）方法因各处理组数据不足而失效的问题，提出了混合合成最近邻（MSNN）估计量，通过跨处理组整合信息，在保持有限样本误差界和渐近正态性保证的同时显著提升了数据稀缺场景下的因果矩阵补全效果。

Minrui Luo, Zhiheng Zhang2026-03-13🤖 cs.LG

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

该论文提出了一种名为有效电阻重连（ERR）的无参数拓扑修正策略，通过利用有效电阻这一全局指标识别并优化结构瓶颈，在缓解图神经网络过挤压问题的同时，揭示了其与过平滑之间的权衡关系，并证明结合归一化技术可进一步提升模型性能。

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

该论文提出将沃罗诺伊镶嵌引入概率电路以捕捉数据局部几何结构，并通过构建近似推断框架与特定结构条件来解决由此引发的可处理性难题，同时设计了可微松弛方法以支持梯度学习。

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Learning Transferable Sensor Models via Language-Informed Pretraining

本文提出了名为 SLIP 的开源框架，通过结合对比对齐与传感器条件化描述生成，利用预训练语言模型实现了跨不同传感器配置的语言对齐表征学习，在零样本迁移、信号描述及问答任务中显著优于现有基线方法。

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

本文提出了局部邻接谱嵌入（LASE）方法，通过加权谱分解揭示网络中的局部低维结构，在理论上证明了其能平衡局部化统计成本与截断误差，并在实验中展示了其在局部重建、可视化及构建高保真全局视图方面的优越性。

Hannah Sansford, Nick Whiteley, Patrick Rubin-Delanchy2026-03-13📊 stat

Statistical and structural identifiability in representation learning

该论文将表示学习的稳定性形式化为统计与结构可辨识性，提出了模型无关的 $\epsilon$ -近可辨识性定义，证明了非线性解码器模型中间表示的统计近可辨识性，并验证了通过独立成分分析（ICA）后处理可有效实现解耦，从而在合成数据及细胞显微基础模型上显著提升了下游泛化能力。

Walter Nelson, Marco Fumero, Theofanis Karaletsos, Francesco Locatello2026-03-13🤖 cs.LG

Topological DeepONets and a generalization of the Chen-Chen operator approximation theorem

本文通过将输入空间从紧集上的连续函数推广到任意豪斯多夫局部凸空间，利用对偶空间中的连续线性泛函构建拓扑分支 - 主干网络，证明了连续算子在该框架下仍可被拓扑 DeepONets 一致逼近，从而将经典的 Chen-Chen 算子逼近定理推广至更广泛的拓扑空间设置中。

Vugar Ismailov2026-03-13🤖 cs.LG

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

本文首次建立了多轮次预条件随机梯度下降（PSGD）的平均算法稳定性理论，揭示了人口风险曲率、噪声几何与预条件策略之间的权衡关系，并证明了不当的预条件选择会导致基于有效维度的泛化与优化性能次优。

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick Rebeschini2026-03-13📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

本文提出了 BTZSC 基准，通过涵盖 22 个数据集对跨编码器、嵌入模型、重排序器及大语言模型进行了系统的零样本文本分类评估，发现现代重排序器性能最佳，而传统 NLI 跨编码器则表现停滞。

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

该论文提出了一种名为 FedFew 的个性化联邦学习算法，通过将问题重构为“少数模型服务多数客户端”的优化框架，仅需维护少量共享服务器模型即可在无需人工聚类或精细调参的情况下，自动实现接近最优的个性化效果并显著提升可扩展性。

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI