cs.LG 篇论文 | Gist.Science

Causal Representation Learning with Optimal Compression under Complex Treatments

该论文针对多治疗场景下的个体治疗效应估计难题，提出了一种基于最优压缩的因果表示学习框架，通过推导新的泛化界确定最优平衡权重，并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM，在显著降低计算复杂度的同时实现了高精度的估计效果。

Wanting Liang, Haoang Chi, Zhiheng Zhang2026-03-13📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本文提出了 EnTransformer，一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架，通过引入随机噪声并优化基于能量的评分目标，在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测，并在多个基准数据集上展现出优于现有模型的校准性能。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Chem4DLLM: 4D Multimodal LLMs for Chemical Dynamics Understanding

该论文针对现有化学理解任务局限于静态分子表征的不足，提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解（ChemDU）”新任务，并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM，以推动动态化学理解与多模态科学推理的研究。

Xinyu Li, Zhen Zhang, Qi Chen, Anton van den Hengel, Lina Yao, Javen Qinfeng Shi2026-03-13💬 cs.CL

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA，旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战，实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

该论文提出了 ProtoSR 方法，通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库，进而指导结构化报告生成模型进行预测修正，从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Exhaustive Circuit Mapping of a Single-Cell Foundation Model Reveals Massive Redundancy, Heavy-Tailed Hub Architecture, and Layer-Dependent Differentiation Control

该研究通过对 Geneformer 单细胞基础模型进行全电路映射、高阶组合消融和因果轨迹引导实验，揭示了其内部存在严重的特征冗余、重尾枢纽架构以及未注释的生物学偏差，并证实了模型层位置对细胞分化方向具有因果控制作用。

Ihor Kendiukhov2026-03-13🤖 cs.LG

Causal Matrix Completion under Multiple Treatments via Mixed Synthetic Nearest Neighbors

本文针对多处理设置下合成最近邻（SNN）方法因各处理组数据不足而失效的问题，提出了混合合成最近邻（MSNN）估计量，通过跨处理组整合信息，在保持有限样本误差界和渐近正态性保证的同时显著提升了数据稀缺场景下的因果矩阵补全效果。

Minrui Luo, Zhiheng Zhang2026-03-13🤖 cs.LG

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

该论文提出了一种名为有效电阻重连（ERR）的无参数拓扑修正策略，通过利用有效电阻这一全局指标识别并优化结构瓶颈，在缓解图神经网络过挤压问题的同时，揭示了其与过平滑之间的权衡关系，并证明结合归一化技术可进一步提升模型性能。

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

该论文提出将沃罗诺伊镶嵌引入概率电路以捕捉数据局部几何结构，并通过构建近似推断框架与特定结构条件来解决由此引发的可处理性难题，同时设计了可微松弛方法以支持梯度学习。

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Learning Transferable Sensor Models via Language-Informed Pretraining

本文提出了名为 SLIP 的开源框架，通过结合对比对齐与传感器条件化描述生成，利用预训练语言模型实现了跨不同传感器配置的语言对齐表征学习，在零样本迁移、信号描述及问答任务中显著优于现有基线方法。

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

本文提出了局部邻接谱嵌入（LASE）方法，通过加权谱分解揭示网络中的局部低维结构，在理论上证明了其能平衡局部化统计成本与截断误差，并在实验中展示了其在局部重建、可视化及构建高保真全局视图方面的优越性。

Hannah Sansford, Nick Whiteley, Patrick Rubin-Delanchy2026-03-13📊 stat

Statistical and structural identifiability in representation learning

该论文将表示学习的稳定性形式化为统计与结构可辨识性，提出了模型无关的 $\epsilon$ -近可辨识性定义，证明了非线性解码器模型中间表示的统计近可辨识性，并验证了通过独立成分分析（ICA）后处理可有效实现解耦，从而在合成数据及细胞显微基础模型上显著提升了下游泛化能力。

Walter Nelson, Marco Fumero, Theofanis Karaletsos, Francesco Locatello2026-03-13🤖 cs.LG

Topological DeepONets and a generalization of the Chen-Chen operator approximation theorem

本文通过将输入空间从紧集上的连续函数推广到任意豪斯多夫局部凸空间，利用对偶空间中的连续线性泛函构建拓扑分支 - 主干网络，证明了连续算子在该框架下仍可被拓扑 DeepONets 一致逼近，从而将经典的 Chen-Chen 算子逼近定理推广至更广泛的拓扑空间设置中。

Vugar Ismailov2026-03-13🤖 cs.LG

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

本文首次建立了多轮次预条件随机梯度下降（PSGD）的平均算法稳定性理论，揭示了人口风险曲率、噪声几何与预条件策略之间的权衡关系，并证明了不当的预条件选择会导致基于有效维度的泛化与优化性能次优。

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick Rebeschini2026-03-13📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

本文提出了 BTZSC 基准，通过涵盖 22 个数据集对跨编码器、嵌入模型、重排序器及大语言模型进行了系统的零样本文本分类评估，发现现代重排序器性能最佳，而传统 NLI 跨编码器则表现停滞。

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

该论文提出了一种名为 FedFew 的个性化联邦学习算法，通过将问题重构为“少数模型服务多数客户端”的优化框架，仅需维护少量共享服务器模型即可在无需人工聚类或精细调参的情况下，自动实现接近最优的个性化效果并显著提升可扩展性。

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Decentralized Orchestration Architecture for Fluid Computing: A Secure Distributed AI Use Case

本文提出了一种支持多域自治的去中心化编排架构，通过引入基于 SDN 的 FU-HST 异常检测机制，在流体计算环境中实现了安全高效的跨域分布式联邦学习部署。

Diego Cajaraville-Aboy, Ana Fernández-Vilas, Rebeca P. Díaz-Redondo, Manuel Fernández-Veiga, Pablo Picallo-López2026-03-13🤖 cs.LG

Deep Learning-Based Metamodeling of Nonlinear Stochastic Dynamic Systems under Parametric and Predictive Uncertainty

该论文提出了三种结合特征提取模块（MLP、MPNN 或 AE）与长短期记忆网络（LSTM）的深度学习元建模框架，通过蒙特卡洛丢弃和负对数似然损失，成功实现了对同时存在参数不确定性和预测不确定性的非线性随机动力系统在自然荷载下的响应预测与置信度评估。

Haimiti Atila, Seymour M. J. Spence2026-03-13🤖 cs.LG

Flowcean - Model Learning for Cyber-Physical Systems

本文介绍了 Flowcean，这是一个旨在通过模块化架构和灵活的学习策略来自动化生成数据驱动模型，从而解决复杂信息物理系统（CPS）建模难题的新框架。

Maximilian Schmidt, Swantje Plambeck, Markus Knitt, Hendrik Rose, Goerschwin Fey, Jan Christian Wieck, Stephan Balduin2026-03-13🤖 cs.LG

Efficient Generative Modeling with Unitary Matrix Product States Using Riemannian Optimization

本文提出了一种基于黎曼优化的单位矩阵乘积态（Unitary MPS）生成建模方法，通过引入流形约束和空间解耦算法，有效解决了传统梯度下降训练中的效率与歧义问题，并在多个数据集上实现了快速适应、稳定更新及优异的性能表现。

Haotong Duan, Zhongming Chen, Ngai Wong2026-03-13🤖 cs.LG