Causal Representation Learning with Optimal Compression under Complex Treatments

该论文针对多治疗场景下的个体治疗效应估计难题,提出了一种基于最优压缩的因果表示学习框架,通过推导新的泛化界确定最优平衡权重,并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM,在显著降低计算复杂度的同时实现了高精度的估计效果。

Wanting Liang, Haoang Chi, Zhiheng Zhang2026-03-13📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本文提出了 EnTransformer,一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架,通过引入随机噪声并优化基于能量的评分目标,在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测,并在多个基准数据集上展现出优于现有模型的校准性能。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Chem4DLLM: 4D Multimodal LLMs for Chemical Dynamics Understanding

该论文针对现有化学理解任务局限于静态分子表征的不足,提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解(ChemDU)”新任务,并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM,以推动动态化学理解与多模态科学推理的研究。

Xinyu Li, Zhen Zhang, Qi Chen, Anton van den Hengel, Lina Yao, Javen Qinfeng Shi2026-03-13💬 cs.CL

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA,旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战,实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

该论文提出了 ProtoSR 方法,通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库,进而指导结构化报告生成模型进行预测修正,从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Statistical and structural identifiability in representation learning

该论文将表示学习的稳定性形式化为统计与结构可辨识性,提出了模型无关的ϵ\epsilon-近可辨识性定义,证明了非线性解码器模型中间表示的统计近可辨识性,并验证了通过独立成分分析(ICA)后处理可有效实现解耦,从而在合成数据及细胞显微基础模型上显著提升了下游泛化能力。

Walter Nelson, Marco Fumero, Theofanis Karaletsos, Francesco Locatello2026-03-13🤖 cs.LG

Deep Learning-Based Metamodeling of Nonlinear Stochastic Dynamic Systems under Parametric and Predictive Uncertainty

该论文提出了三种结合特征提取模块(MLP、MPNN 或 AE)与长短期记忆网络(LSTM)的深度学习元建模框架,通过蒙特卡洛丢弃和负对数似然损失,成功实现了对同时存在参数不确定性和预测不确定性的非线性随机动力系统在自然荷载下的响应预测与置信度评估。

Haimiti Atila, Seymour M. J. Spence2026-03-13🤖 cs.LG