OSM-based Domain Adaptation for Remote Sensing VLMs

该论文提出了 OSMDA 框架,通过利用基础视觉语言模型将遥感图像与 OpenStreetMap 渲染图配对并自动生成富含元数据的描述,实现了无需人工标注或更强教师模型即可完成的遥感领域自适应,并在多项基准测试中取得了优于现有方法的性能。

Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Mohammad Mahdi (INSAIT, Sofia University "St. Kliment Ohridski"), Delyan Boychev (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-13🤖 cs.LG

Multi-Station WiFi CSI Sensing Framework Robust to Station-wise Feature Missingness and Limited Labeled Data

该论文提出了一种面向多站部署的 WiFi 信道状态信息(CSI)感知框架,通过结合跨模态自监督预训练以学习对站点特征缺失具有不变性的表征,并引入站点级掩码增强策略,有效解决了实际应用中站点特征缺失与标注数据稀缺的双重挑战。

Keita Kayano, Takayuki Nishio, Daiki Yoda, Yuta Hirai, Tomoko Adachi2026-03-13🤖 cs.LG

FlexRec: Adapting LLM-based Recommenders for Flexible Needs via Reinforcement Learning

FlexRec 是一种基于强化学习的后训练框架,通过引入基于反事实交换的因果项级奖励和不确定性感知的批评引导缩放机制,有效解决了大语言模型推荐系统在序列奖励稀疏噪声下的训练难题,从而实现了针对动态需求的灵活适应与显著性能提升。

Yijun Pan, Weikang Qiu, Qiyao Ma, Mingxuan Ju, Tong Zhao, Neil Shah, Rex Ying2026-03-13🤖 cs.LG

Causal Representation Learning with Optimal Compression under Complex Treatments

该论文针对多治疗场景下的个体治疗效应估计难题,提出了一种基于最优压缩的因果表示学习框架,通过推导新的泛化界确定最优平衡权重,并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM,在显著降低计算复杂度的同时实现了高精度的估计效果。

Wanting Liang, Haoang Chi, Zhiheng Zhang2026-03-13📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本文提出了 EnTransformer,一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架,通过引入随机噪声并优化基于能量的评分目标,在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测,并在多个基准数据集上展现出优于现有模型的校准性能。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Chem4DLLM: 4D Multimodal LLMs for Chemical Dynamics Understanding

该论文针对现有化学理解任务局限于静态分子表征的不足,提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解(ChemDU)”新任务,并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM,以推动动态化学理解与多模态科学推理的研究。

Xinyu Li, Zhen Zhang, Qi Chen, Anton van den Hengel, Lina Yao, Javen Qinfeng Shi2026-03-13💬 cs.CL

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA,旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战,实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

该论文提出了 ProtoSR 方法,通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库,进而指导结构化报告生成模型进行预测修正,从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Statistical and structural identifiability in representation learning

该论文将表示学习的稳定性形式化为统计与结构可辨识性,提出了模型无关的ϵ\epsilon-近可辨识性定义,证明了非线性解码器模型中间表示的统计近可辨识性,并验证了通过独立成分分析(ICA)后处理可有效实现解耦,从而在合成数据及细胞显微基础模型上显著提升了下游泛化能力。

Walter Nelson, Marco Fumero, Theofanis Karaletsos, Francesco Locatello2026-03-13🤖 cs.LG