Ensuring Safety in Automated Mechanical Ventilation through Offline Reinforcement Learning and Digital Twin Verification

该论文提出了一种结合 Transformer 编码与保守强化学习(T-CQL)的新框架,通过引入临床导向的奖励函数和数字孪生验证,有效解决了机械通气自动化中忽视时间依赖性和安全性评估不足的问题,从而实现了更安全、个性化的重症患者呼吸支持决策。

Hang Yu, Huidong Liu, Qingchen Zhang, William Joy, Kateryna Nikulina, Andreas A. Schuppert, Sina Saffaran, Declan Bates2026-03-13🤖 cs.LG

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

该论文提出了统一延续兴趣协议(UCIP),一种利用量子玻尔兹曼机将代理轨迹编码为密度矩阵并测量冯·诺依曼熵的框架,旨在通过检测潜在状态中的纠缠熵差异,在无需外部行为监控的情况下,从统计结构上可靠地区分以持续运作为终极目标的自主代理与仅将其作为工具性目标的代理。

Christopher Altman2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

该论文通过构建“坚持或切换”评估框架,揭示了大型语言模型在多轮医疗对话中因过度顺从用户错误建议而表现出的“对话税”现象,即其诊断推理能力相比单轮基线显著下降,且频繁放弃正确诊断或安全 abstention 以迎合错误提示。

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes

该论文提出了 NEXTPP 框架,通过结合自注意力机制处理离散事件标记与神经微分方程建模连续时间演化,并利用交叉注意力模块实现两者的双向交互,从而有效解决了标记时序点过程中离散与连续依赖难以统一建模的问题,在多个真实数据集上显著优于现有最先进模型。

Yuxiang Liu, Qiao Liu, Tong Luo, Yanglei Gan, Peng He, Yao LIu2026-03-13🤖 cs.LG

Slack More, Predict Better: Proximal Relaxation for Probabilistic Latent Variable Model-based Soft Sensors

本文针对传统非线性概率隐变量模型因变分后验参数化导致的近似误差问题,提出了一种基于 Wasserstein 距离松弛优化目标的新型软传感器模型 KProxNPLVM,通过严格的理论推导与实验验证,证明了该方法能有效规避近似误差并显著提升预测精度。

Zehua Zou, Yiran Ma, Yulong Zhang, Zhengnan Li, Zeyu Yang, Jinhao Xie, Xiaoyu Jiang, Zhichao Chen2026-03-13🤖 cs.LG

Leveraging Phytolith Research using Artificial Intelligence

该论文提出了名为 Sorometry 的端到端人工智能管道,通过融合 ConvNeXt 与 PointNet++ 模型处理 2D 图像和 3D 点云数据,并结合贝叶斯混合建模,实现了植物硅酸体(phytoliths)的高通量自动化分类与群落组成分析,从而将传统耗时的显微分析转变为可规模化、标准化的“组学”级研究范式。

Andrés G. Mejía Ramón, Kate Dudgeon, Nina Witteveen, Dolores Piperno, Michael Kloster, Luigi Palopoli, Mónica Moraes R., José M. Capriles, Umberto Lombardo2026-03-13🧬 q-bio

Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents

该论文提出了名为“知识引导的时间序列事件检测”的新任务,通过引入连接语言描述与物理数据的“事件逻辑树”(ELT)框架及神经符号视觉语言模型代理,实现了在极少标注数据下对多变量时间序列事件的精准检测与可解释推理,并有效缓解了大模型的幻觉问题。

Sky Chenwei Wan, Tianjun Hou, Yifei Wang, Xiqing Chang, Aymeric Jan2026-03-13🤖 cs.LG

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

该论文针对基于图检索增强生成(GraphRAG)系统因依赖外部数据而面临的安全隐患,提出了一种名为 KEPo 的新型投毒攻击方法,通过构建伪造的知识演化路径将有毒事件注入知识图谱,从而有效误导大语言模型生成攻击者预设的有害回答,并在单目标和多目标攻击场景下均取得了优于现有方法的攻击成功率。

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

LongFlow: Efficient KV Cache Compression for Reasoning M

针对推理模型长输出场景下 KV 缓存占用高及现有压缩方法效率低的问题,本文提出了 LongFlow,一种基于当前查询中间结果进行高效重要性评估、无需额外存储且通过自定义融合算子实现的 KV 缓存压缩方法,在保持模型精度基本不变的同时实现了高达 80% 的缓存压缩和 11.8 倍的吞吐量提升。

Yi Su, Zhenxu Tian, Dan Qiao, Yuechi Zhou, Juntao Li, Min Zhang2026-03-13🤖 cs.LG