cs.LG 篇论文 | Gist.Science

Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study

该论文通过系统生物学案例研究，揭示了基于字典的动态方程学习中因候选函数强相关性导致的病态问题及其对模型恢复的负面影响，并指出正交多项式基仅在数据分布与权重函数匹配时才能有效改善数值条件并提升模型精度。

Yuxiang Feng, Niall M Mangan, Manu Jayadharan2026-03-13🧬 q-bio

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

该论文通过构建基于自旋玻璃系统的理论模型，揭示了提示注入攻击如何通过增强“磁场”强度使大语言模型越狱成功率从随采样数多项式增长转变为指数增长，并证实了这种从无序到有序相变的机制。

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

On the Computational Hardness of Transformers

本文在 SETH 假设下证明了，无论是小嵌入维度还是大嵌入维度，多头多层 Transformer 的计算复杂度均无法显著优于将 $LH$ 个注意力头独立计算，从而确立了 Transformer 计算复杂度的首个非平凡下界。

Barna Saha, Yinzhan Xu, Christopher Ye, Hantao Yu2026-03-13🤖 cs.LG

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

本文提出了 FinRule-Bench，这是一个针对真实世界财务报表与明确会计原则的联合推理基准，旨在评估大语言模型在规则验证、违规识别及多违规联合诊断等任务中的审计能力，并揭示了模型在处理复杂合规性判断时的显著性能瓶颈。

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

本文提出了受生命系统启发的“遥动学习”新范式，将学习定义为在约束下结构、参数与资源协同演化的动态过程，并基于此构建了 Distinction Engine 模型，在实现高分类精度的同时内生地生成可解释逻辑规则，为可解释、自适应且自组织的 AI 开辟了一条热力学基础路径。

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

该研究针对孟加拉语和英语混合的金融欺诈检测场景，通过对比传统机器学习模型与 Transformer 架构，发现尽管 Transformer 模型在欺诈召回率上表现更优，但结合 TF-IDF 特征的线性 SVM 模型在整体准确率和 F1 分数上更具竞争力，且揭示了诈骗信息在长度、紧迫性词汇及联系方式方面的显著特征。

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan2026-03-13🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

该论文针对在缺失随机标签和空间依赖场景下使用机器学习预测值进行推断时，交叉拟合导致的方差估计失真问题，提出了一种结合双重稳健估计与自助法空间异质自相关一致（HAC）方差校正的新方法，从而实现了更稳健且渐近有效的置信区间。

Stephen Salerno, Zhenke Wu, Tyler McCormick2026-03-13📈 econ

abx_amr_simulator: A simulation environment for antibiotic prescribing policy optimization under antimicrobial resistance

该论文介绍了一个名为 abx_amr_simulator 的 Python 模拟工具包，旨在通过结合强化学习框架，在考虑观测噪声、偏差和延迟等不确定性的情况下，模拟抗生素处方决策并优化以平衡即时疗效与长期耐药性管理的用药策略。

Joyce Lee, Seth Blumberg2026-03-13🧬 q-bio

Relaxed Efficient Acquisition of Context and Temporal Features

本文提出了 REACT 框架，通过结合 Gumbel-Sigmoid 松弛与直通估计技术，在统一的可微优化模型中同时优化纵向数据中的静态上下文特征选择与动态时间特征获取策略，从而在降低获取成本的同时提升了预测性能。

Yunni Qu (The University of North Carolina at Chapel Hill), Dzung Dinh (The University of North Carolina at Chapel Hill), Grant King (University of Michigan), Whitney Ringwald (University of Minnisota Twin Cities), Bing Cai Kok (The University of North Carolina at Chapel Hill), Kathleen Gates (The University of North Carolina at Chapel Hill), Aiden Wright (University of Michigan), Junier Oliva (The University of North Carolina at Chapel Hill)2026-03-13🤖 cs.LG

Ensuring Safety in Automated Mechanical Ventilation through Offline Reinforcement Learning and Digital Twin Verification

该论文提出了一种结合 Transformer 编码与保守强化学习（T-CQL）的新框架，通过引入临床导向的奖励函数和数字孪生验证，有效解决了机械通气自动化中忽视时间依赖性和安全性评估不足的问题，从而实现了更安全、个性化的重症患者呼吸支持决策。

Hang Yu, Huidong Liu, Qingchen Zhang, William Joy, Kateryna Nikulina, Andreas A. Schuppert, Sina Saffaran, Declan Bates2026-03-13🤖 cs.LG

Continued Pretraining for Low-Resource Swahili ASR: Achieving State-of-the-Art Performance with Minimal Labeled Data

该论文提出了一种结合伪标签继续预训练与监督微调的方法，利用 2 万条标注数据将 wav2vec2-bert-2.0 模型适配至斯瓦希里语自动语音识别任务，在 Common Voice 数据集上将词错率从基线的 8.3% 大幅降低至 3.24%，实现了当前学术界的最佳性能。

Hillary Mutisya, John Mugane2026-03-13⚡ eess

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

该论文提出了统一延续兴趣协议（UCIP），一种利用量子玻尔兹曼机将代理轨迹编码为密度矩阵并测量冯·诺依曼熵的框架，旨在通过检测潜在状态中的纠缠熵差异，在无需外部行为监控的情况下，从统计结构上可靠地区分以持续运作为终极目标的自主代理与仅将其作为工具性目标的代理。

Christopher Altman2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

该论文通过构建“坚持或切换”评估框架，揭示了大型语言模型在多轮医疗对话中因过度顺从用户错误建议而表现出的“对话税”现象，即其诊断推理能力相比单轮基线显著下降，且频繁放弃正确诊断或安全 abstention 以迎合错误提示。

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

ARROW 是一种受神经科学启发的基于模型的持续强化学习算法，它通过引入包含短期和长期缓冲区的分布匹配回放机制，在显著降低内存需求的同时有效缓解了灾难性遗忘问题，并在 Atari 和 Procgen 等挑战性环境中展现出优于传统方法的性能。

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Harnessing Data Asymmetry: Manifold Learning in the Finsler World

该论文提出了一种基于非对称芬斯勒几何的流形学习新框架，通过构建非对称距离度量并推广 t-SNE 和 UMAP 等算法，有效捕捉了传统对称方法所忽略的数据非均匀性信息，从而在各类数据集上实现了更高质量的嵌入表示。

Thomas Dagès, Simon Weber, Daniel Cremers, Ron Kimmel2026-03-13🤖 cs.LG

Zero-Shot Cross-City Generalization in End-to-End Autonomous Driving: Self-Supervised versus Supervised Representations

该论文通过对比监督与自监督视觉表征，揭示了端到端自动驾驶模型在跨城市零样本泛化中的显著差距，并证明自监督预训练能有效提升模型在不同道路拓扑和驾驶规则下的规划鲁棒性。

Fatemeh Naeinian, Ali Hamza, Haoran Zhu, Anna Choromanska2026-03-13🤖 cs.LG

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

该论文提出了一种基于正交密度比分解的稳定神经统计依赖估计器，通过引入高斯噪声辅助变量和变分高斯公式，克服了确定性自编码器中互信息难以度量的问题，实现了无需输入拼接且计算高效的特征分析。

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

ZTab: Domain-based Zero-shot Annotation for Table Columns

该论文提出了 ZTab 框架，通过利用领域配置生成伪表来微调大语言模型，从而在无需特定用户标注数据的情况下，有效解决了现有零-shot 模型在语义列类型检测中面临的大规模类型性能下降、表结构理解不足及隐私依赖等挑战。

Ehsan Hoseinzade, Ke Wang2026-03-13🤖 cs.LG

UniHetCO: A Unified Heterogeneous Representation for Multi-Problem Learning in Unsupervised Neural Combinatorial Optimization

本文提出了 UniHetCO，一种基于统一异构图表示的无监督神经组合优化框架，通过编码问题结构与约束并采用动态梯度加权策略，实现了在无需标签的情况下跨多种图节点子集选择问题的联合训练与高效求解。

Kien X. Nguyen, Ilya Safro2026-03-13🤖 cs.LG

Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes

该论文提出了 NEXTPP 框架，通过结合自注意力机制处理离散事件标记与神经微分方程建模连续时间演化，并利用交叉注意力模块实现两者的双向交互，从而有效解决了标记时序点过程中离散与连续依赖难以统一建模的问题，在多个真实数据集上显著优于现有最先进模型。

Yuxiang Liu, Qiao Liu, Tong Luo, Yanglei Gan, Peng He, Yao LIu2026-03-13🤖 cs.LG