cs.LG 篇论文 | Gist.Science

Residual Attention Physics-Informed Neural Networks for Robust Multiphysics Simulation of Steady-State Electrothermal Energy Systems

该论文提出了一种残差注意力物理信息神经网络（RA-PINN）框架，通过融合统一算子、残差连接与注意力机制，有效解决了强非线性耦合及变系数等挑战，显著提升了稳态电热多物理场模拟的精度与鲁棒性。

Yuqing Zhou, Ze Tao, Fujun Liu2026-03-26🤖 cs.LG

MetaKube: An Experience-Aware LLM Framework for Kubernetes Failure Diagnosis

MetaKube 是一个经验感知的 Kubernetes 故障诊断大语言模型框架，它通过结合 episodic 模式记忆网络、元认知控制器以及基于 7000 个样本微调的 KubeLLM 模型，实现了从静态知识库向具备持续学习能力的动态诊断系统的转变，在 1873 个真实场景中显著提升了诊断准确率并逼近 GPT-4.1 性能。

Wei Sun, Ting Wang, Xinran Tian, Wanshun Lan, Xuhan Feng, Haoyue Li, Fangxin Wang2026-03-26🤖 cs.LG

The Mass Agreement Score: A Point-centric Measure of Cluster Size Consistency

本文提出了一种名为“质量一致性得分”（MAS）的点中心度量方法，旨在通过评估各簇内点视角的期望簇大小一致性，来解决传统基于标签的聚类均匀性度量在标签数量扰动下不稳定的问题，从而有效筛选出具有均匀簇大小的聚类划分。

Randolph Wiredu-Aidoo2026-03-26📊 stat

AI Generalisation Gap In Comorbid Sleep Disorder Staging

该论文通过引入新临床数据集 iSLEEPS 并结合 Grad-CAM 可解释性分析，揭示了深度学习模型在从健康人群泛化至缺血性卒中共病睡眠障碍患者时因关注非生理信息区域而表现不佳，从而强调了开发疾病特异性模型及进行严格临床验证的必要性。

Saswata Bose, Suvadeep Maiti, Shivam Kumar Sharma, Mythirayee S, Tapabrata Chakraborti, Srijitesh Rajendran, Raju S. Bapi2026-03-26🤖 cs.LG

ZeroFold: Protein-RNA Binding Affinity Predictions from Pre-Structural Embeddings

该论文提出了名为 ZeroFold 的 Transformer 模型，通过利用 Boltz-2 基础模型生成的“预结构嵌入”来隐式编码 RNA 构象系综信息，从而仅基于序列即可准确预测蛋白质-RNA 结合亲和力，有效克服了传统方法因依赖单一静态结构而难以处理 RNA 动态灵活性的难题。

Josef Hanke (Yusuf Hamied Department of Chemistry, University of Cambridge, UK), Sebastian Pujalte Ojeda (Yusuf Hamied Department of Chemistry, University of Cambridge, UK), Shengyu Zhang (Yusuf Hamie (…)2026-03-26🧬 q-bio

LineMVGNN: Anti-Money Laundering with Line-Graph-Assisted Multi-View Graph Neural Networks

本文提出了一种名为 LineMVGNN 的新型空间图神经网络方法，通过结合支付与接收交易的双向消息传递机制及线图视图，有效解决了现有图模型在反洗钱任务中难以处理多维边特征、缺乏可解释性及扩展性不足的问题，并在真实数据集上验证了其优越的检测性能。

Chung-Hoo Poon, James Kwok, Calvin Chow, Jang-Hyeon Choi2026-03-26💰 q-fin

LLMORPH: Automated Metamorphic Testing of Large Language Models

本文介绍了 LLMORPH，一种利用元变换测试（Metamorphic Testing）技术自动生成测试用例以检测大语言模型在 NLP 任务中输出不一致性的自动化工具，无需依赖人工标注数据即可有效评估模型鲁棒性。

Steven Cho, Stefano Ruberto, Valerio Terragni2026-03-26💻 cs

A Theory of LLM Information Susceptibility

该论文提出了一种关于大语言模型（LLM）信息易感性的理论，指出在计算资源充足时固定 LLM 干预无法提升策略集的性能易感性，而嵌套式共扩展架构则能突破这一限制，为开放式的代理自我改进提供了必要的结构条件。

Zhuo-Yang Song, Hua Xing Zhu2026-03-26🌀 nlin

Steering Code LLMs with Activation Directions for Language and Library Control

该论文提出通过在推理时向模型隐藏状态添加基于均值差异计算的激活方向向量，能够有效地引导代码大语言模型在生成过程中偏向特定的编程语言或库，即使面对相反的提示词也能保持干预效果，从而证明代码风格偏好在大模型激活空间中具有可操纵的线性结构。

Md Mahbubur Rahman, Arjun Guha, Harshitha Menon2026-03-26🤖 cs.LG

LLM Inference at the Edge: Mobile, NPU, and GPU Performance Efficiency Trade-offs Under Sustained Load

该论文通过基准测试揭示了在持续负载下，移动设备因热管理限制导致性能急剧下降或中断，而专用硬件（如 Hailo-10H NPU 和 RTX 4050 GPU）则分别受限于内存带宽和功耗，从而阐明了不同边缘平台在部署大语言模型时的能效与性能权衡特征。

Pranay Tummalapalli, Sahil Arayakandy, Ritam Pal, Kautuk Kundan2026-03-26💻 cs