Residual Attention Physics-Informed Neural Networks for Robust Multiphysics Simulation of Steady-State Electrothermal Energy Systems
该论文提出了一种残差注意力物理信息神经网络(RA-PINN)框架,通过融合统一算子、残差连接与注意力机制,有效解决了强非线性耦合及变系数等挑战,显著提升了稳态电热多物理场模拟的精度与鲁棒性。
13119 篇论文
该论文提出了一种残差注意力物理信息神经网络(RA-PINN)框架,通过融合统一算子、残差连接与注意力机制,有效解决了强非线性耦合及变系数等挑战,显著提升了稳态电热多物理场模拟的精度与鲁棒性。
MetaKube 是一个经验感知的 Kubernetes 故障诊断大语言模型框架,它通过结合 episodic 模式记忆网络、元认知控制器以及基于 7000 个样本微调的 KubeLLM 模型,实现了从静态知识库向具备持续学习能力的动态诊断系统的转变,在 1873 个真实场景中显著提升了诊断准确率并逼近 GPT-4.1 性能。
本文提出了一种名为“质量一致性得分”(MAS)的点中心度量方法,旨在通过评估各簇内点视角的期望簇大小一致性,来解决传统基于标签的聚类均匀性度量在标签数量扰动下不稳定的问题,从而有效筛选出具有均匀簇大小的聚类划分。
该论文通过引入新临床数据集 iSLEEPS 并结合 Grad-CAM 可解释性分析,揭示了深度学习模型在从健康人群泛化至缺血性卒中共病睡眠障碍患者时因关注非生理信息区域而表现不佳,从而强调了开发疾病特异性模型及进行严格临床验证的必要性。
该论文提出了名为 ZeroFold 的 Transformer 模型,通过利用 Boltz-2 基础模型生成的“预结构嵌入”来隐式编码 RNA 构象系综信息,从而仅基于序列即可准确预测蛋白质-RNA 结合亲和力,有效克服了传统方法因依赖单一静态结构而难以处理 RNA 动态灵活性的难题。
本文提出了一种名为 LineMVGNN 的新型空间图神经网络方法,通过结合支付与接收交易的双向消息传递机制及线图视图,有效解决了现有图模型在反洗钱任务中难以处理多维边特征、缺乏可解释性及扩展性不足的问题,并在真实数据集上验证了其优越的检测性能。
本文介绍了 LLMORPH,一种利用元变换测试(Metamorphic Testing)技术自动生成测试用例以检测大语言模型在 NLP 任务中输出不一致性的自动化工具,无需依赖人工标注数据即可有效评估模型鲁棒性。
该论文提出了一种关于大语言模型(LLM)信息易感性的理论,指出在计算资源充足时固定 LLM 干预无法提升策略集的性能易感性,而嵌套式共扩展架构则能突破这一限制,为开放式的代理自我改进提供了必要的结构条件。
该论文提出通过在推理时向模型隐藏状态添加基于均值差异计算的激活方向向量,能够有效地引导代码大语言模型在生成过程中偏向特定的编程语言或库,即使面对相反的提示词也能保持干预效果,从而证明代码风格偏好在大模型激活空间中具有可操纵的线性结构。
该论文通过基准测试揭示了在持续负载下,移动设备因热管理限制导致性能急剧下降或中断,而专用硬件(如 Hailo-10H NPU 和 RTX 4050 GPU)则分别受限于内存带宽和功耗,从而阐明了不同边缘平台在部署大语言模型时的能效与性能权衡特征。