Interpretable-by-Design Transformers via Architectural Stream Independence
该论文提出了通过架构流独立性(即保持符号结构与上下文语义在独立流中处理直至输出融合)来“按设计实现可解释性”的新范式,并通过晚融合架构(LFA)验证了该方法能有效防止信息过早纠缠、提升模型稳定性,从而将可解释性确立为一种可通过结构约束强制实现的架构设计准则。
9929 篇论文
该论文提出了通过架构流独立性(即保持符号结构与上下文语义在独立流中处理直至输出融合)来“按设计实现可解释性”的新范式,并通过晚融合架构(LFA)验证了该方法能有效防止信息过早纠缠、提升模型稳定性,从而将可解释性确立为一种可通过结构约束强制实现的架构设计准则。
本文针对双基无线传感中时钟异步导致的相位偏移问题,提出了一种利用信道响应幅度从失真的跨天线信道比率中恢复理想信道特征的鲁棒框架,从而在 Wi-Fi 和 LoRa 实验中实现了亚波长级的高精度位移感知。
本文提出了一种增强的随机子空间局部投影(RSLP)框架,通过引入加权子空间聚合、类别感知采样、自适应子空间尺寸选择及针对依赖数据的自助法推断程序,有效解决了高维时间序列中预测变量多于观测值导致的过拟合与估计不稳定问题,显著提升了长预测 horizon 下的估计精度与推断可靠性。
本文提出了首个尺寸无关的 BoT 框架,通过将模型权重视为连续信号并利用离散小波变换(DWT)将双向模型缩放统一为信号处理中的上采样与下采样操作,从而在显著降低预训练计算成本的同时实现了 DeiT、BERT 和 GPT 等模型在 GLUE 和 SQuAD 等基准测试上的最先进性能。
本文提出了名为 OCLADS 的新型通信框架,通过结合设备端智能样本选择与边缘端分布偏移检测机制,实现了在数据分布动态变化的物联网环境中高效且低更新频率的在线持续异常检测。
本文通过利用 Tweedie 公式,精确揭示了漂移模型(Drifting)与基于分数的扩散模型之间的内在联系,证明了高斯核漂移等价于在平滑分布上进行分数匹配,并进一步推导了通用径向核的分解形式及拉普拉斯核在低温和高维情形下的误差界,从而为理解漂移模型与分布匹配蒸馏(DMD)提供了统一的理论视角。
该研究提出了一种基于强化学习的框架,通过动态优化干旱地区光伏面板的清洁调度,在阿布扎比案例中证明其相比传统方法能节省高达 13% 的成本并显著提升系统效率。
该论文提出了一种基于差分隐私的全数据共形预测框架,通过利用隐私机制带来的稳定性并配合保守的分位数估计,在无需数据划分的情况下实现了比现有私有基线更锐利的预测集,并在渐近意义上恢复了标称覆盖率。
本文提出了一种名为 FRONT 的新型框架,该框架利用离散余弦变换(DCT)从预训练模型权重中提取低频“学习基因”,从而实现对任意规模下游模型的高效、免训练初始化,并在视觉和语言任务中显著加速收敛并降低训练成本。
该论文提出了一种神经动力学先验的预训练框架,通过提取异质场景下的个性化神经活动表征来指导脑区划分与相关性估计,从而克服了传统方法依赖固定图谱和线性假设的局限,显著提升了个性化脑功能网络构建的准确性与泛化能力。
该论文提出了一种结合卷积自编码器与神经常微分方程的数据驱动代理建模方法,通过构建动态潜在空间表示,将激光点火火箭发动机的多物理场湍流模拟成本降低数个数量级,从而实现了对复杂燃烧系统的高效时空预测与不确定性量化。
本文提出了名为 Obliviator 的后期概念擦除方法,通过迭代优化核函数组合来有效捕捉非线性统计依赖,从而在抵御非线性攻击的同时,量化并优化了属性保护与任务效用之间的权衡。
DreamSAC 提出了一种结合基于哈密顿量的对称性探索策略与自监督对比学习的框架,通过主动收集符合物理守恒律的数据并从中学习不变性,显著提升了世界模型在物理模拟中面对新物理属性时的外推泛化能力。
本文提出了 COOL-MC 工具,通过概率模型检查和可解释性分析,对基于强化学习的多桥梁网络维护策略进行了形式化验证与解释,揭示了其安全违规概率及决策偏差。
该论文提出了一种以数据为中心的简化 CNN-VAE 模型,通过精细的数据预处理和类别平衡策略,在 PTB-XL 数据集上以极少的参数量实现了具有竞争力的心电图分类性能,强调了数据质量优于架构复杂性的重要性。
本文提出了一种名为 GRD-Net 的新型异常检测架构,该架构结合基于残差自编码器的生成对抗网络与区域兴趣(ROI)注意力模块,通过利用正常样本及合成缺陷数据进行训练,实现了无需复杂后处理算法即可精准定位工业表面缺陷(如药瓶铝盖)的异常检测。
该论文通过引入抗过拟合、迁移学习、基于影子模型的阈值校准及非平衡先验等现实假设,重新评估了成员推断攻击(LiRA),发现其在实际生产环境下的攻击效果显著低于以往研究结论,并强调了可复现性在隐私审计中的重要性。
本文提出了一种基于约束矩阵扩散的生成式神经求解器,通过利用离散噪声图扩散模型学习车辆路径问题的约束并生成约束分配矩阵,将其自适应地融入自回归求解器的特征学习与决策过程,从而在 CVRPlib 数据集的广泛测试中实现了兼顾全局视野与局部特征整合的卓越性能。
该论文在 OpenOOD 标准协议下,系统比较了交叉熵、原型、三元组及平均精度四种训练目标在图像分类中的分布外检测性能,发现交叉熵损失在保持分布内精度的同时,能提供最为稳健的近域与远域分布外检测效果。
本文提出了 TS-MLLM 框架,通过结合工业时序补丁建模、谱感知视觉语言模型适配以及时序中心多模态注意力融合机制,实现了对工业时序数据中时间信号、频域图像和文本知识的统一多模态建模,从而在工业设备健康管理任务中显著提升了预测的准确性、鲁棒性和泛化能力。