Class Incremental Learning with Task-Specific Batch Normalization and Out-of-Distribution Detection
该论文提出了一种结合任务特定批归一化与分布外检测的新型持续学习框架,通过为每个任务头引入“未知”类来预测任务 ID,从而在无需访问旧数据的情况下有效平衡了类增量学习中的可塑性与稳定性,并在多个医学及自然图像数据集上取得了最先进性能。
2315 篇论文
该论文提出了一种结合任务特定批归一化与分布外检测的新型持续学习框架,通过为每个任务头引入“未知”类来预测任务 ID,从而在无需访问旧数据的情况下有效平衡了类增量学习中的可塑性与稳定性,并在多个医学及自然图像数据集上取得了最先进性能。
本文提出了一种名为 CLIQUE 的新颖模型无关方法,通过量化期望来捕捉局部依赖关系,从而克服了 LIME 和 SHAP 等现有方法在反映局部变量交互及多分类问题上的局限性,并有效降低了预测偏差。
本文提出了一种基于标准递归块基(SRBB)的新型单层量子神经网络,通过利用李代数及其拓扑特性将单位算符的参数化扩展至单层近似,并显著减少了 CNOT 门数量,从而实现了高效且可扩展的任意单位演化近似合成。
本文提出了一种不依赖随机传递性假设的广义成对比较统计模型,该模型利用低维斜对称矩阵刻画比较概率,并开发了具备稀疏数据适应性与极小化极大最优性的估计方法,从而在理论与实证上显著超越了传统的 Bradley-Terry 等模型。
本文提出了基于掩码点建模的自监督学习框架 PoLAr-MAE,通过利用未标记的液氩时间投影 chamber(LArTPC)数据学习物理意义明确的轨迹表示,仅需极少量标注样本即可实现媲美超大规模监督训练的性能,并释放了包含 100 万个事件的大规模数据集 PILArNet-M 以推动该领域基础模型的发展。
本研究利用图机器学习技术(对比了增强图特征的 CatBoost 与图注意力网络 GAT)将因等待机动导致的航班延误预测建模为图问题,发现 CatBoost 在预测不平衡数据时表现更优,并开发了实时 Web 工具以辅助提升航空运营效率。
本文提出了一种基于乐观主义的在线 KL 正则化上下文多臂老虎机算法,并通过利用 KL 正则化带来的良性优化景观,证明了该算法在奖励函数类复杂度较低时能达到对数级累积遗憾,且该结论可进一步推广至强化学习场景。
本文提出了一种名为 DIFU-Ada 的免训练推理时自适应框架,通过理论分析与实验验证,成功使仅在旅行商问题(TSP)上训练的扩散模型无需额外训练即可实现跨问题(如 PCTSP、OP)和跨尺度的零-shot 泛化能力。
该论文通过证明 CLIP 类联合嵌入空间存在无法同时满足基础描述、属性绑定、空间关系及否定表达的理论局限性,提出了保留语义拓扑结构的密集余弦相似度图(DCSM)方法,从而有效解决了 CLIP 的根本缺陷并提升了其在多项基准测试中的表现。
该论文指出,尽管深度语音降噪(DNS)模型被广泛应用于高安全场景,但通过添加人耳难以察觉的对抗性噪声即可使其输出变为无法理解的乱码,且经专家验证和主观测试证实了攻击的有效性与隐蔽性,从而强调了在将其用于安全关键应用前必须采取实际防御措施。
本文提出了一种基于上下文多臂老虎机框架的在线学习算法,旨在帮助拥有市场定价权的风电生产商在无需复杂市场模型和对手行为预测的情况下,通过利用上下文信息优化短期电力市场投标策略,从而有效降低不平衡成本。
该论文提出了一种利用 Cholesky 分解将类内协方差纳入优化问题的算法,以解决传统支持向量机在非欧几里得空间中的次优性问题,并通过实验证明该协方差调整模型在多项性能指标上显著优于传统 SVM 及白化算法。
该论文提出了一种基于“不完整先验”概念和粒球像素计算(GBPC)算法的少样本图像融合新方法,通过自适应损失函数使轻量级网络仅需少量图像对即可学习通用融合规则,在多个任务中实现了优异的视觉质量与模型紧凑性。
本文提出了一种基于离线数据的创新算法,通过构建高阶马尔可夫决策过程并结合生存分析技术,有效解决了在需求具有依赖性和 censoring(截断)特性的动态库存与定价问题,从而估计出最大化长期利润的最优策略。
本文提出了一种基于得分匹配扩散的非线性系统确定性反馈控制框架,通过前向扩散探索状态空间并设计反向去噪律来驱动系统概率密度收敛至目标分布,从而为漂移自由及线性时不变系统提供了可靠的密度控制与规划方法。
本文提出了一种名为 SwitchMT 的新方法,通过结合具有主动树突和决斗结构的深度脉冲 Q 网络以及基于奖励与网络内部动力学的自适应任务切换策略,有效解决了资源受限自主代理在多任务强化学习中的任务干扰问题,实现了无需增加网络复杂度的可扩展高效多任务学习。
本文介绍了名为 Panda 的预训练模型,该模型通过在进化算法发现的 2 万个混沌系统合成数据上进行训练,展现出零样本预测未见混沌系统、跨维度泛化(从常微分方程到偏微分方程)以及有效预测真实世界实验时间序列的涌现能力。
该论文通过对 2022 年至 2025 年初的 25,000 篇论文进行数据驱动的半自动审查,系统梳理了大语言模型局限性(LLLMs)的研究趋势,发现相关研究占比显著增长,其中推理能力仍是核心关注点,而 arXiv 数据集的研究热点正逐渐向安全风险、对齐、幻觉、知识编辑及多模态方向转移。
该论文提出了一种基于一致性的测试时溯因推理框架,通过逻辑编程将多个预训练模型的预测及其错误检测规则编码,利用整数规划或启发式搜索算法在满足逻辑一致性约束的前提下最大化预测覆盖率,从而在分布偏移的新环境中有效缓解单一模型性能下降并提升整体精度与召回率。
本文提出了一种名为 CARTGen-IR 的基于分类回归树(CART)的合成采样方法,旨在通过无需阈值设定的相关性与密度引导采样机制,高效、透明地解决表格数据中回归任务的目标分布不平衡问题。