ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection
该论文提出了 ALOOD 方法,通过将 LiDAR 物体特征与视觉 - 语言模型(VLM)的语言表示进行对齐,将未知类别(OOD)物体的检测转化为零样本分类任务,从而有效解决了自动驾驶中 LiDAR 检测器对未知物体过度自信的安全风险。
10313 篇论文
该论文提出了 ALOOD 方法,通过将 LiDAR 物体特征与视觉 - 语言模型(VLM)的语言表示进行对齐,将未知类别(OOD)物体的检测转化为零样本分类任务,从而有效解决了自动驾驶中 LiDAR 检测器对未知物体过度自信的安全风险。
AutoAdapt 是一个端到端的自动化框架,它通过利用文献知识库、多智能体辩论系统以及基于大语言模型的 AutoRefine 代理,有效解决了大语言模型在特定领域适应中依赖人工试错、超参数复杂及成本高昂等挑战,并在多项任务中显著提升了准确率。
本文提出了 SERQ,一种通过静态激活展平、显著性感知误差重建和离线权重置换三阶段策略,利用单一低秩补偿矩阵在无需中间量化和额外在线层的情况下,有效解决 W4A4 等低比特设置下大语言模型量化精度下降问题的方法。
本文针对受容量约束和区域间需求溢出效应影响的序贯服务区域设计问题,提出了一种结合实物期权分析与 Transformer 基近端策略优化算法的解决方案,以在需求不确定性下高效生成具有最优跨期权值的投资序列。
本文指出当前表格基础模型(如 TabPFN)的回归基准过度依赖均方误差等点估计指标,忽略了概率预测的评估,因此主张引入连续 ranked 概率分数(CRPS)等严格评分规则来评估分布回归,并强调需通过微调或提示技术来适配不同的评分规则以优化模型的归纳偏置。
本文通过探索替代欧氏距离的多种度量指标来量化异步联邦学习中的梯度陈旧性,并将其集成到聚合过程中,实验结果表明特定指标能在异构客户端和非独立同分布数据设置下显著提升模型的收敛速度、性能及训练稳定性。
本文提出了一种结合特征线性调制(FiLM)的维纳混沌展开神经网络算子,无需重整化因子即可高效求解奇异随机偏微分方程(如动态 模型),并展示了其在更具挑战性的 模型模拟中的潜力。
该论文通过注意力头层面的机制可解释性分析,揭示了续写触发型越狱攻击的本质是模型内在续写倾向与安全对齐防御之间的竞争,并阐明了不同架构中安全关键注意力头的功能差异,为理解及提升大语言模型安全性提供了新的理论视角。
本文提出了“纤维化策略优化”(FiberPO)框架,通过推导聚合策略截断目标(APC-Obj)和构建纤维束门控(FBG)代数结构,首次将信任区域理论与可组合的代数层级相结合,实现了从词元到轨迹乃至多领域层级的统一多尺度稳定性控制。
该论文提出了一种基于神经过程的预测系统,通过模拟患者生命体征轨迹并对照临床指南而非历史决策来判断口服抗生素转换时机,从而在 MIMIC-IV 和 UCLH 数据集上显著提升了抗生素管理决策支持的效率与准确性。
FedPrism 提出了一种自适应个性化联邦学习框架,通过棱镜分解法将模型解耦为全局基础、共享群组及私有部分,并结合基于置信度的双流路由机制,有效解决了非独立同分布数据下的统计异质性问题,在保持泛化能力的同时显著提升了个性化性能。
本文提出了 FlowTouch,一种利用物体局部 3D 网格编码信息并结合流匹配生成模型的新方法,旨在实现与视角无关的视触觉预测,从而有效弥合仿真与现实的差距并提升下游抓取稳定性预测能力。
本文针对 ReinMax 估计器方差过高的问题,提出了结合 Rao-Blackwell 化与控制变量技术的 ReinMax-Rao 和 ReinMax-CV 估计器,在降低方差的同时提升了离散潜变量变分自编码器的训练性能,并从数值积分角度重新审视了 ReinMax 的构建原理。
本文提出了一种具备“冷启动”能力的自适应机载磁异常导航架构,通过扩展卡尔曼滤波将物理模型与神经网络残差学习相结合,实现了无需离线校准或专用机动即可在飞行中实时补偿飞机磁干扰并达到与离线训练模型相当的导航精度。
该论文针对金融语言模型中偏见检测计算成本高昂的问题,通过大规模实证研究揭示了不同模型间偏见揭示输入的一致性模式,并提出了一种利用跨模型引导显著降低检测成本的新方法。
本文提出了 SCL-GNN 框架,通过利用希尔伯特 - 施密特独立性准则(HSIC)量化并抑制节点特征与标签间的虚假相关性,结合双层优化策略,显著提升了图神经网络在分布内及分布外场景下的泛化能力。
本文提出了一种名为 TA-RNN-Medical-Hybrid 的时间感知与可解释混合深度学习框架,通过整合显式连续时间编码、SNOMED 疾病表示及分层注意力机制,在 MIMIC-III 数据集上实现了对 ICU 患者死亡风险的高精度预测与符合医学知识的有效解释。
本文提出了 PolyFormer,一种将物理与几何知识融入优化问题重构的机器学习方法,通过将其转化为高效的多面体形式,在保持解质量的同时实现了高达 6400 倍的计算加速和 99.87% 的内存缩减,从而显著提升了复杂物理约束下大规模优化问题的可扩展性。
该论文通过递归应用 Borell-Tsirelson-Ibragimov-Sudakov 不等式证明高斯过程后验采样强化学习(GP-PSRL)算法在连续控制中的访问状态有界,并利用链式方法推导出了针对无界状态空间的紧贝叶斯后悔界 ,从而解决了现有理论在最大信息增益依赖性和状态空间无界性方面的局限。
该论文揭示了在深度线性对角网络中,Sharpness-Aware Minimization (SAM) 会因深度增加而产生显著的隐式偏差,特别是-SAM 会表现出“顺序特征放大”现象,即模型在训练初期依赖次要特征并逐渐转向主要特征,从而证明了仅依靠无限时间隐式偏差分析不足以全面理解 SAM 的有限时间动态。