ReCoSplat: Autoregressive Feed-Forward Gaussian Splatting Using Render-and-Compare
ReCoSplat 提出了一种利用“渲染 - 比较”模块来补偿姿态误差的自回归前馈高斯泼溅模型,并结合混合 KV 缓存压缩策略,实现了在有无相机位姿及内参条件下对长序列视频的高效在线新视图合成。
7210 篇论文
ReCoSplat 提出了一种利用“渲染 - 比较”模块来补偿姿态误差的自回归前馈高斯泼溅模型,并结合混合 KV 缓存压缩策略,实现了在有无相机位姿及内参条件下对长序列视频的高效在线新视图合成。
本文提出了 TiPToP,一种结合预训练视觉基础模型与任务运动规划器(TAMP)的模块化开放词汇系统,仅需 RGB 图像和自然语言指令即可在零机器人数据的情况下解决多步操作任务,并在仿真与真实世界中展现出优于基于 350 小时演示微调的 VLA 模型的性能。
该论文提出了一种将 d-DNNF 知识编译技术扩展至 SMT 层面的通用框架,通过结合预计算理论引理将 SMT 查询转化为命题逻辑问题,从而利用现有的 d-DNNF 编译器实现多项式时间的 SMT 查询。
本文提出了一种基于智能体(Agent)的防空系统决策模型,利用信念 - 愿望 - 意图(BDI)架构和元级规划推理,实现了无需人工干预的自动化目标探测、威胁评估及武器分配,从而提升了网络中心战环境下的指挥控制自主性。
该论文通过均衡模型分析了社交媒体中用户基于私人和公共信号分享新闻的决策机制,揭示了算法优先展示高传播度内容虽能提升信息聚合效率,但也可能引发错误信息自我强化的稳态,从而为平台设计提供了重要启示。
本文提出了一种结合可信区间的新型统计学习方法,通过非参数密度估计和两项创新策略,在确保拍卖机制公平性、激励相容性及个体理性高概率成立的前提下,有效降低了多物品拍卖的实施成本并实现了收益最大化。
该论文针对混合目标域适应中类别分布偏移和伪标签生成困难的问题,提出了一种通过不确定性引导的类别判别器显式对齐 并利用低层特征增强以校正 的互条件对齐机制,从而在不依赖域标签的情况下显著提升了模型性能。
本文通过以 YouTube 为例,深入探讨了审计方法论中关键配置决策(如是否使用登录账户)对算法偏见推断准确性的显著影响,并提出了在保障推断精度的同时降低审计经济与技术成本的优化策略。
本文研究了带有平局和上下限配额的二部图多对多匹配问题,证明了临界松弛稳定匹配总是存在,并提出了一个多项式时间的 -近似算法来求解最大基数的此类匹配。
本文介绍了 altiro3D,这是一个开源扩展库,它利用单张 RGB 图像或平面视频,结合 MiDaS 深度估计、OpenCV 与 Telea 图像修复技术以及快速投影算法,生成多视角光场图像或视频,从而实现逼真的 3D 自由视角体验。
本文综述了基于效用理论的认知建模在机器人领域的应用,探讨了从行为基机器人到价值系统的演进、其在单/多智能体及人机交互中的作用,并提出了未来的研究方向与开放性问题。
本文针对 5G NR 侧行链路 Mode 2 中的基于感知的半持续调度(SPS)机制,建立了一个显式建模 MAC 层碰撞事件的包接收率(PRR)解析模型,推导了稳态碰撞概率与 PRR 的闭式表达式,并通过 ns-3 仿真验证了该模型在分析 SPS 参数对 6G 侧行链路可靠性影响方面的有效性。
本文研究了距离-支配集重配置问题,证明了在分裂图中当时该问题属于类(与时的-完全性形成复杂度二分),并给出了树图上的线性时间算法,同时扩展了平面图、二分图和弦图上的-完全性结果。
本文提出了一种基于环路的算法,用于解决自动导引车(AGV)在环路图上的在线无冲突调度与路径规划问题,实验表明该方法在求解质量和计算效率上均优于或等同于现有的精确方法、贪心启发式及元启发式算法。
本文提出了包含 15 类物体及多种异常模式的 PD-REAL 大规模 RGB-D 异常检测数据集,并引入了一种利用多尺度教师 - 学生框架与分层蒸馏技术的多模态异常检测方法,有效克服了单尺度方法的局限并显著提升了检测精度。
该论文针对相机变化导致 Jaccard 距离在行人重识别中可靠性下降的问题,提出了一种利用相机信息构建相机感知 k-互逆近邻(CKRNNs)和相机感知局部查询扩展(CLQE)的 CA-Jaccard 距离方法,从而显著提升了邻居样本的可靠性与重识别性能。
本文针对 5G 及未来网络中用户异构性导致的语义通信效率问题,提出了一种自适应语义通信(ASC)框架,并通过将联合用户关联与资源分配问题分解为三个子问题,设计了一种高效的多阶段算法以在满足能耗和时延约束下最大化系统效用。
本文通过研究维基百科“标记修订”系统的档案讨论及访谈,揭示了在重构基于社区的审核实践时,新系统即便在理论上可行或量化指标优异,仍可能因与既有社会规范冲突、平台与自治社区间复杂的互动关系以及高昂的维护与更替成本而面临重重挑战。
本文提出了一种名为 DivCon 的“分而治之”方法,通过将布局预测分解为推理与规划、将图像生成按难易程度分步合成,有效解决了现有文生图模型在复杂数值与空间关系下的可扩展性难题,并在 HRS 和 NSR-1K 基准测试中显著提升了多物体生成的质量与准确性。
本文全面综述了深度伪造生成与检测领域的最新进展,统一了任务定义、数据集与评估指标,系统分析了换脸、表情重演、说话人脸生成、面部属性编辑及伪造检测等四个代表性方向,并通过基准测试评估了主流方法,最后探讨了该领域面临的挑战与未来研究方向。