A comprehensive study of time-of-flight non-line-of-sight imaging
该论文通过建立统一的正向模型与硬件实验框架,对多种飞行时间非视域成像方法进行了系统性对比研究,揭示了现有方法在空间分辨率、可见性及噪声敏感性方面的共性局限与差异,旨在为未来该领域的客观评估提供基准参考。
6073 篇论文
该论文通过建立统一的正向模型与硬件实验框架,对多种飞行时间非视域成像方法进行了系统性对比研究,揭示了现有方法在空间分辨率、可见性及噪声敏感性方面的共性局限与差异,旨在为未来该领域的客观评估提供基准参考。
本文提出了名为 MASSE 的动态多客户端可搜索对称加密方案,该方案通过引入属性基访问控制扩展了 OXT 框架,在无需重加密数据库或进行大量交互的情况下,实现了支持细粒度授权、动态更新与撤销、且具备前后向隐私保护的高效安全搜索。
本文提出了 GeoSolver 框架,通过构建基于熵引导蒙特卡洛树搜索的大规模细粒度过程监督数据集 Geo-PRM-2M 及相应的过程奖励模型 GeoPRM,结合过程感知的树结构 GRPO 强化学习算法,有效解决了遥感视觉语言模型在复杂推理中的视觉忠实性瓶颈,实现了具有状态最先进性能的测试时推理扩展。
该研究通过在有限评估预算下对多机器人觅食场景的进化优化表明,尽管通用行为控制器能被成功优化,但任务专用控制器因协作效率低下而表现更差,从而证明在资源受限条件下任务专业化并不必然提升系统效率。
该论文提出了一种将自缠绕感知与隐式张力约束相结合的电缆牵引平面物体轨迹优化方法,通过构建包含三种松弛模式的优化框架,利用隐式模式松弛(IMR)在状态演化中主动利用自缠绕产生的力矩通道,从而避免了传统显式路由决策导致的保守解问题。
该论文通过证明由有界推导深度规则集生成的通用模型若包含任意大的竞赛图则必然蕴含自环查询,从而排除了此类结构作为“有界推导深度蕴含有限可控性”猜想反例的可能性,为该猜想的研究迈出了重要一步。
本文提出了 ReTac-ACT,一种通过双向交叉注意力、本体感知门控网络及触觉重建目标来实现视觉 - 触觉特征融合与动态切换的模仿学习策略,在 NIST 精密装配基准测试中显著超越了纯视觉及通用基线方法,实现了高达 90% 的插孔成功率及在 0.1 毫米工业级间隙下的稳健表现。
该论文提出了 GeoAlignCLIP 框架,通过多粒度语义对齐与模态内一致性学习,并辅以新构建的 RSFG-100k 细粒度遥感数据集,有效解决了现有遥感视觉 - 语言模型在细粒度细节捕捉上的不足,显著提升了复杂任务中的对齐精度与性能。
本文通过详细案例研究,展示了由异构 XRootD 虚拟机集群、BBR 拥塞控制算法及 TCP 扩展技术构成的 T2_BR_SPRACE 存储前端架构,在真实生产负载下成功实现了高达 51.3 Gb/s 的聚合吞吐量及单流 41.5 Gb/s 的传输峰值性能。
该论文提出了全景语言建模(PLM)范式,通过引入包含恶劣场景的大规模全景 VQA 数据集(PanoVQA)及一种无需重训练即可适配现有模型的即插即用稀疏注意力模块,实现了超越传统针孔图像拼接的全景整体空间与上下文推理能力。
该论文提出了 BinaryAttention,一种通过仅保留查询和键的符号并引入可学习偏置及量化感知训练来实现端到端加速的 1 比特 QK-注意力机制,其在 A100 显卡上的速度比 FlashAttention2 快两倍以上,且在视觉和扩散 Transformer 任务中能达到甚至超越全精度注意力的性能。
本文提出了一种仅依赖本体感知传感器的四足机器人安全运动框架,通过构建融合地形估计与状态感知的闭环系统,并利用控制障碍函数实现全局避障与局部防碰撞的严格安全保证。
本文通过博弈论建模,针对具有隐蔽性和多阶段特征的高级持续性威胁(APT),在攻击者拥有完全信息、完全盲视及概率信念三种不同信息情境下,研究了防御者在随机部署检测传感器以应对马尔可夫决策过程(MDP)驱动的攻击者时的最优防御策略。
本文提出了一种基于广义 Voronoi 图的多机器人非凸环境覆盖控制方法,通过结合考虑子区域质量差异的加权负载均衡算法与新型协同覆盖控制器,实现了多障碍物环境下的高效区域覆盖。
该论文提出了一种基于遗传编程的随机微分方程符号发现方法,通过联合优化漂移和扩散函数,实现了在含噪动态系统中对可解释随机动力学方程的准确恢复与推广。
本文提出了一种将敏捷实践与 AI 工程能力深度融合的项目式课程体系,通过让学生在实际迭代开发中运用生成式 AI 工具并反思人类责任,有效培养了其在 AI 驱动环境下的敏捷开发胜任力。
本文提出了 Nemo,一种专为闪存设备上的微小对象设计的低写放大缓存系统,它通过增加哈希碰撞概率来提升集合填充率,并结合基于布隆过滤器的索引与混合热度追踪机制,在显著降低应用级写放大的同时,实现了高内存效率和低缺失率。
该论文提出了 ParTY 框架,通过部分引导网络、部分感知文本对齐及整体 - 部分融合机制,有效解决了现有文本驱动运动生成方法在特定身体部位动作表达不足及全身运动不连贯的问题。
该论文提出了一种受人类扫视机制启发的图像分类方法,利用 DINO 视觉 Transformer 生成的注意力图来引导模型聚焦关键区域,在显著降低计算成本的同时保持了甚至超越了全图处理的分类性能。
该论文提出了一种基于物理驱动的零样本 3D 高斯渲染框架,通过嵌入组织物理属性的高斯参数和基于体渲染的信号建模,在无需配对数据的情况下实现了高效且高质量的 MRI 超分辨率重建。