Robust Training of Neural Networks at Arbitrary Precision and Sparsity

该论文提出了一种将量化和稀疏化统一建模为加性噪声的框架,通过引入基于岭回归的去噪反量化变换来构建明确的梯度路径,从而解决了传统直通估计器在超低精度和稀疏训练中的不稳定性问题,实现了任意精度与稀疏度下的鲁棒训练并取得了最先进的性能。

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

Image Compression Using Novel View Synthesis Priors

该论文提出了一种利用先验任务信息和训练好的新视图合成模型,通过梯度下降优化潜在表示来生成可压缩差异的基于模型的图像压缩技术,旨在解决水下遥控机器人实时视觉反馈的带宽受限问题,并在人工海洋盆地数据集上验证了其优于现有方法的压缩率、图像质量及对场景中新物体的鲁棒性。

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

ARSGaussian: 3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis

该论文提出了 ARSGaussian 方法,通过引入 LiDAR 点云约束、畸变校正坐标变换及几何一致性损失,有效解决了航空遥感场景下 3D 高斯泼溅技术面临的浮点与过度生长问题,并发布了配套的 AIR-LONGYAN 数据集以推动高精度新视角合成研究。

Yiling Yao, Bing Zhang, Wenjuan Zhang, Lianru Gao, Dailiang Peng, Bocheng Li, Yaning Wang, Bowen WangWed, 11 Ma💻 cs

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

该论文提出了一种名为 iMarkers 的创新型隐形基准标记,旨在解决传统可见标记破坏环境美观的问题,通过专为机器人和 AR 设备设计的硬件与开源算法,实现了在保持视觉隐蔽性的同时具备高灵活性、鲁棒性及广泛适用性的导航与识别功能。

Ali Tourani, Deniz Isinsu Avsar, Hriday Bavle, Jose Luis Sanchez-Lopez, Jan Lagerwall, Holger VoosWed, 11 Ma💻 cs

A Survey on Wi-Fi Sensing Generalizability: Taxonomy, Techniques, Datasets, and Future Research Prospects

这篇综述论文系统回顾了 200 多篇关于 Wi-Fi 感知泛化性的文献,构建了涵盖从实验设置到模型部署的完整分类体系,深入分析了域适应、元学习等关键技术,总结了相关数据集,并提出了未来研究方向及数据集共享平台,旨在为提升 Wi-Fi 感知系统的泛化能力提供全面指南。

Fei Wang, Tingting Zhang, Wei Xi, Han Ding, Ge Wang, Di Zhang, Yuanhao Cui, Fan Liu, Jinsong Han, Jie Xu, Tony Xiao HanWed, 11 Ma💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

该论文针对现有局部 AI 生成图像检测数据集缺乏场景级编辑覆盖的局限,提出了包含 15 万张图像的大规模场景感知数据集 BR-Gen,并设计了基于噪声指纹引导的特征放大机制 NFA-ViT,通过增强异常特征与正常特征的交互显著提升了局部伪造检测的鲁棒性与泛化能力。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

该论文针对现有单源遥感目标检测在复杂环境下的局限性,提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR,并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet,显著提升了复杂场景下的检测精度。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei LuoWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本文提出了名为 SpikeSMOKE 的架构,通过引入受生物突触过滤机制启发的跨尺度门控编码(CSGC)和轻量级残差块,成功将低功耗的脉冲神经网络应用于单目 3D 目标检测,在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs