Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Deze paper introduceert een unificerend raamwerk dat kwantisatie en verduidelijking als additief ruis modelleert en een afgeleid denoising-dekwantisatietransform toepast om stabiele training van neurale netwerken op willekeurige precisie- en sparsiteitsniveaus mogelijk te maken, waardoor state-of-the-art resultaten worden behaald in ultra-lage precisie-regimes zoals A1W1.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

ARSGaussian: 3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis

Dit paper introduceert ARSGaussian, een innovatieve methode voor het synthetiseren van nieuwe beelden uit luchtfoto's die LiDAR-puntenwolken en aangepaste geometrische beperkingen combineert met 3D Gaussian Splatting om problemen zoals zwevende objecten en geometrische onnauwkeurigheden op te lossen, terwijl tegelijkertijd het nieuwe AIR-LONGYAN-dataset wordt vrijgegeven.

Yiling Yao, Bing Zhang, Wenjuan Zhang, Lianru Gao, Dailiang Peng, Bocheng Li, Yaning Wang, Bowen WangWed, 11 Ma💻 cs

A Survey on Wi-Fi Sensing Generalizability: Taxonomy, Techniques, Datasets, and Future Research Prospects

Dit survey biedt een uitgebreide overzicht van meer dan 200 publicaties over de generaliseerbaarheid van Wi-Fi-sensoren, waarbij het een gestructureerde taxonomie presenteert van technieken, datasets en toekomstige onderzoeksrichtingen om de robuustheid van deze systemen in verschillende omgevingen te verbeteren.

Fei Wang, Tingting Zhang, Wei Xi, Han Ding, Ge Wang, Di Zhang, Yuanhao Cui, Fan Liu, Jinsong Han, Jie Xu, Tony Xiao HanWed, 11 Ma💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

Dit paper introduceert MARRS, een nieuw framework dat gebruikmaakt van continue representaties en een Unit-distinguished Motion VAE met Action-Conditioned Fusion en Adaptive Unit Modulation om gecoördineerde en fijnmazige menselijke reactiebewegingen te synthetiseren, waarmee de beperkingen van vector-quantisatie en de complexiteit van bestaande autoregressieve modellen worden overwonnen.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong LiuWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

Dit paper introduceert SpikeSMOKE, een energiezuinige architectuur voor monokulaire 3D-objectdetectie die gebruikmaakt van spiking neurale netwerken en een nieuw Cross-Scale Gated Coding-mechanisme om de prestaties te verbeteren en het energieverbruik aanzienlijk te verlagen ten opzichte van bestaande methoden.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

Dit paper introduceert FieldLVLM, een nieuw raamwerk dat Large Vision-Language Models verbetert in het interpreteren van complexe stromingsvelddata door fysische kenmerken om te zetten in gestructureerde tekst en een data-compressiestrategie toe te passen, waardoor deze modellen aanzienlijk beter presteren in wetenschappelijke toepassingen.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs