Scalable and Performant Data Loading

Dit paper introduceert SPDL, een open-source bibliotheek die de prestaties van GPU-data-laden aanzienlijk verbetert door de Python GIL te omzeilen, wat resulteert in een 74% snellere verwerking van ImageNet en een lagere CPU- en geheugengebruik vergeleken met PyTorch DataLoader.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

Dit paper introduceert MARRS, een nieuw framework dat gebruikmaakt van continue representaties en een Unit-distinguished Motion VAE met Action-Conditioned Fusion en Adaptive Unit Modulation om gecoördineerde en fijnmazige menselijke reactiebewegingen te synthetiseren, waarmee de beperkingen van vector-quantisatie en de complexiteit van bestaande autoregressieve modellen worden overwonnen.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong LiuWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

Dit paper introduceert SpikeSMOKE, een energiezuinige architectuur voor monokulaire 3D-objectdetectie die gebruikmaakt van spiking neurale netwerken en een nieuw Cross-Scale Gated Coding-mechanisme om de prestaties te verbeteren en het energieverbruik aanzienlijk te verlagen ten opzichte van bestaande methoden.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Deze paper introduceert een groot, langlopend dataset van meer dan 75 miljoen reacties en 400 miljoen stemmen uit de discussiefora van de Oostenrijkse krant DerStandard (2013-2022), waarbij gebruikersprivacy wordt gewaarborgd door geanonimiseerde ID's en het vrijgeven van vooraf berekende vectorrepresentaties in plaats van de ruwe tekst.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

Dit paper introduceert FieldLVLM, een nieuw raamwerk dat Large Vision-Language Models verbetert in het interpreteren van complexe stromingsvelddata door fysische kenmerken om te zetten in gestructureerde tekst en een data-compressiestrategie toe te passen, waardoor deze modellen aanzienlijk beter presteren in wetenschappelijke toepassingen.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs