Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

L'article présente VNOIP, une méthode innovante utilisant des équations différentielles ordinaires neuronales variationnelles et des mécanismes d'attention pour prédire avec précision la popularité future de l'information dans les réseaux sociaux en modélisant explicitement la dynamique temporelle continue de ses tendances.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang LiuWed, 11 Ma💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

Le papier présente SPAN-Nav, un modèle fondamental de bout en bout qui améliore la navigation vision-langage en intégrant une conscience spatiale 3D généralisée via un token compact et un entraînement multi-tâches sur un vaste jeu de données, atteignant ainsi des performances de pointe sur divers benchmarks et dans des scénarios réels.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He WangWed, 11 Ma💻 cs

Optimal partition selection with Rényi differential privacy

Cet article généralise l'algorithme optimal de sélection de partitions sous (ε,δ)(\varepsilon, \delta)-DP vers le cadre de la confidentialité différentielle de Rényi (RDP), propose une extension améliorée pour les utilisateurs soumettant plusieurs partitions et démontre l'existence d'un coût inhérent à la publication simultanée des fréquences et des partitions.

Charlie Harrison, Pasin Pasin ManurangsiWed, 11 Ma💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Ce papier présente STONE, un ensemble de données multi-modal à grande échelle pour la navigation hors route, qui fournit des cartes de traversabilité 3D générées automatiquement sans annotation manuelle grâce à une fusion de LiDAR, de caméras et de radars, tout en établissant un nouveau benchmark pour la prédiction de traversabilité.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won ChoiWed, 11 Ma💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Cette étude évalue l'efficacité pratique du réglage d'index piloté par les grands modèles de langage (LLM) en le comparant à l'outil DTA de Microsoft, révélant que bien que les LLM puissent identifier des configurations supérieures dans certains cas, leur adoption en production reste limitée par une forte variabilité des performances et des coûts de validation élevés.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Ce papier propose un cadre de planification robuste pour la course autonome multi-agents, combinant l'identification topologique des opportunités de dépassement via des processus gaussiens et un MPC accéléré par un solveur PTC, permettant des manœuvres plus rapides et plus sûres avec une latence réduite sur la plateforme F1TENTH.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei XieWed, 11 Ma💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Cet article propose un cadre hiérarchique basé sur la boucle OODA (Observer-Orienter-Déterminer-Agir) réparti sur les couches cloud-edge-terminal et utilisant la virtualisation des fonctions réseau, afin d'améliorer l'autonomie décisionnelle et la coopération des essaims de drones dans des environnements incertains.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu HanWed, 11 Ma💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

Le papier présente WESPR, un cadre rapide qui intègre la perception géométrique et les données météorologiques locales pour prédire les champs de vent induits par l'environnement, permettant ainsi à un drone quadricoptère d'adapter proactivement sa planification de trajectoire et son contrôle pour améliorer la stabilité et réduire les déviations dans des conditions turbulentes.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap TokekarWed, 11 Ma💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Ce papier propose un cadre d'apprentissage métrique géométrique utilisant des descripteurs d'angles inter-articulaires invariants pour améliorer la reconnaissance de la langue des signes en contexte few-shot et cross-lingual, surpassant les méthodes basées sur les coordonnées normalisées grâce à une robustesse accrue face aux variations de vue et d'échelle.

Chayanin Chamachot, Kanokphan LertniponphanWed, 11 Ma💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Ce papier présente PIM-SHERPA, une méthode logicielle qui résout les incohérences d'attributs et de mise en page de la mémoire dans les systèmes PIM pour permettre une inférence efficace de grands modèles de langage sur appareil, en utilisant des techniques de double tamponnage ou de réorganisation en ligne pour économiser jusqu'à 49,7 % de capacité mémoire tout en maintenant des performances optimales.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon YuWed, 11 Ma💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

Le papier présente TubeMLLM, un modèle fondamental unifié qui améliore la perception et la génération d'anatomies vasculaires en intégrant des prières topologiques via des prompts naturels, démontrant ainsi des performances supérieures en généralisation hors distribution et en transfert cross-modalité sur le benchmark multimodal TubeMData.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun GuWed, 11 Ma💻 cs