Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

Die Arbeit stellt VNOIP vor, eine neuartige Methode auf Basis variationaler neuronaler gewöhnlicher Differentialgleichungen mit bidirektionalen Sprung-ODEs und Aufmerksamkeitsmechanismen, die durch die explizite Modellierung kontinuierlicher Zeitdynamiken und von Trendmustern die Vorhersage der Popularität von Informationen in sozialen Netzwerken verbessert.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang LiuWed, 11 Ma💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

Die Arbeit stellt SPAN-Nav vor, ein end-to-end Fundamentmodell, das durch eine neuartige kompakte räumliche Repräsentation und ein CoT-ähnliches Mechanismus robustes räumliches Bewusstsein für die vielseitige vision-sprachbasierte Navigation in komplexen Umgebungen ermöglicht und dabei auf einem massiven Datensatz trainiert wurde, um in verschiedenen Szenarien state-of-the-art Ergebnisse zu erzielen.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He WangWed, 11 Ma💻 cs

Optimal partition selection with Rényi differential privacy

Diese Arbeit verallgemeinert den optimalen Algorithmus für die Partitionsauswahl unter (ε,δ)(\varepsilon, \delta)-Differential Privacy auf den Rahmen der Rényi-Differential Privacy, stellt eine verbesserte Methode für den Fall mehrerer Partitionen pro Nutzer vor und zeigt auf, dass das gleichzeitige Freigeben von Partitionen und deren Häufigkeiten einen inhärenten Kostenfaktor darstellt.

Charlie Harrison, Pasin Pasin ManurangsiWed, 11 Ma💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

Die Arbeit stellt SAGE vor, das erste End-to-End-Modell für mehrmodiale große Sprachmodelle, das rohe Punktwolken direkt ohne vortrainierte 3D-Encoder verarbeitet, indem es diese durch einen leichten Tokenizer als „Fremdsprache" in den Wortschatz des LLM integriert und durch eine semantisch ausgerichtete Präferenzoptimierung überlegene Leistung bei 3D-Fragestellungen und Recheneffizienz erzielt.

Sneha Paul, Zachary Patterson, Nizar BouguilaWed, 11 Ma💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Das Paper stellt STONE vor, einen skalierbaren, multimodalen Datensatz für die Off-Road-Navigation, der durch eine vollautomatische, annotierungsfreie Pipeline 3D-Begehbarkeitskarten aus LiDAR-, Kamera- und Radardaten generiert und damit einen Benchmark für die Vorhersage von Begehbarkeit in komplexen Umgebungen schafft.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won ChoiWed, 11 Ma💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Die Studie stellt fest, dass LLM-gesteuerte Indexoptimierung zwar in bestimmten Fällen die Microsoft DTA-Verfahren übertreffen und menschliche Erkenntnisse liefern kann, ihre direkte Produktionseinführung jedoch aufgrund hoher Varianz, begrenzter Integrationsvorteile und hoher Validierungskosten derzeit noch herausfordernd bleibt.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Diese Arbeit stellt einen robusten Rahmen für die räumlich-zeitliche Bewegungsplanung beim autonomen Mehr-Agenten-Rennen vor, der durch die Identifizierung topologischer Lücken mittels SGPs und einen beschleunigten MPC-Lösungsansatz mit Pseudo-Transient-Continuation-Verfahren die Manöverzeit drastisch reduziert, die Überholungsrate in dichten Szenarien erhöht und die Rechenlatenz senkt.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei XieWed, 11 Ma💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Diese Arbeit stellt ein hierarchisches Observe-Orient-Decide-Act (H-OODA)-Framework vor, das durch die Integration von Cloud-Edge-Terminal-Schichten und Network Function Virtualization (NFV) die Entscheidungsfindung und Steuerung von UAV-Schwärmen in unsicheren Umgebungen verbessert, während gleichzeitig potenzielle Herausforderungen und zukünftige Forschungsrichtungen analysiert werden.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu HanWed, 11 Ma💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

Die Arbeit stellt WESPR vor, ein schnelles Framework, das geometrische Wahrnehmung und lokale Wetterdaten nutzt, um Windfelder vorherzusagen und so eine proaktive, windangepasste Pfadplanung und Steuerung für Quadrotoren zu ermöglichen, was zu einer signifikanten Verbesserung der Flugstabilität und Trajektorienabweichung führt.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap TokekarWed, 11 Ma💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Die vorgestellte Arbeit entwickelt einen geometrie-bewussten metrischen Lernansatz, der auf inter-joint Winkeln basiert, um die Herausforderungen der domänenbedingten Verschiebung bei der few-shot Erkennung von Gebärdensprachen über verschiedene Sprachen hinweg zu überwinden und dabei eine deutlich höhere Genauigkeit als herkömmliche Koordinaten-basierte Methoden zu erzielen.

Chayanin Chamachot, Kanokphan LertniponphanWed, 11 Ma💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Die Arbeit stellt PIM-SHERPA vor, eine rein softwarebasierte Methode, die durch die Einführung von DRAM-Doppelbuffering und online Gewichtsumordnung die Speicherattribut- und Layout-Inkonsistenzen bei der Inferenz von Large Language Models auf PIM-fähigen Endgeräten löst und dabei erhebliche Speichereinsparungen bei vergleichbarer Leistung ermöglicht.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon YuWed, 11 Ma💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

Das Paper stellt TubeMLLM vor, ein multimodales Fundamentmodell, das durch die Integration topologischer Vorwissen in eine gemeinsame Aufmerksamkeitsarchitektur und die Nutzung eines neuen Benchmarks (TubeMData) die topologische Konsistenz bei der Modellierung von Gefäßstrukturen in der medizinischen Bildgebung deutlich verbessert und dabei herausragende Zero-Shot-Leistung sowie Robustheit gegenüber Domänenverschiebungen und Bildstörungen aufweist.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun GuWed, 11 Ma💻 cs