Optimal partition selection with Rényi differential privacy

Diese Arbeit verallgemeinert den optimalen Algorithmus für die Partitionsauswahl unter (ε,δ)(\varepsilon, \delta)-Differential Privacy auf den Rahmen der Rényi-Differential Privacy, stellt eine verbesserte Methode für den Fall mehrerer Partitionen pro Nutzer vor und zeigt auf, dass das gleichzeitige Freigeben von Partitionen und deren Häufigkeiten einen inhärenten Kostenfaktor darstellt.

Charlie Harrison, Pasin Pasin Manurangsi2026-03-11💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

Die Arbeit stellt SAGE vor, das erste End-to-End-Modell für mehrmodiale große Sprachmodelle, das rohe Punktwolken direkt ohne vortrainierte 3D-Encoder verarbeitet, indem es diese durch einen leichten Tokenizer als „Fremdsprache" in den Wortschatz des LLM integriert und durch eine semantisch ausgerichtete Präferenzoptimierung überlegene Leistung bei 3D-Fragestellungen und Recheneffizienz erzielt.

Sneha Paul, Zachary Patterson, Nizar Bouguila2026-03-11💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Das Paper stellt STONE vor, einen skalierbaren, multimodalen Datensatz für die Off-Road-Navigation, der durch eine vollautomatische, annotierungsfreie Pipeline 3D-Begehbarkeitskarten aus LiDAR-, Kamera- und Radardaten generiert und damit einen Benchmark für die Vorhersage von Begehbarkeit in komplexen Umgebungen schafft.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won Choi2026-03-11💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Die Studie stellt fest, dass LLM-gesteuerte Indexoptimierung zwar in bestimmten Fällen die Microsoft DTA-Verfahren übertreffen und menschliche Erkenntnisse liefern kann, ihre direkte Produktionseinführung jedoch aufgrund hoher Varianz, begrenzter Integrationsvorteile und hoher Validierungskosten derzeit noch herausfordernd bleibt.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit Chaudhuri2026-03-11💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Diese Arbeit stellt einen robusten Rahmen für die räumlich-zeitliche Bewegungsplanung beim autonomen Mehr-Agenten-Rennen vor, der durch die Identifizierung topologischer Lücken mittels SGPs und einen beschleunigten MPC-Lösungsansatz mit Pseudo-Transient-Continuation-Verfahren die Manöverzeit drastisch reduziert, die Überholungsrate in dichten Szenarien erhöht und die Rechenlatenz senkt.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei Xie2026-03-11💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Diese Arbeit stellt ein hierarchisches Observe-Orient-Decide-Act (H-OODA)-Framework vor, das durch die Integration von Cloud-Edge-Terminal-Schichten und Network Function Virtualization (NFV) die Entscheidungsfindung und Steuerung von UAV-Schwärmen in unsicheren Umgebungen verbessert, während gleichzeitig potenzielle Herausforderungen und zukünftige Forschungsrichtungen analysiert werden.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu Han2026-03-11💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

Die Arbeit stellt WESPR vor, ein schnelles Framework, das geometrische Wahrnehmung und lokale Wetterdaten nutzt, um Windfelder vorherzusagen und so eine proaktive, windangepasste Pfadplanung und Steuerung für Quadrotoren zu ermöglichen, was zu einer signifikanten Verbesserung der Flugstabilität und Trajektorienabweichung führt.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap Tokekar2026-03-11💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Die vorgestellte Arbeit entwickelt einen geometrie-bewussten metrischen Lernansatz, der auf inter-joint Winkeln basiert, um die Herausforderungen der domänenbedingten Verschiebung bei der few-shot Erkennung von Gebärdensprachen über verschiedene Sprachen hinweg zu überwinden und dabei eine deutlich höhere Genauigkeit als herkömmliche Koordinaten-basierte Methoden zu erzielen.

Chayanin Chamachot, Kanokphan Lertniponphan2026-03-11💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Die Arbeit stellt PIM-SHERPA vor, eine rein softwarebasierte Methode, die durch die Einführung von DRAM-Doppelbuffering und online Gewichtsumordnung die Speicherattribut- und Layout-Inkonsistenzen bei der Inferenz von Large Language Models auf PIM-fähigen Endgeräten löst und dabei erhebliche Speichereinsparungen bei vergleichbarer Leistung ermöglicht.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon Yu2026-03-11💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

Das Paper stellt TubeMLLM vor, ein multimodales Fundamentmodell, das durch die Integration topologischer Vorwissen in eine gemeinsame Aufmerksamkeitsarchitektur und die Nutzung eines neuen Benchmarks (TubeMData) die topologische Konsistenz bei der Modellierung von Gefäßstrukturen in der medizinischen Bildgebung deutlich verbessert und dabei herausragende Zero-Shot-Leistung sowie Robustheit gegenüber Domänenverschiebungen und Bildstörungen aufweist.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun Gu2026-03-11💻 cs

Flash-KMeans: Fast and Memory-Efficient Exact K-Means

Die Arbeit stellt Flash-KMeans vor, eine GPU-basierte Implementierung des K-Means-Algorithmus, die durch innovative Kernel-Techniken wie FlashAssign und sort-inverse update IO-Engpässe und atomare Konflikte eliminiert und damit im Vergleich zu etablierten Bibliotheken wie cuML und FAISS Geschwindigkeitssteigerungen von bis zu 17,9-fach bis über 200-fach erzielt.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion Stoica2026-03-11💻 cs

RAE-NWM: Navigation World Model in Dense Visual Representation Space

Die Arbeit stellt RAE-NWM vor, ein Navigations-Weltmodell, das die Dynamik in einem dichten visuellen Repräsentationsraum (DINOv2) anstelle eines komprimierten latenten Raums modelliert und dabei einen Conditional Diffusion Transformer mit einem entkoppelten Kopf sowie einem zeitgesteuerten Gate-Modul nutzt, um die strukturelle Stabilität und die Genauigkeit der Aktionsvorhersage für die visuelle Navigation zu verbessern.

Mingkun Zhang, Wangtian Shen, Fan Zhang, Haijian Qin, Zihao Pei, Ziyang Meng2026-03-11💻 cs

When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection

Die vorgestellte Arbeit identifiziert das Problem des „semantischen Rückfalls" bei KI-generierten Bilderkennungssystemen und schlägt mit dem parametrenfreien Modul „Geometric Semantic Decoupling" (GSD) eine Lösung vor, die durch das Entfernen semantischer Komponenten die Generalisierungsfähigkeit und Robustheit gegenüber unbekannten Manipulationen signifikant verbessert.

Chao Shuai, Zhenguang Liu, Shaojing Fan, Bin Gong, Weichen Lian, Xiuli Bi, Zhongjie Ba, Kui Ren2026-03-11💻 cs