Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Das Paper stellt Dream4Drive vor, ein neues Framework zur Erzeugung synthetischer, fotorealistischer Mehransichtsvideos mittels 3D-Assets und Weltmodellen, das speziell darauf ausgelegt ist, die Leistung von Wahrnehmungsmodellen im autonomen Fahren, insbesondere bei seltenen Randfällen, signifikant zu verbessern.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

Das Paper stellt HCLA vor, ein menschenzentriertes Multi-Agenten-System, das durch die Trennung von Evidenzbewertung und expertenähnlicher Begründung die Interpretierbarkeit und Rechenschaftspflicht bei der Erkennung anomaler Transaktionen digitaler Vermögenswerte verbessert, indem es algorithmische Befunde mit regulatorischen Urteilen in Einklang bringt.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

Das Paper stellt LagMemo vor, ein Navigationssystem, das eine 3D-Gauß-Splatting-Speichertechnologie mit Sprachdaten nutzt, um effiziente, offene und multimodale Zielsuche in komplexen Umgebungen zu ermöglichen, und wird durch den neu erstellten GOAT-Core-Datensatz rigoros evaluiert.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed ist ein in Rust implementiertes, produktionsreifes System, das durch statische Token-Lookups und Zero-Copy-Serialisierung Echtzeit-Text-Embeddings mit einer Latenz von 1,12 ms und 50.000 Anfragen pro Sekunde ermöglicht, wobei es bei Deduplizierungs- und Ähnlichkeitsaufgaben eine hohe Genauigkeit erreicht, jedoch bei komplexeren Klassifizierungsaufgaben hinter Transformer-basierten Modellen zurückbleibt.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Vectorized Online POMDP Planning

Das Paper stellt VOPP vor, einen vektorisierten Online-POMDP-Planer, der durch die Umwandlung aller Planungsdatenstrukturen in Tensoren und die vollständige Vektorisierung der Berechnungen massive Parallelisierung ohne Synchronisationsengpässe ermöglicht und damit sowohl effizientere Lösungen als auch eine um den Faktor 1000 reduzierte Planungsbudget-Nutzung im Vergleich zu bestehenden Solvern erreicht.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Diese Studie vergleicht die interpretierbare ANFIS-FBCSP-PSO-Methode mit dem Deep-Learning-Modell EEGNet zur Motor-Imagery-EEG-Klassifizierung und zeigt, dass das Fuzzy-Modell bei innerhalb-subjektiven Tests überlegen ist, während EEGNet eine bessere Generalisierung über verschiedene Probanden hinweg bietet, was eine gezielte Auswahl des Systems je nach Anforderung an Interpretierbarkeit oder Robustheit ermöglicht.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Das Paper stellt LAMP vor, ein Framework für sprachaugmentiertes Multi-Agenten-Reinforcement-Learning, das durch eine „Denken-Sprechen-Entscheiden"-Pipeline numerische Daten mit sprachlicher Analyse verbindet und in Wirtschaftssimulationen signifikant bessere Ergebnisse als herkömmliche MARL- oder reine LLM-Ansätze erzielt.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Die Arbeit stellt Yo'City vor, ein neuartiges agentic Framework, das mithilfe von Large Language Models eine personalisierte, hierarchisch geplante und unendlich erweiterbare Generierung realistischer 3D-Stadtlandschaften ermöglicht und dabei bestehende Methoden in allen Bewertungskriterien übertrifft.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

Enhancing low energy reconstruction and classification in KM3NeT/ORCA with transformers

Diese Studie verbessert die Rekonstruktion und Klassifizierung von Neutrinos im KM3NeT/ORCA-Teleskop durch den Einsatz von Transformern, die mittels physik- und detektorinspirierter Attention-Masks das Verständnis für das Detektordesign sowie die Neutrinophysik ermöglichen und zudem eine effiziente Feinabstimmung zwischen verschiedenen Konfigurationen unterstützen.

Iván Mozún Mateo (on behalf of the KM3NeT collaboration)2026-03-10🔭 astro-ph