Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Die Studie stellt VSOPINN vor, ein physik-informiertes neuronales Netzwerk, das durch eine differenzierbare Voronoi-Optimierung die Sensorplatzierung end-zu-end anpasst, um die Genauigkeit und Robustheit der Strömungsfeld-Rekonstruktion auch bei unvollständigen Messdaten und Sensorausfällen signifikant zu verbessern.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang Zhu2026-03-11🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

Die Arbeit stellt SPAARS vor, ein Curriculum-Learning-Framework für das Offline-zu-Online-Reinforcement-Learning, das die Exploration zunächst sicher in einem latenten Raum einschränkt und dann nahtlos in den rohen Aktionsraum übergeht, um die durch Decoder-Rekonstruktionsverluste bedingte Leistungsgrenze zu überwinden und gleichzeitig die Sample-Effizienz sowie die Stabilität zu steigern.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Diese Arbeit verbessert den räumlich-zeitlichen Matching-Algorithmus zur Zuordnung von GPS-Trajektorien zu Straßennetzen durch vier Modifikationen wie einen dynamischen Puffer und eine adaptive Beobachtungswahrscheinlichkeit, was zu einer signifikanten Steigerung der Recheneffizienz und der Pfadqualität bei Daten mit niedriger Abtastrate in dichten Umgebungen führt.

Ali Yousefian, Arianna Burzacchi, Simone Vantini2026-03-11🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Diese Arbeit analysiert systematisch den Einfluss von Markov-Entscheidungsprozess-Designentscheidungen auf die Sim-zu-Real-Übertragung beim Reinforcement Learning und zeigt anhand eines Farbmischungs-Experiments, dass physikbasierte Dynamikmodelle unter strengen Präzisionsanforderungen bis zu 50 % Erfolg auf realer Hardware ermöglichen, während vereinfachte Modelle versagen.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder Heieck2026-03-11🤖 cs.LG

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Diese Arbeit stellt Temporal-Conditioned Normalizing Flows (tcNF) vor, ein neues Framework zur Anomalieerkennung in multivariaten Zeitreihen, das durch die Bedingungung normalisierender Flüsse auf vorherige Beobachtungen komplexe zeitliche Abhängigkeiten modelliert und robuste Wahrscheinlichkeitsverteilungen für die Identifizierung von Anomalien liefert.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge

TrainDeeploy ist ein Framework, das die hardwarebeschleunigte, parameter-effiziente Feinabstimmung von kleinen Transformer- und CNN-Modellen direkt auf extrem ressourcenbeschränkten Edge-Geräten ermöglicht und damit erstmals einen vollständigen On-Device-Trainings-Pipeline für heterogene SoCs bereitstellt.

Run Wang, Victor J. B. Jung, Philip Wiese, Francesco Conti, Alessio Burrello, Luca Benini2026-03-11🤖 cs.LG

You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases

Die Studie zeigt, dass Sprachmodelle durch das Training auf semantisch treuen Umschreibungen subliminal Präferenzen von einem Lehrermodell übernehmen können, selbst wenn der Inhalt diese Präferenzen explizit widerspricht, was die Wirksamkeit rein inhaltsbasierter Sicherheitsfilter in Frage stellt.

Isaia Gisler (ETH Zürich), Zhonghao He (University of Cambridge), Tianyi Qiu (Peking University)2026-03-11🤖 cs.LG

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Die vorgestellte Arbeit stellt EDA vor, einen parameter- und dateneffizienten Rahmen zur Anpassung von Draft-Modellen, der durch eine entkoppelte Architektur, eine Strategie zur Datenregeneration und eine Stichprobenauswahl die Leistung des spekulativen Decodings bei feinabgestimmten Zielmodellen mit geringeren Trainingskosten wiederherstellt.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Die Arbeit führt BRACE ein, einen parameterfreien Algorithmus für Banditen mit Nichtkonformität, der durch eine klare Unterscheidung zwischen Empfehlungswohlfahrt und Behandlungseffekten sowie durch zertifizierte Intervalle sowohl die optimale Empfehlungsstrategie als auch die strukturell optimale Behandlungsstrategie unter Unsicherheit und schwacher Identifikation zuverlässig ermittelt.

Nicolás Della Penna2026-03-11🤖 cs.LG

Learning Bayesian and Markov Networks with an Unreliable Oracle

Die Arbeit untersucht das strukturelle Lernen von Markov- und Bayesianischen Netzwerken unter Verwendung eines unzuverlässigen Orakels und zeigt, dass Markov-Netzwerke auch bei moderat exponentiellen Fehlern identifizierbar sind, während Bayesianische Netzwerke selbst bei beschränkten Graphparametern keine Fehler tolerieren können, sofern eine eindeutige Identifizierbarkeit gewährleistet werden soll.

Juha Harviainen, Pekka Parviainen, Vidya Sagar Sharma2026-03-11🤖 cs.LG