VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

Die Arbeit stellt VidGuard-R1 vor, den ersten KI-generierten Video-Detektor, der durch den Einsatz von Group Relative Policy Optimization (GRPO) und spezialisierten Belohnungsmodellen nicht nur eine state-of-the-art Zero-Shot-Erkennungsgenauigkeit erreicht, sondern auch physikalisch fundierte, nachvollziehbare Erklärungen für seine forensischen Urteile liefert.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Diese Arbeit stellt B-ODIL vor, eine bayessche Erweiterung der Methode zur Optimierung eines diskreten Verlustes (ODIL), die physikalische PDE-Modelle als Prior mit Daten-Likelihoods kombiniert, um Lösungen für inverse Probleme mit quantifizierten Unsicherheiten zu liefern, wie beispielsweise bei der Schätzung von Tumorwachstum aus MRT-Daten.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Die Arbeit zeigt, dass bestehende Abwehrmechanismen gegen Control-Flow-Hijacking-Angriffe in Multi-Agent-Systemen aufgrund grundlegender Zielkonflikte und unvollständiger Kontextsicht umgangen werden können, und stellt darauf aufbauend ControlValve vor, eine neue Verteidigung, die auf dem Prinzip der Control-Flow-Integrität basiert und die Ausführung durch generierte Graphen sowie kontextuelle Regeln erzwingt.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

Die Arbeit stellt FMint-SDE vor, ein multimodales Basis-Modell auf Transformer-Basis, das durch In-Context-Learning und eine universelle Fehlerkorrektur auf Basis grober numerischer Lösungen eine überlegene Genauigkeit und Effizienz bei der Simulation stochastischer Differentialgleichungen in verschiedenen wissenschaftlichen Domänen ermöglicht.

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

MotionStream: Real-Time Video Generation with Interactive Motion Controls

Das Paper stellt MotionStream vor, ein Echtzeit-Video-Generierungsmodell, das durch die Destillation eines bidirektionalen Lehrmodells in einen kausalen Schüler und den Einsatz von gleitenden Fenster-Aufmerksamkeitsmechanismen interaktive, qualitativ hochwertige Videostreams mit subsekundärer Latenz und unbegrenzter Länge auf einer einzigen GPU ermöglicht.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

CytoNet: A Foundation Model for the Human Cerebral Cortex at Cellular Resolution

CytoNet ist ein auf 1 Million ungelabelter mikroskopischer Bildpatches trainiertes Fundamentmodell, das die zelluläre Architektur des menschlichen Großhirns in hoher Auflösung analysiert und so eine skalierbare Untersuchung der kortikalen Mikroarchitektur sowie deren Verknüpfung mit der makroskopischen Struktur-Funktions-Organisation ermöglicht.

Christian Schiffer, Zeynep Boztoprak, Jan-Oliver Kropp + 5 more2026-03-06💻 cs