Quadrotor Navigation using Reinforcement Learning with Privileged Information

Cet article présente une méthode de navigation pour quadrotor basée sur l'apprentissage par renforcement qui, en exploitant des cartes de temps d'arrivée et une fonction de perte d'alignement de lacet, surpasse les méthodes existantes pour éviter de grands obstacles et a été validée avec succès lors de 20 vols réels en extérieur, jour et nuit, sans aucune collision.

Jonathan Lee, Abhishek Rathod, Kshitij Goel + 2 more2026-03-06💻 cs

BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

Le papier présente BridgeDrive, une nouvelle politique de planification de trajectoire en boucle fermée pour la conduite autonome qui utilise un pont de diffusion guidé par des ancêtres pour transformer de manière théoriquement cohérente des trajectoires grossières en plans précis, atteignant ainsi des performances de pointe sur le benchmark Bench2Drive.

Shu Liu, Wenlin Chen, Weihao Li + 7 more2026-03-06💻 cs

Continuous Space-Time Video Super-Resolution with 3D Fourier Fields

Cet article présente une nouvelle méthode de super-résolution vidéo spatio-temporelle continue basée sur des champs de Fourier 3D (VFF) qui, en évitant le décalage explicite des trames, permet un échantillonnage flexible à n'importe quelle résolution tout en garantissant une reconstruction sans repliement spectral et en surpassant l'état de l'art en termes de netteté, de cohérence temporelle et d'efficacité computationnelle.

Alexander Becker, Julius Erbach, Dominik Narnhofer + 1 more2026-03-06💻 cs

Weakly Supervised Cloud Detection Combining Spectral Features and Multi-Scale Deep Network

Cet article propose une méthode de détection des nuages faiblement supervisée, nommée SpecMCD, qui combine des caractéristiques spectrales et un réseau profond multi-échelle pour générer des masques de nuages précis au niveau des pixels, surpassant les méthodes existantes en termes de score F1 sur des images satellitaires multispectrales.

Shaocong Zhu, Zhiwei Li, Xinghua Li + 1 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

VidGuard-R1 est un détecteur de vidéos générées par IA innovant qui utilise l'optimisation de politique relative de groupe (GRPO) pour surmonter les limites des méthodes supervisées traditionnelles en identifiant des incohérences physiques complexes et en fournissant des explications forensiques interprétables avec des performances de pointe en zéro-shot.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

TerraCodec: Compressing Optical Earth Observation Data

Le papier présente TerraCodec, une famille de codecs appris préentraînés sur des données Sentinel-2 qui surpassent les méthodes classiques en compressant les images d'observation de la Terre grâce à une architecture temporelle innovante et une nouvelle méthode de « Latent Repacking » pour des débits flexibles, tout en permettant l'inpainting de nuages.

Julen Costa-Watanabe, Isabelle Wittmann, Benedikt Blumenstiel + 1 more2026-03-06💻 cs

DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights

Ce papier propose DRBD-Mamba, un modèle de segmentation 3D efficace et robuste pour les tumeurs cérébrales qui améliore la précision et l'efficacité computationnelle grâce à une architecture Mamba bidirectionnelle à double résolution et à des courbes de remplissage d'espace, tout en introduisant une évaluation rigoureuse sur des plis systématiques de BraTS2023.

Danish Ali, Ajmal Mian, Naveed Akhtar + 1 more2026-03-06💻 cs

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream est une méthode de génération vidéo en temps réel qui, grâce à une distillation de connaissances et une attention causale à fenêtre glissante, permet de produire des vidéos de qualité supérieure avec un contrôle interactif des mouvements et une latence sub-secondaire, rendant possible le streaming infini sur une seule carte graphique.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs