Transformer-Based Inpainting for Real-Time 3D Streaming in Sparse Multi-Camera Setups

Cet article propose une méthode d'inpainting basée sur les transformers et consciente de la multi-vue, conçue comme un module de post-traitement indépendant pour compléter en temps réel les textures manquantes dans les flux 3D issus de configurations de caméras multi-angles espacées, offrant ainsi un compromis optimal entre qualité visuelle et rapidité d'exécution.

Leif Van Holland, Domenic Zingsheim, Mana Takhsha + 4 more2026-03-06💻 cs

FireANTs: Adaptive Riemannian Optimization for Multi-Scale Diffeomorphic Matching

Le papier présente FireANTs, un algorithme d'optimisation riemannienne adaptative multi-échelle sans apprentissage qui accélère considérablement l'appariement d'images diféomorphes denses tout en réduisant l'utilisation de la mémoire et en assurant une robustesse supérieure par rapport aux méthodes traditionnelles et aux réseaux de neurones profonds.

Rohit Jena, Pratik Chaudhari, James C. Gee2026-03-05💻 cs

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

Le papier présente FlowCLAS, un cadre hybride qui améliore les flux normalisants pour la segmentation d'anomalies en robotique en combinant une fonction de perte de vraisemblance maximale avec un apprentissage contrastif basé sur l'exposition aux valeurs aberrantes, établissant ainsi de nouvelles performances de pointe sur plusieurs benchmarks.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

Building a Mind Palace: Structuring Environment-Grounded Semantic Graphs for Effective Long Video Analysis with LLMs

Ce papier présente VideoMindPalace, un nouveau cadre qui structure les moments clés des vidéos en graphes sémantiques topologiques inspirés de la « méthode des lieux » pour améliorer la compréhension des vidéos longues par les modèles de langage vision, accompagné d'un benchmark dédié pour évaluer le raisonnement humain.

Zeyi Huang, Yuyang Ji, Xiaofang Wang + 11 more2026-03-05💻 cs