Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Cet article propose une nouvelle méthode de détection des images générées par l'IA, appelée « reconstruction par rebond de diffusion », qui analyse la manière dont une image se réorganise sous l'effet d'une perturbation contrôlée par un modèle de diffusion, atteignant une précision exceptionnelle (AUROC de 0,993) pour distinguer les photographies authentiques des synthèses artificielles.

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

MUGSQA: Novel Multi-Uncertainty-Based Gaussian Splatting Quality Assessment Method, Dataset, and Benchmarks

Cet article présente MUGSQA, une nouvelle méthode d'évaluation de la qualité basée sur l'incertitude multiple, accompagnée d'un jeu de données et de benchmarks conçus pour mesurer la robustesse des méthodes de Gaussian Splatting et la performance des métriques d'évaluation existantes face aux variations des données d'entrée.

Tianang Chen, Jian Jin, Shilv Cai, Zhuangzi Li, Weisi Lin2026-03-10💻 cs

Counting Through Occlusion: Framework for Open World Amodal Counting

Le papier présente CountOCC, un cadre de comptage amodal qui surpasse les méthodes actuelles en reconstruisant les caractéristiques des objets occlus grâce à une guidance multimodale hiérarchique et une nouvelle tâche d'équivalence visuelle, validé par des performances record sur des jeux de données augmentés avec occlusion.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Cet article présente LAMP, un cadre d'apprentissage par renforcement multi-agent enrichi par le langage qui intègre un pipeline de réflexion, d'expression et de décision pour optimiser les stratégies économiques en fusionnant données chiffrées et analyse sémantique, surpassant ainsi les méthodes existantes en termes de rentabilité, de robustesse et d'interprétabilité.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

Le papier présente Video2Layout, un cadre qui améliore le raisonnement spatial des modèles multimodaux en reconstruisant des cartes cognitives métriques basées sur des coordonnées continues plutôt que sur des grilles discrétisées, permettant ainsi des calculs quantitatifs plus précis et une réduction de l'ambiguïté dans la description des relations spatiales.

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Multi-Order Matching Network for Alignment-Free Depth Super-Resolution

Cet article présente MOMNet, un cadre novateur de super-résolution de profondeur sans alignement qui utilise un mécanisme de correspondance multi-ordre pour récupérer et agréger de manière adaptative les informations RGB pertinentes, surmontant ainsi les limitations des méthodes existantes face aux désalignements inhérents aux scénarios réels.

Zhengxue Wang, Zhiqiang Yan, Yuan Wu, Guangwei Gao, Xiang Li, Jian Yang2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

L'article présente UnfoldLDM, une méthode novatrice qui combine les réseaux de déroulement profond et les modèles de diffusion latents pour surmonter les limites des approches existantes en restauration d'images aveugle, grâce à un module d'estimation de dégradation multi-granulaire et un transformateur de correction des sur-lissages.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Le papier présente Yo'City, un cadre agentique innovant qui génère des scènes urbaines 3D réalistes, personnalisables et infiniment extensibles en combinant une planification hiérarchique, une synthèse d'images guidée par l'auto-critique et une expansion relationnelle, surpassant ainsi les méthodes existantes sur tous les aspects de la qualité de génération.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Cet article présente un cadre multi-agents assisté par un grand modèle de langage (LLM) qui automatise la conception et l'adaptation des systèmes de contrôle pour la fabrication en continu (roll-to-roll), garantissant la sécurité et réduisant l'effort de réglage manuel grâce à une validation expérimentale réussie.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs