Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling

Cet article présente une méthode de comptage automatisé des ravageurs dans des pièges à eau utilisant un bras robotique actif pour réduire les occlusions, où un système de contrôle en boucle fermée adaptatif optimise les motifs de brassage et la vitesse pour améliorer la précision et réduire le temps d'exécution par rapport aux méthodes statiques.

Xumin Gao, Mark Stevens, Grzegorz Cielniak2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

Ce papier présente CountFormer, un cadre de comptage d'objets sans exemple qui remplace l'encodeur d'image par le modèle fondation auto-supervisé DINOv2 pour améliorer la cohérence structurelle et réduire les erreurs de surcomptage liées aux répétitions visuelles, tout en obtenant des performances compétitives sur le jeu de données FSC-147.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Cet article propose une nouvelle méthode de détection des images générées par l'IA, appelée « reconstruction par rebond de diffusion », qui analyse la manière dont une image se réorganise sous l'effet d'une perturbation contrôlée par un modèle de diffusion, atteignant une précision exceptionnelle (AUROC de 0,993) pour distinguer les photographies authentiques des synthèses artificielles.

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Ce rapport présente Jr. AI Scientist, un système autonome capable de générer des contributions scientifiques novatrices en suivant un flux de travail de recherche complet, tout en évaluant ses performances supérieures aux systèmes existants et en identifiant les risques et limites critiques nécessitant une supervision humaine.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

MUGSQA: Novel Multi-Uncertainty-Based Gaussian Splatting Quality Assessment Method, Dataset, and Benchmarks

Cet article présente MUGSQA, une nouvelle méthode d'évaluation de la qualité basée sur l'incertitude multiple, accompagnée d'un jeu de données et de benchmarks conçus pour mesurer la robustesse des méthodes de Gaussian Splatting et la performance des métriques d'évaluation existantes face aux variations des données d'entrée.

Tianang Chen, Jian Jin, Shilv Cai, Zhuangzi Li, Weisi Lin2026-03-10💻 cs

Counting Through Occlusion: Framework for Open World Amodal Counting

Le papier présente CountOCC, un cadre de comptage amodal qui surpasse les méthodes actuelles en reconstruisant les caractéristiques des objets occlus grâce à une guidance multimodale hiérarchique et une nouvelle tâche d'équivalence visuelle, validé par des performances record sur des jeux de données augmentés avec occlusion.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Cet article propose une nouvelle méthode d'attaque par exemple adversaire pour les réseaux hyperboliques, baptisée « Angular Gradient Sign », qui exploite la géométrie de l'espace en se concentrant sur les composantes angulaires du gradient pour générer des perturbations plus efficaces et révéler des vulnérabilités spécifiques aux représentations hiérarchiques.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

Le papier présente Video2Layout, un cadre qui améliore le raisonnement spatial des modèles multimodaux en reconstruisant des cartes cognitives métriques basées sur des coordonnées continues plutôt que sur des grilles discrétisées, permettant ainsi des calculs quantitatifs plus précis et une réduction de l'ambiguïté dans la description des relations spatiales.

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Multi-Order Matching Network for Alignment-Free Depth Super-Resolution

Cet article présente MOMNet, un cadre novateur de super-résolution de profondeur sans alignement qui utilise un mécanisme de correspondance multi-ordre pour récupérer et agréger de manière adaptative les informations RGB pertinentes, surmontant ainsi les limitations des méthodes existantes face aux désalignements inhérents aux scénarios réels.

Zhengxue Wang, Zhiqiang Yan, Yuan Wu, Guangwei Gao, Xiang Li, Jian Yang2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

L'article présente UnfoldLDM, une méthode novatrice qui combine les réseaux de déroulement profond et les modèles de diffusion latents pour surmonter les limites des approches existantes en restauration d'images aveugle, grâce à un module d'estimation de dégradation multi-granulaire et un transformateur de correction des sur-lissages.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Le papier présente Yo'City, un cadre agentique innovant qui génère des scènes urbaines 3D réalistes, personnalisables et infiniment extensibles en combinant une planification hiérarchique, une synthèse d'images guidée par l'auto-critique et une expansion relationnelle, surpassant ainsi les méthodes existantes sur tous les aspects de la qualité de génération.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Cette étude présente ForamDeepSlice, un cadre d'apprentissage profond de haute précision qui utilise des tranches 2D de micro-CT pour classifier automatiquement les espèces de foraminifères avec une exactitude de 95,64 %, tout en offrant un tableau de bord interactif pour le déploiement pratique en géosciences.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG