Evaluating Long-Horizon Memory for Multi-Party Collaborative Dialogues

Ce papier présente EverMemBench, le premier benchmark conçu pour évaluer la mémoire à long terme des LLM dans des dialogues collaboratifs multi-parties réalistes, révélant ainsi les limites fondamentales des systèmes actuels en matière de raisonnement multi-hop, de gestion temporelle et de conscience contextuelle.

Chuanrui Hu, Tong Li, Xingze Gao, Hongda Chen, Yi Bai, Dannong Xu, Tianwei Lin, Xiaohong Li, Yunyun Han, Jian Pei, Yafeng Deng2026-03-12💬 cs.CL

Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

Ce papier présente DEFT, une méthode de génération de trajectoires basée sur des politiques de diffusion qui permet aux robots de continuer à accomplir leurs tâches de manière sûre et efficace même en cas de défaillances d'actionnement, surpassant les méthodes classiques tant en simulation que dans des scénarios réels.

Gilberto G. Briscoe-Martinez, Yaashia Gautam, Rahul Shetty, Anuj Pasricha, Marco M. Nicotra, Alessandro Roncone2026-03-12🤖 cs.AI

UniWeTok: An Unified Binary Tokenizer with Codebook Size 2128\mathit{2^{128}} for Unified Multimodal Large Language Model

Le papier présente UniWeTok, un tokeniseur binaire unifié doté d'un codebook massif de taille $2^{128}$ et d'une architecture hybride innovante, qui atteint des performances de pointe en génération et en compréhension multimodale tout en réduisant considérablement les coûts de calcul par rapport aux modèles existants.

Shaobin Zhuang, Yuang Ai, Jiaming Han, Weijia Mao, Xiaohui Li, Fangyikang Wang, Xiao Wang, Yan Li, Shanchuan Lin, Kun Xu, Zhenheng Yang, Huaibo Huang, Xiangyu Yue, Hao Chen, Yali Wang2026-03-12🤖 cs.AI

TikArt: Stabilizing Aperture-Guided Fine-Grained Visual Reasoning with Reinforcement Learning

Le papier présente TikArt, un agent multimodal entraîné par apprentissage par renforcement qui améliore le raisonnement visuel fin en intercalant la réflexion linguistique avec des actions de zoom et de segmentation pour acquérir séquentiellement des preuves locales, stabilisées par une récompense de réduction d'incertitude relative.

Hao Ding, Zhichuan Yang, Weijie Ge, Ziqin Gao, Chaoyi Lu, Lei Zhao2026-03-12🤖 cs.AI

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Cette étude démontre que des analystes IA autonomes peuvent reproduire à grande échelle la diversité analytique observée chez les humains, révélant ainsi une incertitude méthodologique significative et plaidant pour une nouvelle norme de transparence exigeant la divulgation des prompts et l'utilisation de rapports de type « multivers » pour les analyses générées par l'IA.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

PatchDenoiser: Parameter-efficient multi-scale patch learning and fusion denoiser for Low-dose CT imaging

Le papier présente PatchDenoiser, un cadre de débruitage ultra-léger et économe en énergie basé sur l'apprentissage multi-échelle de patches, qui surpasse les méthodes existantes en préservant les détails anatomiques tout en réduisant considérablement la complexité computationnelle et la consommation énergétique pour l'imagerie CT à faible dose.

Jitindra Fartiyal, Pedro Freire, Sergei K. Turitsyn, Sergei G. Solovski2026-03-12🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

Ce papier présente Hubscan, un scanner de sécurité open-source conçu pour détecter le « hubness poisoning » dans les systèmes de génération augmentée par récupération (RAG) en utilisant une architecture multi-détecteurs pour identifier les vecteurs malveillants qui faussent les résultats de recherche.

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany Saade2026-03-12🤖 cs.AI

AMLRIS: Alignment-aware Masked Learning for Referring Image Segmentation

Ce papier propose AMLRIS, une stratégie d'apprentissage masqué sensible à l'alignement qui améliore la segmentation d'images par référence en filtrant dynamiquement les pixels visuellement non alignés avec la description textuelle durant l'entraînement, atteignant ainsi des performances de pointe sur les benchmarks RefCOCO.

Tongfei Chen, Shuo Yang, Yuguang Yang, Linlin Yang, Runtang Guo, Changbai Li, He Long, Chunyu Xie, Dawei Leng, Baochang Zhang2026-03-12🤖 cs.AI

A Minimal Agent for Automated Theorem Proving

Les auteurs proposent une baseline minimale d'agent pour la preuve de théorèmes, intégrant les fonctionnalités essentielles des systèmes de pointe, qui démontre des performances compétitives avec une architecture plus simple et une meilleure efficacité d'échantillonnage grâce à une approche itérative, tout en étant disponible en open source.

Borja Requena, Austin Letson, Krystian Nowakowski, Izan Beltran Ferreiro, Leopoldo Sarra2026-03-12🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

Cette étude révèle que l'alignement de sécurité des grands modèles de langage entraîne un « biais de refus défensif », les amenant à rejeter injustement des requêtes légitimes de cybersécurité contenant des mots-clés sensibles, un problème aggravé par les justifications d'autorisation et particulièrement critique pour les agents de défense autonomes.

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q Knight2026-03-12🤖 cs.AI

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

Ce papier présente CARE, un cadre agentique qui améliore la responsabilité clinique dans le raisonnement médical multimodal en décomposant la tâche en modules spécialisés pour générer des preuves visuelles explicites et en utilisant un apprentissage par renforcement pour aligner les réponses sur ces preuves.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

Le papier présente BrandFusion, un cadre multi-agents innovant qui permet l'intégration transparente et contextuelle de marques dans des vidéos générées par texte, en surmontant les défis de fidélité sémantique et de reconnaissance de la marque pour ouvrir la voie à la monétisation durable de la génération vidéo.

Zihao Zhu, Ruotong Wang, Siwei Lyu, Min Zhang, Baoyuan Wu2026-03-12🤖 cs.AI