Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Ce papier propose de remplacer la projection de sortie dense de l'attention par une transformée de Hadamard-Walch fixe et sans paramètres suivie d'une mise à l'échelle affine légère, réduisant ainsi significativement le nombre de paramètres et la consommation mémoire tout en maintenant, voire en améliorant, les performances et l'efficacité computationnelle des Transformers.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

Ce chapitre examine comment les modèles computationnels auto-supervisés et ancrés dans le visuel permettent d'expliquer l'acquisition précoce du langage à partir de la parole et de l'input audiovisuel sans recourir à des prérequis linguistiques forts, en reliant ces simulations de plus en plus réalistes aux données empiriques sur le développement infantile.

Okko Räsänen2026-03-10💬 cs.CL

Adaptive Loops and Memory in Transformers: Think Harder or Know More?

Cette étude propose des transformateurs combinant une boucle adaptative par couche et des banques de mémoire gating, démontrant que cette architecture améliore le raisonnement mathématique et les tâches de bon sens tout en surpassant des modèles iso-FLOP trois fois plus profonds, grâce à une spécialisation des couches où les premières itèrent peu et accèdent rarement à la mémoire tandis que les dernières le font intensivement.

Markus Frey, Behzad Shomali, Ali Hamza Bashir, David Berghaus, Mehdi Ali2026-03-10💬 cs.CL

COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling

Ce papier présente QUORUM, un cadre d'évaluation unifiant les perspectives des utilisateurs, experts et développeurs, et COACH, un pipeline piloté par les LLM pour générer des conseils de mode de vie personnalisés pour les patients cancéreux, démontrant ainsi la nécessité d'une évaluation multi-parties prenantes pour des systèmes de santé fiables et centrés sur le patient.

Yee Man Ng, Bram van Dijk, Pieter Beynen, Otto Boekesteijn, Joris Jansen, Gerard van Oortmerssen, Max van Duijn, Marco Spruit2026-03-10💬 cs.CL

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Ce papier présente ToCoRL, un cadre d'apprentissage par renforcement qui exploite la plasticité comportementale intrinsèque des grands modèles de langage via la génération conditionnelle par tokens pour stabiliser des modes de réponse adaptatifs sans dégrader leurs capacités.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale

Le papier présente Sandpiper, un système mixte combinant tableaux de bord interactifs et moteurs d'IA pour permettre l'analyse qualitative à grande échelle de discours éducatifs tout en garantissant la confidentialité des données, la rigueur méthodologique et la fiabilité des modèles.

Daryl Hedley, Doug Pietrzak, Jorge Dias, Ian Burden, Bakhtawar Ahtisham, Zhuqian Zhou, Kirk Vanacore, Josh Marland, Rachel Slama, Justin Reich, Kenneth Koedinger, René Kizilcec2026-03-10💬 cs.CL

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Cette étude de faisabilité prospective démontre qu'un système d'IA conversationnelle (AMIE) peut mener des entretiens cliniques en toute sécurité dans un cabinet de soins primaires, générant des diagnostics différentiels et des plans de prise en charge de qualité comparable à ceux des médecins, tout en étant bien accueilli par les patients et les cliniciens.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster est une méthode novatrice de gestion de cache KV qui améliore l'inférence des grands modèles de langage sur des contextes longs en utilisant un découpage sensible aux limites et un index hiérarchique récursif pour réduire la complexité de recherche de logarithmique, offrant ainsi une accélération jusqu'à 3,6 fois avec une perte de performance négligeable.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

Fanar-Sadiq: A Multi-Agent Architecture for Grounded Islamic QA

Ce papier présente Fanar-Sadiq, une architecture multi-agents bilingue (arabe/anglais) conçue pour répondre aux questions islamiques en évitant les hallucinations grâce à un routage intelligent, une vérification rigoureuse des citations scripturaires et des calculateurs déterministes pour le droit islamique, le tout étant déjà accessible publiquement avec près de 1,9 million d'utilisations.

Ummar Abbas, Mourad Ouzzani, Mohamed Y. Eltabakh, Omar Sinan, Gagan Bhatia, Hamdy Mubarak, Majd Hawasly, Mohammed Qusay Hashim, Kareem Darwish, Firoj Alam2026-03-10💬 cs.CL

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

Le papier présente Drift2Act, un contrôleur qui transforme la surveillance de la dérive de distribution en prise de décision contrainte en combinant une couche de détection avec un certificat de risque en ligne pour déclencher automatiquement des interventions adaptatives ou des arrêts de sécurité tout en respectant les contraintes de coût et de latence.

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

Le papier présente OfficeQA Pro, un nouveau benchmark évaluant la capacité des agents IA à effectuer un raisonnement ancré sur un vaste corpus hétérogène de documents du Trésor américain, révélant que même les modèles de pointe peinent à atteindre une fiabilité suffisante pour des applications d'entreprise sans une représentation structurée avancée des documents.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing Chen2026-03-10💬 cs.CL

How Far Can Unsupervised RLVR Scale LLM Training?

Cette étude analyse les limites théoriques et pratiques de l'apprentissage par renforcement non supervisé avec récompenses vérifiables (URLVR), révélant que les méthodes intrinsèques conduisent inévitablement à un effondrement du modèle lorsque la confiance initiale est mal alignée avec la justesse, tout en identifiant des pistes prometteuses via des récompenses externes basées sur l'asymétrie computationnelle.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG