Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Ce papier présente l'Adaptive Activation Cancellation (AAC), un cadre d'inférence en temps réel qui atténue les hallucinations des grands modèles de langage en identifiant et en supprimant sélectivement les activations neuronales associées aux erreurs factuelles, améliorant ainsi la précision sans altérer la fluidité ni les capacités générales du modèle.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Delta-K: Boosting Multi-Instance Generation via Cross-Attention Augmentation

Le papier présente Delta-K, un cadre d'inférence plug-and-play qui résout l'omission de concepts dans la génération d'images multi-instances en injectant dynamiquement des clés différentielles extraites par un modèle vision-langage dans l'espace d'attention croisée partagée, améliorant ainsi l'alignement compositionnel sans nécessiter de réentraînement ni de modifications architecturales.

Zitong Wang, Zijun Shen, Haohao Xu, Zhengjie Luo, Weibin Wu2026-03-12🤖 cs.AI

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Ce papier propose d'étendre la perte harmonique au-delà de la géométrie euclidienne en évaluant systématiquement diverses métriques de distance sur des modèles de vision et de langage, démontrant que l'utilisation de distances cosinus améliore la précision, la stabilité et la durabilité environnementale par rapport à la perte par entropie croisée.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

Learning from Radio using Variational Quantum RF Sensing

Cet article présente une méthode d'apprentissage environnemental utilisant une sonde de détection quantique optimisée par circuit pour exploiter les signaux radio, démontrant que cette approche permet une localisation précise sans mesures de canal, une sensibilité accrue aux signaux faibles et une performance supérieure à celle des méthodes classiques malgré une information disponible réduite.

Ivana Nikoloska2026-03-12⚛️ quant-ph

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

Ce papier présente DUCTILE, une approche d'orchestration agentic par LLM qui sépare l'adaptation des processus de l'exécution déterministe des outils d'ingénierie, permettant ainsi d'automatiser avec succès des tâches d'analyse structurelle dans l'industrie aérospatiale malgré des variations de données, tout en soulevant des questions sur l'évolution du rôle de supervision des ingénieurs.

Alejandro Pradas-Gomez, Arindam Brahma, Ola Isaksson2026-03-12🤖 cs.AI

Joint Imaging-ROI Representation Learning via Cross-View Contrastive Alignment for Brain Disorder Classification

Cet article propose un cadre d'apprentissage par contraste croisé unifié qui aligne les représentations globales d'imagerie cérébrale et locales de régions d'intérêt (ROI) dans un espace latent commun, démontrant que leur intégration conjointe améliore significativement la classification des troubles neurologiques par rapport à l'utilisation de ces modalités isolément.

Wei Liang, Lifang He2026-03-12🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

Cet article présente un système conçu par une approche centrée sur l'humain qui utilise l'intelligence artificielle conversationnelle et une carte interactive pour permettre au public d'explorer et d'interroger en langage naturel près de 1,7 million de spécimens numérisés des collections de sciences naturelles du Musée australien.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. Ahyong2026-03-12🤖 cs.AI