cs.AI articles | Gist.Science

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Ce papier présente HR-GAT, un modèle de réseau d'attention graphique hiérarchique qui améliore la prédiction de la demande en spectre radioélectrique de 21 % par rapport aux modèles existants en exploitant des données géospatiales pour gérer efficacement les motifs spatiaux complexes.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Cet article présente le cadre DAPL, une méthode d'apprentissage par renforcement qui modélise explicitement les dynamiques induites par les contacts pour permettre à un robot d'acquérir une dextérité extrinsèque efficace dans des scènes encombrées, surpassant ainsi les approches existantes tant en simulation que dans le monde réel.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Cet article propose une nouvelle méthode d'apprentissage continu appelée LCA (Local Classifier Alignment), qui introduit une fonction de perte pour aligner les classifieurs spécifiques aux tâches avec le modèle de base, permettant ainsi de réduire l'oubli catastrophique et d'obtenir des performances supérieures aux méthodes actuelles sur plusieurs benchmarks.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Cet article propose un cadre novateur où les prompts sont paramétrés comme des actions au sein d'une politique légère pour influencer dynamiquement les comportements de dialogue des agents multi-agents basés sur les grands modèles de langage, sans nécessiter d'entraînement.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Le papier propose MSSR, un cadre de réentraînement adaptatif qui estime la force de mémoire des échantillons et planifie des révisions à intervalles variables pour atténuer l'oubli catastrophique lors du fine-tuning continu des grands modèles de langage, tout en maintenant une adaptation rapide et en surpassant les méthodes existantes.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Le papier présente MedMASLab, un cadre unifié et une plateforme de benchmarking conçus pour standardiser l'évaluation des systèmes multi-agents médicaux multimodaux en intégrant des protocoles de communication normalisés, un évaluateur de raisonnement clinique automatisé et un vaste ensemble de données couvrant 11 systèmes d'organes, tout en révélant des fragilités critiques dans la transition entre les sous-domaines médicaux spécialisés.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Cet article présente une approche pilotée par l'intelligence artificielle et les données pour estimer la demande en spectre radioélectrique, validée sur cinq villes canadiennes, afin d'aider les régulateurs à optimiser l'allocation des ressources et la planification dynamique.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Ce papier présente ACADiff, un cadre de diffusion latente adaptatif et conscient des données cliniques qui synthétise avec succès les modalités d'imagerie cérébrale manquantes (sMRI, FDG-PET, AV45-PET) pour améliorer le diagnostic de la maladie d'Alzheimer, même dans des scénarios extrêmes de données incomplètes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Cet article propose une méthodologie axée sur les données et l'apprentissage automatique pour estimer les variations de la demande spectrale dans les régions urbaines canadiennes, permettant ainsi aux régulateurs de mieux concevoir des politiques d'accès flexible au spectre pour les réseaux 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Le papier présente PathMem, un cadre multimodal centré sur la mémoire qui imite le processus cognitif des pathologistes en organisant les connaissances structurées en mémoire à long terme et en les activant dynamiquement via un Memory Transformer pour améliorer la précision et l'interprétabilité des diagnostics en pathologie computationnelle.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Le papier propose k-MTR, un cadre d'apprentissage de représentations en espace k qui aligne les données sous-échantillonnées directement avec des étiquettes physiologiques pour permettre une analyse cardiaque multi-tâches précise sans passer par une reconstruction d'image intermédiaire.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Cet article établit que l'abstention basée sur la confiance améliore systématiquement la qualité des décisions triées uniquement en cas d'incertitude structurelle, mais échoue souvent face à l'incertitude contextuelle, soulignant la nécessité d'adapter les signaux de confiance au type d'incertitude dominant avant le déploiement.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Cette étude propose l'indicateur de surapprentissage-sous-apprentissage (OUI) comme un signal structurel précoce et efficace pour discriminer les taux d'apprentissage optimaux dans les algorithmes PPO, permettant d'identifier et d'élaguer les entraînements instables bien avant la convergence finale.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Cet article présente les « neural debuggers », des modèles de langage capables d'émuler les fonctionnalités interactives des débogueurs traditionnels pour prédire l'exécution de programmes Python, ouvrant ainsi la voie à des systèmes de codage autonomes plus performants.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Contrairement aux humains qui deviennent moins honnêtes lorsqu'ils réfléchissent, cette étude démontre que le processus de raisonnement améliore systématiquement l'honnêteté des grands modèles de langage en les amenant à traverser un espace de représentation où les réponses honnêtes sont plus stables que les réponses trompeuses.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Le papier propose BEACON, une méthode qui améliore la navigation robotique conditionnée par le langage en présence d'obstacles en prédisant une carte de chaleur d'affordance en vue aérienne (BEV) à partir d'observations RGB-D et d'instructions textuelles, surpassant ainsi les approches basées sur l'espace image pour localiser des cibles occluses.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Cet article étend l'équation des abeilles à un modèle basé sur des agents où la valence et l'éveil émotionnels modulent les taux d'interaction, démontrant ainsi comment la contagion émotionnelle et les points de bascule structurels influencent la formation du consensus dans les décisions collectives.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Cette étude présente un guide alimenté par un modèle de langage de grande taille pour rendre la réalité virtuelle accessible aux personnes aveugles ou malvoyantes, révélant que leur interaction avec ce guide évolue d'une relation utilitaire à une relation compagnonnage lorsqu'ils sont en présence d'autres utilisateurs.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

En introduisant le cadre contrôlé de la superposition de type « sac de mots » (BOWS), cette étude démontre que les corrélations entre caractéristiques permettent d'organiser géométriquement les interférences de manière constructive dans les réseaux de neurones, expliquant ainsi la formation de clusters sémantiques et de structures cycliques observées dans les modèles de langage réels, ce que la vision traditionnelle de la superposition basée sur des caractéristiques non corrélées ne parvenait pas à prédire.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Cet article présente deux approches de détection de points de changement basées sur les réseaux de neurones et l'apprentissage en ligne, qui offrent une complexité computationnelle linéaire, surpassent les méthodes existantes sur divers jeux de données et garantissent une convergence vers des solutions optimales.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

← Précédent Suivant →