cs.AI articles | Gist.Science

Does the Question Really Matter? Training-Free Data Selection for Vision-Language SFT

Ce papier présente CVS, une méthode de sélection de données sans entraînement qui identifie les échantillons nécessitant un raisonnement conjoint vision-langage en mesurant l'impact de la question sur la validité d'une réponse, permettant ainsi d'améliorer les performances des modèles tout en réduisant les coûts computationnels.

Peng Sun, Huawen Shen, Yi Ban, Tianfan Fu, Yanbo Wang, Yuqiang Li2026-03-11🤖 cs.AI

AutoAgent: Evolving Cognition and Elastic Memory Orchestration for Adaptive Agents

Le papier présente AutoAgent, un cadre multi-agents auto-évoluant qui intègre une cognition évolutive, une prise de décision contextuelle en temps réel et une orchestration de mémoire élastique pour surmonter les limites des agents autonomes statiques et améliorer leur adaptabilité dans des environnements dynamiques.

Xiaoxing Wang, Ning Liao, Shikun Wei, Chen Tang, Feiyu Xiong2026-03-11🤖 cs.AI

RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

Ce papier propose RbtAct, une méthode qui utilise les réactions des auteurs lors des révisions (rebuttals) comme supervision implicite pour entraîner un modèle à générer des critiques de recherche plus concrètes et exploitables, soutenue par un nouveau jeu de données RMR-75K et une tâche de génération de feedback conditionnée par la perspective.

Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman Cohan2026-03-11🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

Ce papier présente EXPLORE-Bench, un nouveau benchmark évaluant la capacité des modèles de langage multimodaux à prédire les scènes finales d'actions à long terme dans des vidéos à la première personne, révélant ainsi un écart significatif par rapport aux performances humaines et l'importance du raisonnement étape par étape.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha2026-03-11🤖 cs.AI

Ego: Embedding-Guided Personalization of Vision-Language Models

Ce papier propose une méthode efficace de personnalisation des modèles vision-langage qui exploite les mécanismes d'attention internes pour extraire des tokens visuels mémorisant des concepts spécifiques, permettant ainsi une adaptation performante sans étapes d'entraînement supplémentaires.

Soroush Seifi, Simon Gardier, Vaggelis Dorovatas, Daniel Olmeda Reino, Rahaf Aljundi2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

Le papier présente World2Mind, une boîte à outils d'intelligence spatiale sans entraînement qui améliore le raisonnement allocentrique des modèles fondationnels en construisant des cartes cognitives structurées et un arbre spatial allocentrique, permettant même aux modèles purement textuels d'atteindre des performances proches de celles des modèles multimodaux avancés.

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

Cette étude démontre que l'inférence basée sur la simulation (SBI) est une méthode prometteuse pour affiner les paramètres des modèles d'interactions neutrino-noyau, surpassant légèrement les réglages empiriques existants du générateur GENIE et permettant même une approximation équitable d'un autre simulateur, NuWro.

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe Cerati2026-03-11⚛️ hep-ph

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

Ce papier formalise le concept de « profondeur sérielle opaque » pour quantifier les limites du raisonnement interne des modèles de langage, propose une méthode automatisée pour calculer cette métrique et démontre que la chaîne de pensée est essentielle pour les architectures Transformer afin d'externaliser des raisonnements complexes.

Jonah Brown-Cohen, David Lindner, Rohin Shah2026-03-11🤖 cs.AI

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Cet article propose un cadre hybride quantique-classique combinant un réseau LSTM et une machine de naissance de circuit quantique (QCBM) pour améliorer la prévision de la volatilité financière, démontrant des performances supérieures aux modèles purement classiques sur des données réelles du marché chinois.

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Ce papier propose un schéma d'apprentissage fractionné adaptatif (ACP-SL) qui réduit la surcharge de communication en élaguant dynamiquement les canaux peu importants grâce à un score d'importance basé sur les étiquettes, tout en améliorant la précision et en accélérant la convergence.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Ce papier présente MITRA, un assistant IA basé sur la génération augmentée par récupération (RAG) et hébergé localement pour garantir la confidentialité, conçu afin d'aider les chercheurs des collaborations physiques à naviguer efficacement dans la vaste documentation interne en utilisant un pipeline automatisé d'extraction de texte et une architecture de base de données vectorielle à deux niveaux.

Abhishikth Mallampalli, Sridhara Dasu2026-03-11🤖 cs.AI

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Ce papier présente le « pseudo-projecteur », une modification légère inspirée du paradigme multigrille qui corrige les représentations cachées des modèles basés sur les transformateurs pour réduire leur sensibilité au bruit et améliorer la dynamique d'entraînement, sans altérer leur architecture de base.

Vitaly Bulgakov2026-03-11🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Cet article présente MA-EgoQA, un nouveau benchmark et une tâche de question-réponse conçus pour évaluer la capacité des modèles à comprendre et à agréger des flux vidéo égocentriques provenant de multiples agents incarnés, révélant ainsi les limites actuelles des approches dans ce domaine.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

Ce papier présente SCENEBench, une nouvelle suite de benchmarks conçue pour évaluer la compréhension audio des grands modèles linguistiques au-delà de la reconnaissance de la parole, en se concentrant sur des cas d'usage réels liés à l'accessibilité et à l'industrie, tout en révélant des lacunes critiques dans les performances actuelles des modèles.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Ce papier présente HR-GAT, un modèle de réseau d'attention graphique hiérarchique qui améliore la prédiction de la demande en spectre radioélectrique de 21 % par rapport aux modèles existants en exploitant des données géospatiales pour gérer efficacement les motifs spatiaux complexes.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Cet article présente le cadre DAPL, une méthode d'apprentissage par renforcement qui modélise explicitement les dynamiques induites par les contacts pour permettre à un robot d'acquérir une dextérité extrinsèque efficace dans des scènes encombrées, surpassant ainsi les approches existantes tant en simulation que dans le monde réel.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Cet article propose une nouvelle méthode d'apprentissage continu appelée LCA (Local Classifier Alignment), qui introduit une fonction de perte pour aligner les classifieurs spécifiques aux tâches avec le modèle de base, permettant ainsi de réduire l'oubli catastrophique et d'obtenir des performances supérieures aux méthodes actuelles sur plusieurs benchmarks.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Cet article propose un cadre novateur où les prompts sont paramétrés comme des actions au sein d'une politique légère pour influencer dynamiquement les comportements de dialogue des agents multi-agents basés sur les grands modèles de langage, sans nécessiter d'entraînement.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Le papier propose MSSR, un cadre de réentraînement adaptatif qui estime la force de mémoire des échantillons et planifie des révisions à intervalles variables pour atténuer l'oubli catastrophique lors du fine-tuning continu des grands modèles de langage, tout en maintenant une adaptation rapide et en surpassant les méthodes existantes.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Le papier présente MedMASLab, un cadre unifié et une plateforme de benchmarking conçus pour standardiser l'évaluation des systèmes multi-agents médicaux multimodaux en intégrant des protocoles de communication normalisés, un évaluateur de raisonnement clinique automatisé et un vaste ensemble de données couvrant 11 systèmes d'organes, tout en révélant des fragilités critiques dans la transition entre les sous-domaines médicaux spécialisés.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

← Précédent Suivant →