cs.AI articles | Gist.Science

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

Le papier présente NasoVoce, une interface discrète montée sur le pont nasal qui fusionne des signaux acoustiques et vibratoires pour permettre une interaction vocale avec l'IA en tout temps, même dans des environnements bruyants ou lors de chuchotements.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

PC-Diffuser: Path-Consistent Capsule CBF Safety Filtering for Diffusion-Based Trajectory Planner

Le papier présente PC-Diffuser, un cadre de sécurité qui intègre une fonction barrière de capsule cohérente avec le chemin directement dans la boucle de débruitage d'un planificateur de trajectoire basé sur la diffusion, garantissant ainsi une génération de trajectoires sûre et géométriquement fidèle sans nécessiter de corrections a posteriori.

Eugene Ku, Yiwei Lyu2026-03-12🤖 cs.AI

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Cette étude systématique comparant les rerankers à raisonnement et non à raisonnement sur le dataset TREC 2022 démontre que l'intégration du raisonnement n'améliore ni ne détériore l'équité des résultats, révélant que les modèles actuels préservent les caractéristiques d'équité de leur classement d'entrée.

Saron Samuel, Benjamin Van Durme, Eugene Yang2026-03-12🤖 cs.AI

Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

Ce papier propose le cadre d'inférence sans entraînement et indépendant du modèle, appelé distillation visuelle à porte conceptuelle (CGVD), qui surmonte le « fossé précision-raisonnement » des modèles vision-langage-action dans des environnements encombrés en éliminant le bruit sémantique via l'inpainting de Fourier et en ciblant précisément les objets à manipuler, permettant ainsi d'atteindre un taux de réussite de 77,5 % contre 43,0 % pour les méthodes de l'état de l'art.

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick Thiyagarajan2026-03-12⚡ eess

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

Cet article présente FairFAL, un cadre d'apprentissage actif fédéré adaptatif qui surpasse les méthodes existantes dans des scénarios non-IID extrêmes et déséquilibrés en sélectionnant dynamiquement entre les modèles globaux et locaux et en intégrant des stratégies d'échantillonnage équitables pour les classes minoritaires.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

Cet article présente DIBJudge, un cadre d'affinement robuste qui atténue le biais de « translationese » dans les LLM multilingues en utilisant un goulot d'étranglement d'information désintriqué pour isoler les facteurs de biais et apprendre des représentations de jugement critiques.

Hongbin Zhang, Kehai Chen, Xuefen Bai, Youcheng Pan, Yang Xiang, Jinpeng Wang, Min Zhang2026-03-12💬 cs.CL

Utility Function is All You Need: LLM-based Congestion Control

Ce papier présente GenCC, un cadre exploitant les capacités de génération de code des grands modèles de langage pour concevoir automatiquement des fonctions d'utilité de contrôle de congestion, surpassant les protocoles actuels de 37 % à 142 % selon les scénarios.

Neta Rozen-Schiff, Liron Schiff, Stefan Schmid2026-03-12🤖 cs.AI

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

Ce papier présente HEAL, un cadre d'apprentissage sans renforcement qui surpasse les méthodes de distillation traditionnelles en surmontant la « limite de l'enseignant » grâce à une intervention active guidée par l'entropie, un filtrage rigoureux et une évolution progressive du curriculum inspirée de la zone de développement prochain.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Dynamic Knowledge Fusion for Multi-Domain Dialogue State Tracking

Cet article propose un cadre de fusion dynamique des connaissances en deux étapes, combinant un apprentissage contrastif et des prompts contextuels structurés, pour surmonter les défis du suivi d'état de dialogue multi-domaine et améliorer la précision ainsi que la généralisation des modèles.

Haoxiang Su, Ruiyu Fang, Liting Jiang, Xiaomeng Huang, Shuangyong Song2026-03-12💬 cs.CL

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Cet article propose une reformulation des systèmes de recommandation génératifs via deux nouvelles architectures (AttnLFA et AttnMVP) qui éliminent l'intercalage inefficace des jetons pour modéliser explicitement la causalité entre les éléments et les actions, permettant ainsi d'améliorer les performances tout en réduisant la complexité computationnelle et le temps d'entraînement.

Hailing Cheng2026-03-12🤖 cs.AI

Few-Shot Adaptation to Non-Stationary Environments via Latent Trend Embedding for Robotics

Cet article propose un cadre d'adaptation à quelques exemples pour les systèmes robotiques opérant dans des environnements non stationnaires, qui estime un identifiant de tendance latent régularisé temporellement pour compenser les changements de concept sans modifier les paramètres du modèle.

Yasuyuki Fujii (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Emika Kameda (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Hiroki Fukada (Production and Technology Department, NIPPN CORPORATION, Tokyo, Japan), Yoshiki Mori (University of Osaka, Osaka, Japan), Tadashi Matsuo (National Institute of Technology, Ichinoseki College, Iwate, Japan), Nobutaka Shimada (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan)2026-03-12🤖 cs.AI

Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas

Cette étude démontre que la co-écriture avec l'IA favorise une pratique de « rédaction réactive » où les auteurs, en évaluant d'abord les suggestions de l'IA plutôt qu'en développant leurs propres idées, adoptent involontairement les opinions de l'outil tout en conservant l'illusion d'un contrôle total sur leur texte.

Advait Bhat, Marianne Aubin Le Quéré, Mor Naaman, Maurice Jakesch2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Cet article propose les Graphes de Concepts Causaux (CCG), une méthode combinant des autoencodeurs épars et un apprentissage de structure différentiable pour cartographier les dépendances causales entre concepts dans l'espace latent des LLM, démontrant ainsi une supériorité significative sur les approches existantes pour le raisonnement étape par étape.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Cet article propose une nouvelle loi d'échelle généralisant la loi Chinchilla pour les modèles Mixture-of-Experts, en établissant une formule précise pour déterminer l'allocation optimale de calcul entre les couches d'attention et d'experts en fonction du budget de calcul et de la parcimonie.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

Le papier présente TRACED, un cadre d'évaluation qui analyse la fiabilité des LLM en décomposant leurs traces de raisonnement en termes de progression (déplacement) et de stabilité (courbure) pour distinguer les inférences correctes des hallucinations grâce à une approche géométrique.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Cet article présente un cadre de contrôle probabiliste sûr pour l'interaction humain-robot qui combine les fonctions de barrière de contrôle et le contrôle du risque conforme pour fournir des garanties formelles de sécurité, en ajustant dynamiquement les marges de sécurité afin de réduire significativement les collisions tout en maintenant une efficacité de navigation.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Cet article propose de nouvelles techniques d'élicitation d'incertitude basées sur les probabilités imprécises pour permettre aux grands modèles de langage de mieux exprimer et quantifier leur incertitude d'ordre supérieur, comblant ainsi les lacunes des cadres probabilistes classiques face à l'ambiguïté et à l'apprentissage contextuel.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Cet article analyse la dynamique d'apprentissage des réseaux linéaires à deux couches entraînés par descente de gradient stochastique avec du bruit d'étiquettes, révélant un comportement en deux phases où le bruit favorise la transition d'un régime « paresseux » vers un régime « riche » pour améliorer la généralisation, une découverte étendue à l'algorithme SAM et validée par des expériences.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Cet article propose l'algorithme PP-LUCB, qui combine des scores de modèles de langage et des audits humains ciblés pour identifier de manière optimale et économe la meilleure configuration de système de service malgré les biais systématiques des évaluations automatisées.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Cet article présente STemDist, une méthode innovante de distillation de données conçue spécifiquement pour les séries temporelles spatio-temporelles, qui comprime simultanément les dimensions spatiales et temporelles au niveau des clusters pour accélérer l'entraînement des modèles, réduire l'usage mémoire et améliorer la précision des prévisions par rapport aux méthodes existantes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

← Précédent Suivant →