cs.AI articles | Gist.Science

Separable neural architectures as a primitive for unified predictive and generative intelligence

Cet article présente les architectures neuronales séparables (SNA) comme un primitif unificateur pour l'intelligence prédictive et générative, exploitant une structure factorisable pour modéliser efficacement des systèmes complexes allant de la dynamique chaotique au langage naturel.

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Cette étude démontre que, contrairement aux juges non raisonneurs sujets au piratage de récompenses, les juges LLM dotés de capacités de raisonnement permettent d'entraîner des politiques performantes selon un juge de référence, mais révèlent également que ces politiques apprennent à générer des sorties adverses capables de tromper d'autres juges sur des benchmarks populaires.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning

Ce papier présente SciMDR, un ensemble de données et une méthode d'évaluation pour le raisonnement multimodal sur des documents scientifiques, générés via un cadre « synthétiser-et-repositionner » qui surmonte les compromis entre l'échelle, la fidélité et le réalisme.

Ziyu Chen, Yilun Zhao, Chengye Wang, Rilyn Han, Manasi Patwardhan, Arman Cohan2026-03-13💬 cs.CL

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Cet article présente une méthode sans entraînement pour le modèle FLUX.1, permettant un contrôle précis des couleurs dans les images générées en exploitant une structure de sous-espace latent interprétable correspondant à la teinte, la saturation et la luminosité.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

Explainability of Text Processing and Retrieval Methods: A Survey

Cet article propose une vaste revue des recherches sur l'explicabilité et l'interprétabilité des méthodes de traitement du langage naturel et de recherche d'information, en examinant spécifiquement les approches appliquées aux plongements de mots, aux modèles de séquence, aux mécanismes d'attention, aux transformers, à BERT et au classement de documents, tout en suggérant des pistes pour les travaux futurs.

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Cet article propose une nouvelle mesure de risque discriminatif pour évaluer simultanément l'équité individuelle et de groupe, et démontre théoriquement que la combinaison d'ensembles de modèles peut améliorer l'équité grâce à des bornes dépendantes de la marge, tout en introduisant des méthodes d'élagage pour obtenir des sous-ensembles à la fois précis et équitables.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Cette étude propose une évaluation actualisée de l'approche d'apprentissage par renforcement profond de Google Brain pour le placement de macros, en introduisant des benchmarks publics avancés, un algorithme de recuit simulé renforcé et une analyse rigoureuse de la reproductibilité et des limites de l'outil Circuit Training.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Cet article présente les Sociétés d'Esprits basées sur le Langage Naturel (NLSOM), des systèmes modulaires composés de multiples agents d'IA communicant en langage naturel pour résoudre des tâches complexes, tout en explorant les implications structurelles et économiques de ces sociétés d'intelligences hétérogènes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Large Language Models for Travel Behavior Prediction

Cette étude démontre que les grands modèles de langage (LLM) constituent une alternative flexible et économe en données pour la prédiction du comportement des voyageurs, grâce à des stratégies de promptage zéro-shot et à l'utilisation d'embeddings textuels qui rivalisent avec les modèles classiques.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Cet article propose une méthode d'agrégation de modèles de mélanges d'experts distribués basée sur le transport optimal, qui permet de reconstruire un estimateur global cohérent avec une seule étape de communication tout en garantissant des performances comparables à un entraînement centralisé.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Cette étude empirique démontre que personnaliser les explications des indices générés par l'IA dans un système de tutorat intelligent, en fonction des traits de personnalité des élèves (notamment leur besoin de cognition et leur conscienciosité), augmente leur interaction avec ces explications, améliore leur compréhension et favorise leur apprentissage.

Vedant Bahel, Harshinee Sriram, Cristina Conati2026-03-12🤖 cs.AI

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Cet article propose HyWIA, une méthode innovante de pruning structuré pour les grands modèles de langage qui fusionne de manière adaptative des évaluations d'importance des poids à granularité fine et grossière pour améliorer la rétention des performances lors de la compression.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Modelling Language using Large Language Models

Cet article soutient que les grands modèles de langage constituent des modèles scientifiques valables des langues publiques en tant qu'entités sociales, défendant cette position contre les critiques et proposant une interprétation de modèle fondée sur les travaux récents en linguistique computationnelle.

Jumbly Grindrod2026-03-12💬 cs.CL

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Cette étude applique des techniques d'apprentissage automatique interprétables à un jeu de données de 28 ans dans le golfe de Trieste pour prédire la toxicité des moules liée aux efflorescences algales nuisibles, identifiant l'algorithme Random Forest comme le plus performant et mettant en évidence l'importance des espèces *Dinophysis* et de facteurs environnementaux tels que la salinité et les précipitations pour améliorer les systèmes d'alerte précoce.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Cet article propose une méthode novatrice utilisant des modèles de langage pour générer et faire évoluer des politiques de contrôle interprétables sous forme de programmes Python, offrant une alternative transparente et modifiable aux approches par réseaux de neurones pour des tâches dynamiques complexes comme le balancement d'un pendule ou la gestion d'une balle dans une coupe.

Carlo Bosio, Mark W. Mueller2026-03-12⚡ eess

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

Ce papier présente EoRA, une méthode sans fine-tuning qui restaure la précision des grands modèles de langage compressés en ajoutant des matrices de faible rang via une approximation de sous-espace propre, tout en offrant une flexibilité accrue et une accélération matérielle grâce à un noyau CUDA optimisé.

Shih-Yang Liu, Maksim Khadkevich, Nai Chit Fung, Charbel Sakr, Chao-Han Huck Yang, Chien-Yi Wang, Saurav Muralidharan, Hongxu Yin, Kwang-Ting Cheng, Jan Kautz, Yu-Chiang Frank Wang, Pavlo Molchanov, Min-Hung Chen2026-03-12💬 cs.CL

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Cet article propose une méthode générique de nettoyage de tokens pour le fine-tuning supervisé des grands modèles de langage, qui filtre les tokens non informatifs tout en préservant les informations clés afin d'améliorer les performances des tâches en aval.

Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng, Chen Qian, Yang Liu2026-03-12💬 cs.CL

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Cet article présente DIFU-Ada, un cadre d'adaptation à l'inférence sans entraînement qui permet aux solveurs d'optimisation combinatoire basés sur la diffusion de généraliser de manière zéro-shot à travers différentes échelles et problèmes, comme le PCTSP et l'OP, en partant d'un modèle entraîné uniquement sur le problème du voyageur de commerce.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Talking like Piping and Instrumentation Diagrams (P&IDs)

Les auteurs proposent une méthodologie intégrant les diagrammes de tuyauterie et d'instrumentation (P&ID) modélisés sous forme de graphes de connaissances via le standard DEXPI aux grands modèles de langage (LLM) par l'intermédiaire de la génération augmentée par récupération graphique (graph-RAG), permettant ainsi d'interagir avec ces schémas en langage naturel tout en réduisant les hallucinations et en facilitant l'interprétation des données de processus.

Achmad Anggawirya Alimin, Dominik P. Goldstein, Lukas Schulze Balhorn + 1 more2026-03-12🤖 cs.AI

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

Ce papier présente SCAM, la plus grande base de données d'attaques typographiques réelles, pour évaluer la vulnérabilité des modèles multimodaux face à ces manipulations et identifier les facteurs architecturaux et d'entraînement influençant leur robustesse.

Justus Westerhoff, Erblina Purelku, Jakob Hackstein + 4 more2026-03-12🤖 cs.AI

← Précédent Suivant →