cs.LG articles | Gist.Science

Federated Inference: Toward Privacy-Preserving Collaborative and Incentivized Model Serving

Cet article propose une perspective unifiée sur l'inférence fédérée en la définissant comme un paradigme collaboratif distinct de l'apprentissage fédéré, qui permet à des modèles privés de coopérer lors de l'inférence tout en préservant la confidentialité des données et des paramètres, tout en identifiant les défis techniques et incitatifs nécessaires à sa mise en œuvre pratique.

Jungwon Seo, Ferhat Ozgur Catak, Chunming Rong + 1 more2026-03-05🤖 cs.AI

Structured vs. Unstructured Pruning: An Exponential Gap

Cet article démontre qu'il existe un écart exponentiel entre l'élagage structuré et non structuré en prouvant que l'approximation d'un neurone ReLU cible nécessite un nombre de neurones cachés proportionnel à la dimension $d$ pour l'élagage de neurones, contre une complexité logarithmique pour l'élagage de poids.

Davide Ferre', Frédéric Giroire, Frederik Mallmann-Trenn + 1 more2026-03-05🤖 cs.AI

A Unified Revisit of Temperature in Classification-Based Knowledge Distillation

Cet article propose une étude unifiée examinant systématiquement les interactions entre le paramètre de température et divers éléments d'entraînement dans la distillation de connaissances, afin d'identifier des situations clés guidant son choix optimal pour les praticiens.

Logan Frank, Jim Davis2026-03-05🤖 cs.LG

Causal Learning Should Embrace the Wisdom of the Crowd

Cet article propose un nouveau paradigme pour l'apprentissage causal qui, en intégrant le crowdsourcing, l'expertise humaine et les modèles de langage, vise à reconstruire des structures causales globales à partir des connaissances fragmentées et imparfaites d'agents distribués.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

Toward Early Quality Assessment of Text-to-Image Diffusion Models

Ce travail propose Probe-Select, un module plug-in qui évalue la qualité des images dès les premières étapes de la génération par diffusion ou matching de flux en exploitant les activations intermédiaires, permettant ainsi d'arrêter précocement les échantillons peu prometteurs et de réduire les coûts de calcul de plus de 60 % tout en améliorant la qualité finale.

Huanlei Guo, Hongxin Wei, Bingyi Jing2026-03-05🤖 cs.LG

Learning in Markov Decision Processes with Exogenous Dynamics

Cet article propose une méthode d'apprentissage par renforcement exploitant la structure des processus de décision markoviens à dynamiques exogènes pour obtenir des garanties de regret optimales et une efficacité d'échantillonnage nettement supérieure aux approches standard.

Davide Maran, Davide Salaorni, Marcello Restelli2026-03-05🤖 cs.LG

AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents

AriadneMem est un système de mémoire structuré pour les agents LLM qui améliore la précision des réponses multi-sauts et la gestion des mises à jour d'état tout en réduisant considérablement le temps d'exécution et l'utilisation du contexte, grâce à une approche en deux phases combinant filtrage, coalescence conflictuelle et découverte algorithmique de liens dans un graphe.

Wenhui Zhu, Xiwen Chen, Zhipeng Wang + 11 more2026-03-05🤖 cs.AI

Fine-Tuning and Evaluating Conversational AI for Agricultural Advisory

Cette étude présente une architecture hybride de modèles de langage, combinant un fine-tuning supervisé sur des faits agricoles vérifiés et une couche d'adaptation culturelle, qui améliore la fiabilité, la sécurité et le rapport coût-efficacité des systèmes d'avis agricoles pour les petits exploitants, tout en introduisant un cadre d'évaluation rigoureux et une bibliothèque de prompts open source.

Sanyam Singh, Naga Ganesh, Vineet Singh + 8 more2026-03-05🤖 cs.AI

TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement

Ce papier présente TTSR, un cadre d'entraînement auto-évolutif au moment du test qui améliore continuellement le raisonnement des grands modèles de langage en faisant alterner un même modèle pré-entraîné entre les rôles d'élève résolvant des problèmes et de professeur analysant les échecs pour générer des questions ciblées.

Haoyang He, Zihua Rong, Liangjie Zhao + 3 more2026-03-05🤖 cs.AI

From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings

Cet article explore les défis et les solutions du cache sémantique pour les embeddings de grands modèles de langage, en démontrant la complexité NP-difficile des politiques optimales hors ligne et en proposant des heuristiques efficaces qui améliorent la précision par rapport aux méthodes basées sur la fréquence.

Dvir David Biton, Roy Friedman2026-03-05🤖 cs.AI

Knowledge Graph and Hypergraph Transformers with Repository-Attention and Journey-Based Role Transport

Cet article propose une architecture dual-stream qui entraîne conjointement des données textuelles et structurées en séparant les représentations linguistiques et les connaissances via un dépôt de clés-valeurs accessible par un mécanisme d'attention conditionné par le transport de rôles basé sur des parcours, unifiant ainsi la navigation dans les graphes de connaissances et les hypergraphes.

Mahesh Godavarti2026-03-05🤖 cs.AI

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

Le papier propose la méthode DCCD, un processus d'inférence sans entraînement qui améliore la génération structurée en découplant la planification sémantique de l'application de contraintes syntaxiques, permettant ainsi d'obtenir une précision nettement supérieure et une efficacité accrue par rapport aux méthodes de décodage contraint standard.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Cet article propose un nouveau paradigme d'inférence appelé « inférence entropique-temps », qui remplace la progression linéaire par tokens par un processus thermodynamique auto-organisé où le décodage est piloté par le flux d'incertitude pour optimiser l'allocation des ressources computationnelles.

Andrew Kiruluta2026-03-05🤖 cs.LG

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Cet article propose CoIPO, une méthode d'optimisation des préférences inverses basée sur l'apprentissage contrastif qui améliore la robustesse intrinsèque des grands modèles de langage face aux variations de prompts en minimisant l'écart entre les logits générés par des prompts propres et bruyants, validée par de nouveaux benchmarks et jeux de données.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Ce papier présente M-QUEST, un cadre sémantique et un benchmark de 609 paires question-réponse conçus pour évaluer la capacité des modèles de langage à interpréter la toxicité des mèmes en intégrant dix dimensions clés, révélant que les modèles avec instruction tuning surpassent les autres tout en restant limités sur les inférences pragmatiques.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

L'article présente IntPro, un agent proxy qui améliore la compréhension contextuelle des intentions utilisateur en apprenant à adapter ses inférences à des modèles historiques individuels via un mécanisme de récupération et un entraînement par optimisation de politique.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

Cette étude évalue la robustesse de 13 grands modèles de langage face à cinq types de perturbations dans le raisonnement par chaîne de pensée, révélant des vulnérabilités hétérogènes où l'augmentation de la taille du modèle atténue certaines erreurs mathématiques mais offre une protection limitée contre les problèmes de conversion d'unités.

Ashwath Vaithinathan Aravindan, Mayank Kejriwal2026-03-05🤖 cs.AI

Prompt-Dependent Ranking of Large Language Models with Uncertainty Quantification

Cet article propose un cadre statistique pour générer des classements de modèles de langage robustes et dépendants du contexte, en quantifiant l'incertitude via des intervalles de confiance simultanés afin d'éviter les décisions erronées basées sur des différences de performance non significatives.

Angel Rodrigo Avelar Menendez, Yufeng Liu, Xiaowu Dai2026-03-05🤖 cs.LG

Neuro-Symbolic Decoding of Neural Activity

Le papier présente NEURONA, un cadre neuro-symbolique qui améliore le décodage de l'activité cérébrale à partir de l'IRMf et la généralisation à de nouvelles requêtes en intégrant des raisonnements structurels sur les concepts visuels.

Yanchen Wang, Joy Hsu, Ehsan Adeli + 1 more2026-03-05🤖 cs.AI

GreenPhase: A Green Learning Approach for Earthquake Phase Picking

Le papier présente GreenPhase, une approche d'apprentissage vert et interprétable qui améliore la détection et le choix des phases sismiques avec une précision exceptionnelle tout en réduisant considérablement les coûts de calcul par rapport aux modèles d'apprentissage profond traditionnels.

Yixing Wu, Shiou-Ya Wang, Dingyi Nie + 5 more2026-03-05🤖 cs.AI

← Précédent Suivant →