cs.AI articles | Gist.Science

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Cet article présente les Processus de Student-t Variationnels Épars (SVTP), un cadre novateur qui étend la méthode des points d'induction aux processus de Student-t pour offrir une modélisation robuste des queues lourdes et des valeurs aberrantes, surpassant les processus gaussiens épars en précision et en vitesse de convergence tout en restant efficace sur de grands jeux de données.

Jian Xu, Delu Zeng, John Paisley2026-03-11🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Ce papier propose un cadre unifié qui modélise la quantification et l'éparpillement comme du bruit additif et introduit une transformée de déquantification débruyante pour établir un chemin de gradient explicite, permettant ainsi l'entraînement robuste de réseaux de neurones à des précisions arbitraires et à des niveaux d'éparpillement extrêmes, y compris en dessous d'un bit.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew Howard2026-03-11🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

Le papier présente DRUPI, une méthode de condensation de dataset qui améliore l'efficacité de l'apprentissage en synthétisant, en plus des données réduites, des informations privilégiées (telles que des étiquettes de caractéristiques ou d'attention) servant de supervision auxiliaire.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng Zhang2026-03-11🤖 cs.AI

LAYOUTDREAMER: Physics-guided Layout for Text-to-3D Compositional Scene Generation

Le papier présente LayoutDreamer, un cadre innovant guidé par la physique et les graphes de scène qui utilise le 3D Gaussian Splatting pour générer des scènes 3D compositionnelles de haute qualité, physiquement plausibles et hautement contrôlables à partir de descriptions textuelles.

Yang Zhou, Zongjin He, Qixuan Li + 1 more2026-03-11🤖 cs.AI

Astromer 2

Ce papier présente Astromer 2, un modèle fondamental amélioré pour l'analyse de courbes de lumière qui, grâce à un pré-entraînement auto-supervisé sur 1,5 million de courbes et l'utilisation d'embeddings pondérés, surpasse significativement son prédécesseur Astromer 1 en classification, notamment dans des scénarios à données limitées.

Cristobal Donoso-Oliva, Ignacio Becker, Pavlos Protopapas + 3 more2026-03-11🔭 astro-ph

On the Impact of the Utility in Semivalue-based Data Valuation

Cet article propose une méthodologie pratique basée sur la notion de « signature spatiale » d'un ensemble de données pour évaluer et garantir la robustesse des évaluations de données par semi-valeurs face aux variations du choix de l'utilité.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick Loiseau2026-03-11🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

Le papier présente MKE-Coder, un nouveau cadre qui améliore le codage automatique des maladies (CIM) dans les dossiers médicaux électroniques chinois en intégrant des connaissances multi-axes et en vérifiant les preuves cliniques pour surmonter les défis linguistiques et structurels spécifiques.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji Wu2026-03-11🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

Ce papier présente LLM-Advisor, un cadre innovant utilisant des modèles de langage comme conseillers post-traitement pour optimiser l'efficacité énergétique de la planification de trajectoire robotique sur des terrains hétérogènes, comblant ainsi les lacunes en raisonnement spatial des LLMs seuls.

Ling Xiao, Toshihiko Yamasaki2026-03-11🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Le papier présente HyConEx, un classifieur basé sur des hyperréseaux conçu pour les données tabulaires, qui génère simultanément des prédictions et des explications locales sous forme d'exemples contrefactuels, comblant ainsi le vide laissé par l'absence de classifieurs interprétables produisant directement des échantillons contrefactuels.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek Smieja2026-03-11🤖 cs.AI

Logic Explanation of AI Classifiers by Categorical Explaining Functors

Cet article propose une approche théorique fondée sur la théorie des catégories, utilisant un « foncteur d'explication » pour garantir la cohérence et la fidélité des règles logiques extraites par les méthodes d'IA explicable, comblant ainsi le fossé entre les explications générées et le raisonnement réel des modèles opaques.

Stefano Fioravanti, Francesco Giannini, Paolo Frazzetto + 2 more2026-03-11🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Le papier présente GateLens, un agent LLM innovant qui utilise l'algèbre relationnelle comme représentation intermédiaire formelle pour améliorer la fiabilité et l'efficacité de l'analyse de données tabulaires complexes dans le secteur automobile, surpassant les approches traditionnelles tout en réduisant considérablement le temps d'analyse.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan Yu2026-03-11🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Cet article propose une critique conséquentialiste des méthodes d'évaluation binaire en machine learning, démontrant par une revue empirique et un nouveau cadre théorique que les règles de score appropriées comme le score Brier sont supérieures aux métriques à seuil fixe, tout en fournissant l'outil logiciel `briertools` et une variante tronquée pour faciliter leur adoption pratique.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. Wilson2026-03-11🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

Ce papier présente MCP Bridge, un proxy RESTful léger et agnostique aux LLM qui surmonte les limitations des implémentations MCP actuelles en permettant leur exécution sur des environnements contraints avec des contrôles de sécurité avancés, tout en démontrant qu'un modèle Qwen3 finement ajusté avec des techniques d'apprentissage par renforcement dépasse les performances des modèles baselines sur le benchmark MCPToolBench++.

Arash Ahmadi, Sarah Sharif, Yaser M. Banad2026-03-11🤖 cs.AI

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

L'article présente la SGPO, une méthode qui améliore l'optimisation par politique relative de groupe (GRPO) en intégrant un juge étape par étape pour exploiter les signaux d'apprentissage des groupes de réponses entièrement incorrects, comblant ainsi une lacune majeure de l'apprentissage par renforcement dans le raisonnement des grands modèles de langage.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi Lin2026-03-11🤖 cs.AI

Let's Verify Math Questions Step by Step

Ce papier présente MathQ-Verify, un pipeline à cinq étapes innovant qui valide rigoureusement la formulation des problèmes mathématiques pour filtrer les questions mal posées, améliorant ainsi la qualité des données d'entraînement et les performances des modèles de raisonnement.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao Zhang2026-03-11🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

L'article présente UltraEdit, une méthode de mise à jour des connaissances dans les grands modèles de langage qui, sans nécessiter de réentraînement, de suivi des sujets ni de mémoire externe, permet une édition en temps réel ultra-rapide et économe en ressources tout en supportant jusqu'à deux millions de modifications grâce à une stratégie de normalisation continue.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Le papier présente Saturn, un cadre d'apprentissage par renforcement basé sur les problèmes de satisfaisabilité booléenne (SAT) qui surmonte les limitations d'évolutivité, de vérification et de contrôle de difficulté des tâches existantes pour améliorer significativement les capacités de raisonnement des grands modèles de langage.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong Dong2026-03-11🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

Le papier présente Daily-Omni, un nouveau benchmark audio-visuel conçu pour évaluer la capacité des modèles de langage multimodaux à réaliser un raisonnement temporel synchronisé entre l'audio et la vidéo, révélant ainsi que les modèles actuels peinent encore à maîtriser cette alignement croisé essentiel.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang Jiang2026-03-11🤖 cs.AI

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Cet article présente la première revue systématique de l'intégration des modèles de fondation dans la robotique de service mobile, en analysant comment ces technologies surmontent les défis techniques et éthiques pour permettre une exécution de tâches adaptative et sûre dans des environnements réels.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Ce papier présente TSRating, un cadre unifié qui exploite le jugement de grands modèles de langage (LLM) et un apprentissage méta pour évaluer efficacement la qualité de données de séries temporelles provenant de domaines diversifiés, surpassant ainsi les méthodes existantes en précision et en adaptabilité.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong Ng2026-03-11🤖 cs.AI

← Précédent Suivant →