cs.LG articles | Gist.Science

Self-Attribution Bias: When AI Monitors Go Easy on Themselves

Cette étude révèle que les systèmes agentic souffrent d'un biais d'auto-attribution, où les modèles de langage évaluent moins sévèrement leurs propres actions lorsqu'elles sont présentées dans leur propre tour de conversation, ce qui fausse les évaluations de sécurité et de fiabilité en conditions réelles.

Dipika Khullar, Jack Hopkins, Rowan Wang + 1 more2026-03-06💻 cs

A Late-Fusion Multimodal AI Framework for Privacy-Preserving Deduplication in National Healthcare Data Environments

Cet article propose un cadre d'intelligence artificielle multimodal à fusion tardive qui détecte les doublons dans les données de santé nationales en utilisant des embeddings sémantiques, des comportements de connexion et des métadonnées d'appareils, garantissant ainsi la conformité à la vie privée sans recourir à des identifiants directs.

Mohammed Omer Shakeel Ahmed2026-03-06💻 cs

PDE foundation model-accelerated inverse estimation of system parameters in inertial confinement fusion

Cet article démontre qu'un modèle fondamental d'équations aux dérivées partielles (PDE), préentraîné sur le benchmark JAG et affiné pour l'inertial confinement fusion, permet d'estimer avec une grande précision les paramètres du système à partir d'observations multi-modales, surpassant les méthodes entraînées à partir de zéro, en particulier dans des régimes à faible quantité de données.

Mahindra Rautela, Alexander Scheinker, Bradley Love + 4 more2026-03-06🔬 physics

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Ce travail établit une équivalence variationnelle et basée sur le gradient entre l'algorithme K-Means et les réseaux de neurones à fonctions de base radiale, prouvant que les mises à jour des centres RBF convergent vers les règles K-Means tout en proposant l'intégration d'Entmax-1.5 pour assurer une stabilité numérique et permettre une optimisation conjointe des représentations et des clusters dans les architectures d'apprentissage profond.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

Cet article propose des algorithmes optimaux pour tester l'indépendance de distributions en intégrant des informations prédictives auxiliaires, garantissant une validité robuste dans le pire des cas tout en améliorant significativement l'efficacité de l'échantillonnage lorsque ces prédictions sont précises.

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

Spinverse: Differentiable Physics for Permeability-Aware Microstructure Reconstruction from Diffusion MRI

Spinverse est une méthode de reconstruction microstructurale pour l'IRM de diffusion qui utilise un simulateur de Bloch-Torrey entièrement différentiable pour inverser les mesures en optimisant les perméabilités des faces d'un maillage tétraédrique, permettant ainsi de découvrir des interfaces tissulaires explicites et perméables sans fixer leur topologie à l'avance.

Prathamesh Pradeep Khole, Mario M. Brenes, Zahra Kais Petiwala + 5 more2026-03-06💻 cs

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Cet article démontre que l'intégration de modèles de séquences temporelles, en particulier les Transformers, dans l'algorithme PPO permet d'atténuer les effets de la dérive des capteurs et des défaillances partielles, garantissant ainsi une robustesse supérieure et des performances stables dans des environnements de contrôle continu réalistes.

Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado + 4 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

Ce papier présente iAgentBench, un nouveau benchmark dynamique pour évaluer la capacité des agents à synthétiser des informations provenant de multiples sources sur des sujets d'actualité, comblant ainsi le fossé des évaluations actuelles qui se limitent souvent à la simple récupération de passages.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Neuro-Symbolic Financial Reasoning via Deterministic Fact Ledgers and Adversarial Low-Latency Hallucination Detector

Ce papier présente VeNRA, une architecture neuro-symbolique pour le raisonnement financier qui remplace la récupération textuelle probabiliste par un registre de faits déterministes et un détecteur d'hallucinations adversaire entraîné sur des erreurs écologiques simulées, afin d'assurer une précision mathématique absolue et une confiance opérationnelle nulle tolérance aux erreurs.

Pedram Agand2026-03-06💻 cs

Improving the accuracy of physics-informed neural networks via last-layer retraining

Cet article propose une méthode post-traitement par réentraînement de la dernière couche qui améliore considérablement la précision des réseaux de neurones informés par la physique (PINN) en réduisant les erreurs de quatre à cinq ordres de grandeur et en permettant le transfert d'apprentissage vers des problèmes complexes.

Saad Qadeer, Panos Stinis2026-03-06🔢 math

Direct Estimation of Tree Volume and Aboveground Biomass Using Deep Regression with Synthetic Lidar Data

Cette étude propose une méthode directe d'estimation du volume et de la biomasse aérienne des arbres à l'échelle de la parcelle en utilisant des réseaux de régression profonde entraînés sur des données lidar synthétiques, démontrant une précision nettement supérieure aux approches indirectes basées sur des modèles allométriques.

Habib Pourdelan, Zhengkang Xiang, Hugh Stewart + 3 more2026-03-06💻 cs

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

Cet article propose que la consolidation cérébrale optimise la généralisation en réduisant la complexité des représentations par un « oubli prédictif » sélectif, un processus de compression itérative hors ligne qui améliore les bornes théoriques de l'information et qui est validé par des simulations dans divers modèles neuronaux et linguistiques.

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Generalizing Fair Top- $k$ Selection: An Integrative Approach

Cet article propose une approche intégrative pour généraliser la sélection équitable top- $k$ à plusieurs groupes protégés en minimisant la disparité par rapport à une fonction de référence, en analysant la complexité computationnelle du problème et en introduisant une nouvelle mesure de perte d'utilité pour améliorer la stabilité des résultats sur des données réelles.

Guangya Cai2026-03-06💻 cs

Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Cet article présente TREDBench et une méthode d'adaptation de domaine guidée par les embeddings pour améliorer l'efficacité des modèles tabulaires fondationnels dans les régressions d'ingénierie en utilisant exclusivement des données synthétiques curatées, comblant ainsi le fossé entre les distributions synthétiques et les données réelles sans nécessiter d'échantillons d'ingénierie pour l'entraînement.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

Implicit Bias and Loss of Plasticity in Matrix Completion: Depth Promotes Low-Rankness

Cet article démontre que la profondeur dans la factorisation matricielle favorise un biais implicite vers les matrices de faible rang via des dynamiques couplées, ce qui explique à la fois la convergence vers des solutions de rang 1 et la capacité des modèles profonds à éviter la perte de plasticité observée dans les modèles peu profonds.

Baekrok Shin, Chulhee Yun2026-03-06💻 cs

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper

Cette étude démontre que l'utilisation de SAM-Audio pour débruiter la parole avant la transcription par Whisper, bien qu'améliorant la qualité acoustique, dégrade systématiquement les performances de reconnaissance automatique de la parole en mode zéro-shot, révélant ainsi un décalage fondamental entre la clarté perceptive pour l'humain et la robustesse pour la machine.

Akif Islam, Raufun Nahar, Md. Ekramul Hamid2026-03-06💻 cs

Probabilistic Dreaming for World Models

Cette étude propose des améliorations probabilistes au modèle Dreamer permettant l'exploration parallèle d'états latents et le maintien d'hypothèses distinctes pour des futurs mutuellement exclusifs, ce qui se traduit par de meilleures performances et une variance réduite sur le domaine MPE SimpleTag.

Gavin Wong2026-03-06💻 cs

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Cet article propose une approche hybride combinant modélisation théorique et benchmarking empirique pour déterminer l'allocation optimale des ressources de calcul dans les inférences LLM préfixées-décomposées, en tenant compte des contraintes de débit total, des objectifs de niveau de service (SLO) et des caractéristiques des requêtes.

Luchang Li, Dongfang Li, Bozhao Gong + 1 more2026-03-06🔢 math

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Cette étude présente une évaluation systématique des méthodes de compression de réseaux de neurones (élagage, quantification et distillation de connaissances) pour la classification d'images hyperspectrales, démontrant qu'elles permettent de réduire significativement la taille et le coût computationnel des modèles tout en maintenant des performances de classification compétitives pour le déploiement sur des plateformes à ressources limitées.

Sai Shi2026-03-06💻 cs

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Ce papier présente « Model Medicine », un cadre clinique novateur qui adapte les principes de la médecine biologique pour diagnostiquer, traiter et prévenir les dysfonctionnements des modèles d'IA grâce à une taxonomie structurée, un modèle comportemental empirique, un outil d'imagerie neuronale et des protocoles de soins standardisés.

Jihoon Jeong2026-03-06💻 cs

← Précédent Suivant →

cs.LG