cs.LG articles | Gist.Science

SaiVLA-0: Cerebrum--Pons--Cerebellum Tripartite Architecture for Compute-Aware Vision-Language-Action

Le papier présente SaiVLA-0, une architecture de vision-langage-action inspirée du cerveau, du pont et du cervelet, qui intègre des priors multimodaux stables, une adaptation proprioceptive et un décodage catégoriel rapide pour améliorer l'efficacité computationnelle et les performances de contrôle robotique.

Xiang Shi, Wenlong Huang, Menglin Zou, Xinhai Sun2026-03-10🤖 cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

Le papier présente FoleyFlow, une méthode innovante qui améliore la génération audio coordonnée à partir de vidéos en alignant les encodeurs audio-visuels via un apprentissage par masquage pour garantir la cohérence sémantique et rythmique, puis en utilisant un flux conditionnel dynamique pour générer l'audio.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Ce papier présente un cadre léger nommé TRIAGE qui décompose l'incertitude en composantes aléatoire et épistémique pour déclencher des réponses correctives spécifiques (récupération d'observation ou modération du contrôle) et optimiser l'efficacité computationnelle, améliorant ainsi significativement la réussite des tâches de manipulation robotique et la qualité de la perception adaptative.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Cet article présente une nouvelle méthode de surveillance de l'état explicable pour les transmissions d'hélicoptères, basée sur la détection probabiliste d'anomalies utilisant uniquement des données saines, qui permet de quantifier les incertitudes et d'améliorer l'interprétabilité des résultats pour des applications critiques.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

Ce papier présente SAGAD, un cadre évolutif et adaptatif pour la détection d'anomalies dans les graphes qui atténue les disparités d'homophilie et améliore l'efficacité computationnelle grâce à des filtres de Chebyshev reparamétrés, une fusion adaptative guidée par la structure et une perte d'orientation fréquentielle, surpassant ainsi les méthodes de l'état de l'art sur plusieurs benchmarks.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Le papier propose DARC, une méthode d'alignement sans réentraînement qui utilise un décodage à risque contraint pour gérer les désaccords humains et réduire les risques de queue tout en maintenant une qualité moyenne compétitive.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

Le framework Eventax, implémenté en JAX, résout le compromis entre flexibilité et précision dans l'entraînement des réseaux de neurones à spikes en combinant des solveurs d'EDO différentiables avec une gestion événementielle pour permettre le calcul de gradients exacts sur une large gamme de modèles de neurones complexes.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Cet article propose C²FG, une méthode d'entraînement gratuit et plug-in qui améliore la guidance sans classificateur en ajustant dynamiquement son poids via une fonction de décroissance exponentielle, fondée sur une analyse théorique rigoureuse des écarts de score au cours du processus de diffusion.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Cet article remet en question la prédominance des métriques d'erreur ponctuelle dans l'évaluation des prévisions de séries temporelles à long terme, en plaidant pour une approche multidimensionnelle intégrant la cohérence structurelle et la pertinence décisionnelle afin de dépasser une optimisation aveugle des classements de benchmarks.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Cet article propose une nouvelle méthode d'estimation des covariances de bruit pour les filtres de Kalman, nommée ALS-IRLS, qui combine un mécanisme de seuillage adaptatif et une approche de moindres carrés pondérés itératifs pour garantir une robustesse exceptionnelle aux valeurs aberrantes et améliorer considérablement la précision de l'estimation d'état.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Cet article présente TIER, une nouvelle méthode qui améliore l'apprentissage de représentations dans les réseaux riches en texte en construisant et en intégrant une taxonomie hiérarchique implicite via un apprentissage contrastif et un affinage par LLM, surpassant ainsi les approches existantes sur plusieurs jeux de données.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Ce rapport présente Covenant-72B, un modèle de langage de 72 milliards de paramètres pré-entraîné à l'échelle mondiale via une participation ouverte et sans permission soutenue par un protocole blockchain, démontrant ainsi la viabilité d'un entraînement décentralisé massif compétitif avec les approches centralisées.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

Cette étude démontre que le raisonnement en chaîne continu (Continuous Chain-of-Thought) surpasse le raisonnement explicite en termes de robustesse multilingue, notamment pour les langues à ressources limitées, tout en offrant une compression des traces de raisonnement de 29 à 50 fois.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

Le papier présente ALOOD, une méthode innovante qui exploite les représentations linguistiques d'un modèle vision-langage pour transformer la détection d'objets hors distribution (OOD) en LiDAR en une tâche de classification zéro-shot, améliorant ainsi la sécurité des systèmes de conduite autonome.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

Le papier présente AutoAdapt, un cadre automatisé de bout en bout qui améliore l'adaptation des grands modèles de langage à des domaines spécialisés en utilisant un système multi-agents de débat pour planifier les stratégies et un surrogate basé sur un LLM pour optimiser les hyperparamètres, surpassant ainsi les méthodes existantes de 25 % en précision.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

Le papier présente SERQ, une méthode de reconstruction d'erreurs à faible rang et sensible à la saillance qui permet une inférence efficace des grands modèles de langage en quantification 4 bits (W4A4 et W4A8) en atténuant les erreurs de quantification via une seule matrice de compensation, tout en minimisant la surcharge de calcul et la complexité de calibration.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Cette étude propose un cadre de résolution intégrant l'analyse des options réelles et un algorithme d'apprentissage par renforcement profond (TPPO) pour optimiser la conception séquentielle de régions de service sous contraintes de capacité et d'effets de débordement stochastiques, permettant ainsi de déterminer des stratégies d'investissement adaptatives et performantes face à l'incertitude de la demande.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

Cet article souligne les limites des métriques actuelles pour les modèles de fondation tabulaires en régression, qui ne mesurent que des estimations ponctuelles, et plaide pour l'intégration de règles de score appropriées comme le CRPS afin d'évaluer et d'optimiser les prédictions probabilistes complètes.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Cet article étend la méthode d'agrégation adaptative AsyncFedED en évaluant l'impact de différentes métriques de distance sur la robustesse et l'efficacité de l'apprentissage fédéré asynchrone face à la fraîcheur des gradients, aux clients hétérogènes et aux données non-IID.

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Cet article présente un opérateur neuronal basé sur le développement en chaos de Wiener et la modulation linéaire par caractéristiques (FiLM) capable de résoudre efficacement les équations aux dérivées partielles stochastiques singulières, notamment les modèles dynamiques $\boldsymbol{\Phi}^4_2$ et $\boldsymbol{\Phi}^4_3$ , sans recourir à des facteurs de renormalisation.

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

← Précédent Suivant →

cs.LG