cs.LG articles | Gist.Science

CRESTomics: Analyzing Carotid Plaques in the CREST-2 Trial with a New Additive Classification Model

Cette étude présente CRESTomics, un nouveau modèle additif à noyau intégrant une perte de cohérence et une régularisation parcimonieuse de groupe, qui analyse 500 plaques carotidiennes de l'essai CREST-2 pour identifier de manière précise et interprétable des marqueurs radiomiques liés au risque clinique élevé.

Pranav Kulkarni, Brajesh K. Lal, Georges Jreij + 11 more2026-03-05🤖 cs.AI

World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Cette étude démontre que la récupération linéaire de structures spatiales et temporelles dans les représentations internes des modèles de langage ne prouve pas l'existence de modèles du monde internes, car une grande partie de cette structure est déjà latente dans les statistiques de co-occurrence des mots des embeddings statiques.

Elan Barenholtz2026-03-05🤖 cs.AI

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Le papier présente PTOPOFL, un cadre d'apprentissage fédéré personnalisé qui remplace l'échange de gradients par des descripteurs topologiques issus de l'homologie persistante pour garantir une confidentialité accrue et améliorer la convergence dans des environnements de données non indépendants et non identiquement distribués (non-IID).

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

Scalable Evaluation of the Realism of Synthetic Environmental Augmentations in Images

Cette étude présente un cadre évolutif démontrant que les modèles d'IA générative surpassent largement les méthodes d'augmentation traditionnelles pour créer des images réalistes de conditions environnementales défavorables, validant ainsi leur utilité pour l'évaluation des systèmes d'IA.

Damian J. Ruck, Paul Vautravers, Oliver Chalkley + 1 more2026-03-05🤖 cs.LG

Algorithmic Compliance and Regulatory Loss in Digital Assets

Cette étude démontre que les métriques de classification statiques surestiment l'efficacité réelle des systèmes d'application de la loi contre le blanchiment d'argent dans les crypto-monnaies, car la non-stationnarité temporelle des marchés entraîne une instabilité des seuils de décision et des pertes réglementaires excessives dues à une mauvaise calibration plutôt qu'à une baisse de la précision prédictive.

Khem Raj Bhatt, Krishna Sharma2026-03-05🤖 cs.LG

What Does Flow Matching Bring To TD Learning?

Cet article démontre que l'apprentissage par flux améliore l'apprentissage TD grâce à une récupération robuste des erreurs lors de l'inférence et à un apprentissage de caractéristiques plus plastique, surpassant ainsi significativement les critiques monolithiques en termes de performance et d'efficacité échantillonnaire.

Bhavya Agrawalla, Michal Nauman, Aviral Kumar2026-03-05🤖 cs.AI

Balancing Fidelity, Utility, and Privacy in Synthetic Cardiac MRI Generation: A Comparative Study

Cette étude compare trois architectures génératives pour la création d'IRM cardiaques synthétiques et démontre que les modèles de diffusion, en particulier les DDPM, offrent le meilleur équilibre entre fidélité, utilité pour la segmentation et protection de la vie privée dans des conditions de données limitées.

Madhura Edirisooriya, Dasuni Kawya, Ishan Kumarasinghe + 5 more2026-03-05🤖 cs.LG

Enhancing Authorship Attribution with Synthetic Paintings

Cette étude démontre que l'intégration d'images synthétiques générées par DreamBooth et Stable Diffusion améliore la précision et la généralisation des modèles d'attribution d'auteur de tableaux, en surmontant le défi du manque de données réelles.

Clarissa Loures, Caio Hosken, Luan Oliveira + 2 more2026-03-05🤖 cs.LG

A Constrained RL Approach for Cost-Efficient Delivery of Latency-Sensitive Applications

Cet article propose une approche d'apprentissage par renforcement contraint (CDRL) pour optimiser la livraison de paquets d'applications sensibles à la latence, garantissant le respect des délais stricts tout en minimisant les coûts d'allocation des ressources dans les réseaux de nouvelle génération.

Ozan Aygün, Vincenzo Norman Vitale, Antonia M. Tulino + 3 more2026-03-05🤖 cs.LG

Out-of-distribution transfer of PDE foundation models to material dynamics under extreme loading

Cette étude évalue la capacité de transfert hors distribution de modèles de base pour les équations aux dérivées partielles (POSEIDON et MORPH), préentraînés sur des benchmarks fluides, vers la dynamique des matériaux sous chargements extrêmes, en comparant leur efficacité échantillonnaire lors du réglage fin par rapport à un entraînement à partir de zéro sur des régimes dominés par des discontinuités.

Mahindra Rautela, Alexander Most, Siddharth Mansingh + 9 more2026-03-05🤖 cs.LG

Efficient Refusal Ablation in LLM through Optimal Transport

Cet article propose un cadre novateur fondé sur le transport optimal pour contourner les mécanismes de sécurité des grands modèles de langage en transformant la distribution complète des activations nuisibles, surpassant ainsi les méthodes d'attaque existantes tout en révélant que les mécanismes de refus sont localisés dans des couches spécifiques du réseau.

Geraldin Nanfack, Eugene Belilovsky, Elvis Dohmatob2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Le papier présente RoboCasa365, un cadre de simulation à grande échelle et reproductible conçu pour entraîner et évaluer des robots généralistes dans des environnements domestiques, en offrant 365 tâches variées à travers 2 500 cuisines et des milliers d'heures de données de démonstration pour analyser les facteurs clés de la généralisation.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI

Dissecting Quantization Error: A Concentration-Alignment Perspective

Cet article propose une nouvelle perspective sur l'erreur de quantification basée sur la concentration et l'alignement, menant à la création de transformations légères (CAT) qui améliorent significativement la précision des modèles de langage à 4 bits en optimisant conjointement ces deux facteurs.

Marco Federici, Boris van Breugel, Paul Whatmough + 1 more2026-03-05🤖 cs.AI

Robust Unscented Kalman Filtering via Recurrent Meta-Adaptation of Sigma-Point Weights

Cet article présente le MA-UKF, un cadre innovant qui améliore la robustesse du filtre de Kalman non scindé en utilisant l'apprentissage méta récurrent pour optimiser dynamiquement les poids des points sigma afin de s'adapter aux dynamiques variables et au bruit non gaussien.

Kenan Majewski, Michał Modzelewski, Marcin Żugaj + 1 more2026-03-05🤖 cs.LG

Dual-Modality Multi-Stage Adversarial Safety Training: Robustifying Multimodal Web Agents Against Cross-Modal Attacks

Cet article propose le DMAST, un cadre d'entraînement de sécurité adversaire en deux modalités et trois étapes qui, en formalisant l'interaction agent-attaquant comme un jeu à somme nulle, renforce considérablement la robustesse et l'efficacité des agents web multimodaux face aux attaques croisées exploitant à la fois les captures d'écran et les arbres d'accessibilité.

Haoyu Liu, Dingcheng Li, Lukas Rutishauser + 1 more2026-03-05🤖 cs.AI

Low-Resource Guidance for Controllable Latent Audio Diffusion

Cet article présente une méthode à faible coût computationnel pour le contrôle de modèles de diffusion audio latents, utilisant des têtes de contrôle latentes (LatCHs) et une sélection de TFG afin d'obtenir des sorties audio générées avec une précision accrue sur l'intensité, la hauteur et le rythme sans nécessiter de réentraînement massif du modèle.

Zachary Novack, Zack Zukowski, CJ Carr + 6 more2026-03-05🤖 cs.AI

Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

Cet article propose la régularisation de Jacobien alignée aux attaques (AAJR), une méthode qui améliore la robustesse des systèmes d'IA agentic en contrôlant la sensibilité uniquement le long des directions d'ascension adversaires, évitant ainsi les restrictions conservatrices des bornes globales tout en garantissant la stabilité de l'optimisation minimax.

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI

Turning Trust to Transactions: Tracking Affiliate Marketing and FTC Compliance in YouTube's Influencer Economy

En analysant deux millions de vidéos sur une décennie, cette étude révèle que la pratique du marketing d'affiliation sur YouTube est omniprésente mais que le respect des règles de divulgation de la FTC reste faible, soulignant le rôle crucial des fonctionnalités standardisées de la plateforme pour améliorer la conformité.

Chen Sun, Yash Vekaria, Zubair Shafiq + 1 more2026-03-05🤖 cs.LG

ZipMap: Linear-Time Stateful 3D Reconstruction with Test-Time Training

Le papier présente ZipMap, un modèle feed-forward étatique qui réalise une reconstruction 3D bidirectionnelle en temps linéaire grâce à un entraînement au moment du test, surpassant ainsi l'efficacité des méthodes quadratiques actuelles tout en préservant, voire en améliorant, la qualité de reconstruction.

Haian Jin, Rundi Wu, Tianyuan Zhang + 4 more2026-03-05🤖 cs.AI

SELDON: Supernova Explosions Learned by Deep ODE Networks

Le papier présente SELDON, un nouveau modèle d'autoencodeur variationnel continu intégrant des réseaux de neurones basés sur des équations différentielles ordinaires (ODE) pour modéliser de manière interprétable les courbes de lumière astrophysiques éparses et irrégulières, permettant ainsi une inférence rapide et une priorisation efficace des observations de supernovae face au flux massif de données attendu du télescope Vera C. Rubin.

Jiezhong Wu, Jack O'Brien, Jennifer Li + 6 more2026-03-05🔭 astro-ph

← Précédent Suivant →