World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Cette étude démontre que la récupération linéaire de structures spatiales et temporelles dans les représentations internes des modèles de langage ne prouve pas l'existence de modèles du monde internes, car une grande partie de cette structure est déjà latente dans les statistiques de co-occurrence des mots des embeddings statiques.

Elan Barenholtz2026-03-05🤖 cs.AI

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Le papier présente PTOPOFL, un cadre d'apprentissage fédéré personnalisé qui remplace l'échange de gradients par des descripteurs topologiques issus de l'homologie persistante pour garantir une confidentialité accrue et améliorer la convergence dans des environnements de données non indépendants et non identiquement distribués (non-IID).

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

Algorithmic Compliance and Regulatory Loss in Digital Assets

Cette étude démontre que les métriques de classification statiques surestiment l'efficacité réelle des systèmes d'application de la loi contre le blanchiment d'argent dans les crypto-monnaies, car la non-stationnarité temporelle des marchés entraîne une instabilité des seuils de décision et des pertes réglementaires excessives dues à une mauvaise calibration plutôt qu'à une baisse de la précision prédictive.

Khem Raj Bhatt, Krishna Sharma2026-03-05🤖 cs.LG

Balancing Fidelity, Utility, and Privacy in Synthetic Cardiac MRI Generation: A Comparative Study

Cette étude compare trois architectures génératives pour la création d'IRM cardiaques synthétiques et démontre que les modèles de diffusion, en particulier les DDPM, offrent le meilleur équilibre entre fidélité, utilité pour la segmentation et protection de la vie privée dans des conditions de données limitées.

Madhura Edirisooriya, Dasuni Kawya, Ishan Kumarasinghe + 5 more2026-03-05🤖 cs.LG

Out-of-distribution transfer of PDE foundation models to material dynamics under extreme loading

Cette étude évalue la capacité de transfert hors distribution de modèles de base pour les équations aux dérivées partielles (POSEIDON et MORPH), préentraînés sur des benchmarks fluides, vers la dynamique des matériaux sous chargements extrêmes, en comparant leur efficacité échantillonnaire lors du réglage fin par rapport à un entraînement à partir de zéro sur des régimes dominés par des discontinuités.

Mahindra Rautela, Alexander Most, Siddharth Mansingh + 9 more2026-03-05🤖 cs.LG

Efficient Refusal Ablation in LLM through Optimal Transport

Cet article propose un cadre novateur fondé sur le transport optimal pour contourner les mécanismes de sécurité des grands modèles de langage en transformant la distribution complète des activations nuisibles, surpassant ainsi les méthodes d'attaque existantes tout en révélant que les mécanismes de refus sont localisés dans des couches spécifiques du réseau.

Geraldin Nanfack, Eugene Belilovsky, Elvis Dohmatob2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Le papier présente RoboCasa365, un cadre de simulation à grande échelle et reproductible conçu pour entraîner et évaluer des robots généralistes dans des environnements domestiques, en offrant 365 tâches variées à travers 2 500 cuisines et des milliers d'heures de données de démonstration pour analyser les facteurs clés de la généralisation.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI

Dual-Modality Multi-Stage Adversarial Safety Training: Robustifying Multimodal Web Agents Against Cross-Modal Attacks

Cet article propose le DMAST, un cadre d'entraînement de sécurité adversaire en deux modalités et trois étapes qui, en formalisant l'interaction agent-attaquant comme un jeu à somme nulle, renforce considérablement la robustesse et l'efficacité des agents web multimodaux face aux attaques croisées exploitant à la fois les captures d'écran et les arbres d'accessibilité.

Haoyu Liu, Dingcheng Li, Lukas Rutishauser + 1 more2026-03-05🤖 cs.AI

Turning Trust to Transactions: Tracking Affiliate Marketing and FTC Compliance in YouTube's Influencer Economy

En analysant deux millions de vidéos sur une décennie, cette étude révèle que la pratique du marketing d'affiliation sur YouTube est omniprésente mais que le respect des règles de divulgation de la FTC reste faible, soulignant le rôle crucial des fonctionnalités standardisées de la plateforme pour améliorer la conformité.

Chen Sun, Yash Vekaria, Zubair Shafiq + 1 more2026-03-05🤖 cs.LG

SELDON: Supernova Explosions Learned by Deep ODE Networks

Le papier présente SELDON, un nouveau modèle d'autoencodeur variationnel continu intégrant des réseaux de neurones basés sur des équations différentielles ordinaires (ODE) pour modéliser de manière interprétable les courbes de lumière astrophysiques éparses et irrégulières, permettant ainsi une inférence rapide et une priorisation efficace des observations de supernovae face au flux massif de données attendu du télescope Vera C. Rubin.

Jiezhong Wu, Jack O'Brien, Jennifer Li + 6 more2026-03-05🔭 astro-ph