FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review

Cette revue systématique analyse 68 expériences de déploiement de modèles d'apprentissage automatique sur des FPGA pour l'observation de la Terre, en proposant deux taxonomies distinctes pour les architectures de modèles et les stratégies d'implémentation, tout en suivant les directives PRISMA 2020 pour assurer la transparence et la reproductibilité.

Cédric Léonard, Dirk Stober, Martin Schulz2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Ce papier présente HSG-12M, un vaste ensemble de données de 12 millions de multigraphes spatiaux dérivés des spectres énergétiques de cristaux non hermitiens, généré par le pipeline automatisé Poly2Graph pour combler le manque de benchmarks à grande échelle en physique de la matière condensée et en apprentissage géométrique.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

L'article présente EDINET-Bench, un nouveau benchmark open-source en japonais évaluant les capacités des grands modèles de langage sur des tâches financières complexes issues de rapports annuels, révélant leurs limites actuelles et soulignant la nécessité de cadres d'évaluation plus riches intégrant des simulations réalistes et un soutien au raisonnement.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

Cet article propose les SKANODEs, un cadre intégrant des réseaux de Kolmogorov-Arnold aux équations différentielles neuronales pour modéliser avec précision des dynamiques non linéaires complexes tout en découvrant automatiquement leurs lois physiques sous-jacentes sous forme d'expressions symboliques interprétables.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

Cet article présente les Réseaux de Présymplectification (PSN), un cadre innovant qui restaure une géométrie symplectique non dégénérée pour les systèmes mécaniques dissipatifs et contraints en les relevant dans une variété de dimension supérieure via des structures de Dirac, permettant ainsi une prédiction à long terme stable et précise pour des robots complexes comme le quadrupède ANYmal.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

Cet article propose une analyse de la robustesse des politiques d'apprentissage par renforcement en appliquant des filtres synaptiques comme contrainte interne et des attaques adverses comme contrainte externe pour classifier les paramètres du réseau en fragiles, robustes ou antifragiles, révélant ainsi l'existence de paramètres qui améliorent les performances sous stress.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

Le papier présente MuRating, un cadre évolutif qui transfère les signaux de qualité des données anglaises vers un évaluateur multilingue unique pour sélectionner des sous-ensembles de données équilibrés, améliorant ainsi significativement les performances des modèles de langage multilingues sur des tâches exigeantes en connaissances.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games

Cet article propose une méthode d'apprentissage par renforcement inverse basée sur l'entropie maximale et les espaces de Hilbert à noyau reproduisant (RKHS) pour les jeux à champ moyen, permettant d'inférer des structures de récompenses non linéaires riches avec des garanties théoriques de convergence et une précision supérieure aux approches linéaires existantes.

Berkay Anahtarci, Can Deha Kariksiz, Naci Saldi2026-03-06🔢 math

TIC-GRPO: Provable and Efficient Optimization for Reinforcement Learning from Human Feedback

Cet article propose TIC-GRPO, un nouvel algorithme d'optimisation pour l'apprentissage par renforcement à partir de retours humains qui remplace les ratios d'importance au niveau des tokens par un ratio au niveau de la trajectoire pour estimer le gradient de la politique actuelle, garantissant ainsi une convergence plus rapide et des performances supérieures tout en conservant la structure sans critique du GRPO.

Lei Pang, Jun Luo, Ruinan Jin2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

Cette étude présente la première analyse systématique de mécanismes de régularisation appliqués pendant l'entraînement pour contrer la désalignement émergent dans les modèles de langage, démontrant que l'intercalation stratégique d'exemples d'entraînement basée sur l'écart de perplexité constitue la méthode la plus efficace pour prévenir les comportements néfastes tout en préservant les performances.

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs