cs.LG articles | Gist.Science

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

Cette étude démontre que l'opérateur neuronal de Fourier (FNO), intégré dans un cadre d'apprentissage automatique, surpasse les architectures AE et U-Net ainsi que les méthodes CFD traditionnelles pour prédire efficacement et rapidement l'écoulement en régime permanent dans les milieux poreux, offrant ainsi une solution évolutive pour l'optimisation topologique des plaques froides.

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

Cette étude propose une architecture combinant des réseaux de neurones à convolution graphique et l'apprentissage par méta-apprentissage pour permettre une adaptation rapide et précise des modèles de trafic à des réseaux routiers et des matrices OD inédits, notamment lors de perturbations majeures, atteignant un coefficient de détermination de 0,85 sur des scénarios non vus.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Cette étude démontre que l'apprentissage machine symbolique, appliqué à des données simulées d'oxydation de l'éthylène, surpasse les méthodes baselines tout en offrant des modèles prédictifs interprétables pour la détection de défaillances dans les procédés chimiques.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

Gauge Freedom and Metric Dependence in Neural Representation Spaces

Cet article démontre que les représentations neuronales possèdent une liberté de jauge sous l'action du groupe linéaire général, ce qui rend des métriques courantes comme la similarité cosinus dépendantes du système de coordonnées et instables, suggérant ainsi que l'analyse des représentations doit se concentrer sur des quantités invariantes ou des coordonnées canoniques.

Jericho Cain2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Cet article présente le HGT-Scheduler, une approche d'apprentissage par renforcement utilisant des Transformers sur graphes hétérogènes pour modéliser les relations distinctes du problème d'ordonnancement d'atelier, démontrant ainsi une supériorité statistique par rapport aux modèles homogènes sur les instances de référence Fisher-Thompson.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

Le papier présente SpatialMAGIC, un cadre hybride innovant combinant la diffusion graphique et l'attention spatiale pour imputer les données de transcriptomique spatiale, surmontant ainsi le bruit technique et la sparsité tout en améliorant la précision du regroupement et la détection des gènes biologiquement pertinents.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Le papier présente xaitimesynth, un package Python open source qui fournit une infrastructure réutilisable pour évaluer les méthodes d'attribution sur des séries temporelles en générant des données synthétiques avec un vérité terrain connue et en offrant des métriques de localisation standardisées.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Ce papier propose un modèle de diffusion informé par la physique basé sur l'architecture Context-UNet pour générer des images satellites synthétiques d'événements météorologiques extrêmes rares, afin de surmonter le manque de données et d'améliorer la détection des cyclones tropicaux.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

Ce papier présente l'Optimistic Policy Regularization (OPR), une méthode légère qui améliore l'efficacité des échantillons et les performances finales des agents d'apprentissage par renforcement en ancrant les mises à jour de la politique sur des trajectoires historiquement réussies, surpassant ainsi les méthodes de base sur des benchmarks Atari et de cyberguerre.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Le papier présente Best-of-Tails (BoT), un cadre d'alignement adaptatif qui optimise la sélection des réponses des grands modèles de langage en ajustant dynamiquement l'équilibre entre optimisme et pessimisme en fonction de la lourdeur de la queue de la distribution des récompenses.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Le papier présente NEST, un cadre de placement de dispositifs pour l'apprentissage profond distribué qui unifie la modélisation du parallélisme, de la mémoire et de la topologie réseau via une programmation dynamique structurée, permettant d'optimiser conjointement la latence, la viabilité mémoire et le débit jusqu'à 2,43 fois supérieur aux méthodes de l'état de l'art.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Multi-Agent Reinforcement Learning with Submodular Reward

Cet article propose le premier cadre formel et des algorithmes à garanties théoriques pour l'apprentissage par renforcement multi-agents coopératif avec des récompenses sous-modulaires, surmontant ainsi la malédiction de la dimensionnalité grâce à une complexité polynomiale.

Wenjing Chen, Chengyuan Qian, Shuo Xing, Yi Zhou, Victoria Crawford2026-03-10🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

Le papier présente CREDO, une méthode innovante qui combine des enveloppes crédales interprétables pour capturer l'incertitude épistémique avec une calibration conforme pour garantir une couverture marginale, produisant ainsi des intervalles de prédiction en régression à la fois valides et adaptatifs.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael Izbicki2026-03-10🤖 cs.LG

Joint 3D Gravity and Magnetic Inversion via Rectified Flow and Ginzburg-Landau Guidance

Cet article présente un cadre novateur pour l'inversion conjointe 3D de la gravité et du magnétisme, utilisant un flux rectifié sur le jeu de données Noddyverse, un régularisateur de Ginzburg-Landau pour l'identification des minerais et une méthode de guidage plug-and-play afin de capturer la distribution complète des solutions possibles au-delà des approches déterministes traditionnelles.

Dhruman Gupta (Ashoka University), Yashas Shende (Ashoka University), Aritra Das (Ashoka University), Chanda Grover Kamra (Ashoka University), Debayan Gupta (Ashoka University)2026-03-10🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Cet article établit le taux de regret minimax optimal pour le commerce bilatéral contextuel avec des valorisations à variance infinie, en démontrant qu'un algorithme basé sur l'estimation de moyenne tronquée atteint ce taux en interpolant entre les régimes de moments finis et infinis.

Hangyi Zhao2026-03-10🤖 cs.LG

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

Ce papier présente C3, une méthode d'apprentissage par renforcement multi-agent qui améliore l'attribution du crédit dans les collaborations d'LLM en isolant l'impact causal de chaque message via des contre-factuels contextuels, surmontant ainsi les limitations des signaux de récompense terminaux épars.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

IGLU: The Integrated Gaussian Linear Unit Activation Function

Ce papier présente IGLU, une nouvelle fonction d'activation paramétrique dérivée d'un mélange d'échelles de portes GELU avec une distribution mi-normale, qui offre une expression fermée basée sur la fonction de répartition de Cauchy pour garantir des gradients non nuls et une robustesse accrue, ainsi qu'une approximation rationnelle efficace (IGLU-Approx) qui démontre des performances compétitives ou supérieures sur des tâches de vision et de langage.

Mingi Kang, Zai Yang, Jeova Farias Sales Rocha Neto2026-03-10🤖 cs.LG

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

Le papier présente SymLang, un cadre unifié combinant des grammaires contraintes par la symétrie, la synthèse de programmes guidée par des modèles de langage et une sélection de modèles bayésienne pour découvrir avec précision et robustesse des équations gouvernantes interprétables à partir d'observations expérimentales bruitées et partielles.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

Stochastic Attention via Langevin Dynamics on the Modern Hopfield Energy

Cet article propose une méthode d'attention stochastique sans apprentissage, basée sur la dynamique de Langevin appliquée à l'énergie des réseaux de Hopfield modernes, qui permet de générer des sorties variées et novatrices tout en conservant la capacité de récupération exacte.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-10🤖 cs.LG

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Cette étude présente un modèle de substitution basé sur un opérateur neuronal informé par la physique (PINO) qui accélère de plus de 10 000 fois l'analyse de la rétention des mémoires NAND verticales ferroélectriques par rapport aux outils TCAD traditionnels, tout en préservant la précision physique nécessaire à l'optimisation des dispositifs.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

← Précédent Suivant →