NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Le papier présente NEST, un cadre de placement de dispositifs pour l'apprentissage profond distribué qui unifie la modélisation du parallélisme, de la mémoire et de la topologie réseau via une programmation dynamique structurée, permettant d'optimiser conjointement la latence, la viabilité mémoire et le débit jusqu'à 2,43 fois supérieur aux méthodes de l'état de l'art.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Joint 3D Gravity and Magnetic Inversion via Rectified Flow and Ginzburg-Landau Guidance

Cet article présente un cadre novateur pour l'inversion conjointe 3D de la gravité et du magnétisme, utilisant un flux rectifié sur le jeu de données Noddyverse, un régularisateur de Ginzburg-Landau pour l'identification des minerais et une méthode de guidage plug-and-play afin de capturer la distribution complète des solutions possibles au-delà des approches déterministes traditionnelles.

Dhruman Gupta (Ashoka University), Yashas Shende (Ashoka University), Aritra Das (Ashoka University), Chanda Grover Kamra (Ashoka University), Debayan Gupta (Ashoka University)2026-03-10🤖 cs.LG

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

Ce papier présente C3, une méthode d'apprentissage par renforcement multi-agent qui améliore l'attribution du crédit dans les collaborations d'LLM en isolant l'impact causal de chaque message via des contre-factuels contextuels, surmontant ainsi les limitations des signaux de récompense terminaux épars.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

IGLU: The Integrated Gaussian Linear Unit Activation Function

Ce papier présente IGLU, une nouvelle fonction d'activation paramétrique dérivée d'un mélange d'échelles de portes GELU avec une distribution mi-normale, qui offre une expression fermée basée sur la fonction de répartition de Cauchy pour garantir des gradients non nuls et une robustesse accrue, ainsi qu'une approximation rationnelle efficace (IGLU-Approx) qui démontre des performances compétitives ou supérieures sur des tâches de vision et de langage.

Mingi Kang, Zai Yang, Jeova Farias Sales Rocha Neto2026-03-10🤖 cs.LG

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

Le papier présente SymLang, un cadre unifié combinant des grammaires contraintes par la symétrie, la synthèse de programmes guidée par des modèles de langage et une sélection de modèles bayésienne pour découvrir avec précision et robustesse des équations gouvernantes interprétables à partir d'observations expérimentales bruitées et partielles.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Cette étude présente un modèle de substitution basé sur un opérateur neuronal informé par la physique (PINO) qui accélère de plus de 10 000 fois l'analyse de la rétention des mémoires NAND verticales ferroélectriques par rapport aux outils TCAD traditionnels, tout en préservant la précision physique nécessaire à l'optimisation des dispositifs.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Single-pass Possibilistic Clustering with Damped Window Footprints

Cet article propose un algorithme de clustering possibiliste en un seul passage (SPC) conçu pour les flux de données, qui se distingue par sa capacité à modéliser des clusters non sphériques, à mettre à jour ses empreintes via des fenêtres amorties et à fusionner des estimations grâce à l'union de covariance, surpassant ainsi cinq autres algorithmes existants en termes de pureté et d'information mutuelle normalisée.

Jeffrey Dale, James Keller, Aquila Galusha2026-03-10🤖 cs.LG

Learning From Design Procedure To Generate CAD Programs for Data Augmentation

Cet article propose une nouvelle méthode d'augmentation de données qui utilise les grands modèles de langage pour générer des programmes CAO plus diversifiés et complexes, inspirés des procédures de conception industrielle, afin d'améliorer l'entraînement des modèles d'apprentissage profond pour la création de formes organiques.

Yan-Ying Chen, Dule Shu, Matthew Hong, Andrew Taber, Jonathan Li, Matthew Klenk2026-03-10🤖 cs.LG

CN-CBF: Composite Neural Control Barrier Function for Safe Robot Navigation in Dynamic Environments

Ce papier propose une méthode efficace de fonction barrière de contrôle neuronale composite (CN-CBF), combinant plusieurs réseaux de neurones entraînés via la théorie de l'atteignabilité de Hamilton-Jacobi et une architecture résiduelle, pour garantir une navigation robotique sûre dans des environnements dynamiques avec des taux de réussite supérieurs aux méthodes existantes sans augmenter la conservatisme.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Physics-Consistent Neural Networks for Learning Deformation and Director Fields in Microstructured Media with Loss-Based Validation Criteria

Cet article présente une approche combinant éléments finis et réseaux de neurones physiquement cohérents pour modéliser l'élasticité de Cosserat, intégrant des critères de validation basés sur la stabilité énergétique (quasi-convexité et inégalités de Legendre-Hadamard) pour garantir que les solutions apprises correspondent à des minimiseurs d'énergie stables.

Milad Shirani, Pete H. Gueldner, Murat Khidoyatov, Jeremy L. Warren, Federica Ninno2026-03-10🤖 cs.LG