cs.LG articles | Gist.Science

Equitable Multi-Task Learning for AI-RANs

Ce papier présente le cadre OWO-FMTL, une méthode d'apprentissage multi-tâches en ligne qui garantit une équité à long terme pour les utilisateurs hétérogènes des réseaux d'accès radio intelligents (AI-RAN) en ajustant dynamiquement les priorités via une mise à jour primal-duale légère, tout en maintenant un faible coût de calcul adapté au déploiement en périphérie.

Panayiotis Raptis, Fatih Aslan, George IosifidisWed, 11 Ma🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

Le papier présente KernelCraft, le premier benchmark évaluant la capacité des agents LLM à générer et optimiser des noyaux bas niveau pour des accélérateurs émergents via un processus itératif guidé par des retours automatiques, démontrant ainsi leur potentiel pour réduire les coûts de développement sur de nouvelles architectures matérielles.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren ZhaoWed, 11 Ma🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Ce papier présente ALADIN, un cadre d'analyse de l'espace de conception pour les accélérateurs d'IA embarqués qui permet d'évaluer les compromis entre précision, latence et consommation de ressources des réseaux de neurones quantifiés sans nécessiter de déploiement physique sur la plateforme cible.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Cette étude comparative analyse les architectures de traitement IA ultra-basse consommation, notamment les SoCs hétérogènes et les processeurs en capteur, en mettant en évidence, grâce à des benchmarks sur GAP9, STM32N6 et IMX500, la supériorité émergente du traitement en capteur en termes d'efficacité énergétique et de productivité.

Luigi Capogrosso, Pietro Bonazzi, Michele MagnoWed, 11 Ma🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

Cet article présente une architecture d'accélérateur CNN sur FPGA adaptée au débit de données et au traitement multi-pixels, qui optimise l'exploitation des ressources et réduit la consommation matérielle tout en maintenant un flux de données continu pour des réseaux complexes.

Tobias Habermann, Martin KummWed, 11 Ma🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Cette étude démontre que l'intégration synergique de mécanismes complémentaires, notamment l'apprentissage contrastif supervisé et les réseaux récurrents hiérarchiques, au sein de réseaux de neurones à impulsions permet d'optimiser simultanément la précision, l'efficacité énergétique et la structure des représentations pour la vision neuromorphique.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid RehmanWed, 11 Ma🤖 cs.LG

Hebbian-Oscillatory Co-Learning

Cet article présente le cadre dynamique HOC-L, qui unifie la plasticité structurelle hyperbolique et la synchronisation de phase oscillatoire via un mécanisme de plasticité gating pour créer des architectures neuronales bio-inspirées à la fois parcimonieuses et convergentes.

Hasi HaysWed, 11 Ma🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Ce papier présente Auralink SDC, une architecture d'agents IA autonomes déployés en périphérie pour gérer les infrastructures de recharge de véhicules électriques, permettant une résolution autonome des incidents avec une haute précision et une latence ultra-faible grâce à des modèles spécialisés et des mécanismes de raisonnement adaptatif.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Cet article présente un cadre de compression pour le calcul en réservoir qui utilise un mécanisme d'élagage basé sur la sensibilité pour optimiser les compromis entre précision, efficacité matérielle et consommation de ressources dans les implémentations FPGA, tout en maintenant des performances élevées sur diverses tâches de séries temporelles.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

Le papier présente la famille AetherFloat, une architecture de point flottant quad-radix sans mise à l'échelle par blocs conçue pour les accélérateurs d'IA, qui élimine la logique de mise à l'échelle dynamique grâce à une mantisse explicite et à une échelle de base 4, offrant ainsi des réductions significatives de surface, de puissance et de délai tout en nécessitant un ajustement quantifié pour l'inférence.

Keita MorisakiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Cette étude propose un cadre basé sur les réseaux de neurones informés par la physique (PINN) permettant une estimation robuste des paramètres biophysiques et la reconstruction des états cachés dans des modèles neuronaux multiscales, surpassant les méthodes traditionnelles face aux non-linéarités et aux données partielles.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Cet article propose une théorie et une architecture canonique pour les modèles d'espace d'état 2D équivariants aux permutations, introduisant le modèle VI 2D Mamba qui élimine les dépendances séquentielles artificielles entre les variables pour atteindre des performances de pointe dans l'analyse de séries temporelles multivariées.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Le papier présente HCAPO, un cadre innovant qui intègre l'attribution de crédit rétrospectif via l'LLM lui-même pour surmonter les défis de l'apprentissage par renforcement dans les tâches à long horizon, surpassant ainsi les méthodes de pointe comme GRPO sur des benchmarks complexes.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Ce papier propose une réduction générale qui permet de transformer n'importe quelle fonction invariante sur un produit d'espaces en une fonction invariante sous l'action du sous-groupe d'isotropie, éliminant ainsi les contraintes structurelles des méthodes existantes pour les champs de réseaux neuronaux équivariants.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J BekkersWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

Cet article démontre qu'aucune procédure de vérification de l'alignement des IA ne peut simultanément garantir la justesse, la généralité et la faisabilité computationnelle, établissant ainsi une trilemme fondamentale qui définit les limites théoriques de la certification formelle de la sécurité des systèmes d'intelligence artificielle.

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Le papier présente SPREAD, un cadre d'apprentissage par imitation à vie qui utilise la décomposition en valeurs singulières pour préserver la géométrie des représentations de tâches dans des sous-espaces de faible rang et une distillation guidée par la confiance, permettant ainsi de surmonter l'oubli catastrophique et d'atteindre des performances de pointe sur le benchmark LIBERO.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

Le système de compression sans perte Midicoth améliore l'estimation des probabilités dans les modèles statistiques adaptatifs en appliquant une couche de débruitage par micro-diffusion qui corrige les biais de lissage des a priori via une hiérarchie de décisions binaires en arbre binaire.

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

Cet article propose un cadre d'apprentissage par renforcement méta multi-niveaux intégrant un curriculum basé sur des compétences, qui comprime efficacement les processus de décision markoviens en hiérarchisant les politiques pour réduire la stochasticité, accélérer la convergence et faciliter le transfert de compétences entre différents problèmes et niveaux de complexité.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

Cet article présente le Champs de Transition Markovien Temporel (TMTF), une extension du MTF qui partitionne les séries temporelles en segments contigus pour capturer les dynamiques de régime changeant via des matrices de transition locales, offrant ainsi une représentation image préservant l'ordre temporel et adaptée aux réseaux de neurones convolutifs.

Michael LeznikWed, 11 Ma🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

Cet article présente SoftJAX et SoftTorch, deux bibliothèques open-source qui fournissent des versions « douces » et différentiables d'opérateurs discrets pour JAX et PyTorch, permettant ainsi d'obtenir des gradients informatifs là où les primitives standard échouent.

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg MartiusWed, 11 Ma🤖 cs.LG

← Précédent Suivant →