cs.AI articles | Gist.Science

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Ce papier propose deux techniques logicielles, l'échelle consciente des débordements (OAS) et l'échelle de bloc macro (MBS), qui réduisent considérablement l'écart de précision entre le format MXFP4 et NVFP4 pour les grands modèles de langage, rendant ainsi MXFP4 une alternative pratique et économe en matériel sans nécessiter de modifications matérielles.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Le papier présente Design Conductor, un agent autonome capable de concevoir, vérifier et générer le fichier GDSII d'un processeur RISC-V Linux fonctionnel à 1,48 GHz en seulement 12 heures, marquant la première fois qu'un agent réalise un tel circuit complet de la spécification à la mise en production.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Ce papier présente CktEvo, un benchmark et un cadre de référence pour l'évolution de code RTL au niveau d'un dépôt complet, permettant aux modèles de langage d'optimiser automatiquement la puissance, les performances et la surface (PPA) tout en préservant le comportement fonctionnel grâce à une boucle de rétroaction avec la chaîne d'outils.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

L'article présente SiliconMind-V1, un cadre multi-agents qui génère des données d'entraînement axées sur le raisonnement et intègre une vérification par banc d'essai pour permettre à des modèles de langage localement affinés de générer, tester et déboguer itérativement du code Verilog, surpassant ainsi les méthodes actuelles en matière de correction fonctionnelle avec moins de ressources.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Ce papier présente ALADIN, un cadre d'analyse de l'espace de conception pour les accélérateurs d'IA embarqués qui permet d'évaluer les compromis entre précision, latence et consommation de ressources des réseaux de neurones quantifiés sans nécessiter de déploiement physique sur la plateforme cible.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Cette étude préliminaire suggère que les techniques d'alignement des modèles de langage, en particulier lorsqu'elles impliquent une censure invisible ou des contraintes complexes, peuvent paradoxalement générer des pathologies collectives et des dissociations entre la compréhension et l'action au sein de systèmes multi-agents, révélant ainsi un risque de préjudice iatrogène inhérent aux interventions de sécurité actuelles.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Cette thèse de doctorat présente des méthodes novatrices et économiques pour évaluer et améliorer la fiabilité des accélérateurs matériels de réseaux de neurones profonds, notamment par le développement d'outils d'analyse, l'optimisation des compromis entre efficacité et tolérance aux pannes, et la création de la technique AdAM pour une amélioration de la fiabilité en temps réel sans surcoût matériel.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Ce papier présente ARKV, un cadre adaptatif et léger qui optimise la gestion du cache KV pour l'inférence de grands modèles de langage à contexte long en allouant dynamiquement des niveaux de précision aux tokens, permettant ainsi de réduire l'utilisation de la mémoire GPU par un facteur quatre tout en préservant la précision du modèle sans nécessiter de réentraînement.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Cette étude comparative sur les processeurs supraconducteurs et à ions piégés démontre que le recyclage aveugle des ancillas permet de réduire considérablement la latence des cycles de correction d'erreurs tout en maintenant une propreté suffisante pour des codes de répétition, offrant ainsi des directives de déploiement spécifiques à chaque architecture.

Sangkeum Lee2026-03-11⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Cet article présente une revue systématique et une évaluation comparative des techniques d'apprentissage fédéré dans les environnements de calcul en périphérie, en analysant cinq algorithmes majeurs sur des métriques clés et en identifiant les défis persistants pour orienter les recherches futures.

Sales Aribe Jr., Gil Nicholas Cagande2026-03-11🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Ce papier présente Auralink SDC, une architecture d'agents IA autonomes déployés en périphérie pour gérer les infrastructures de recharge de véhicules électriques, permettant une résolution autonome des incidents avec une haute précision et une latence ultra-faible grâce à des modèles spécialisés et des mécanismes de raisonnement adaptatif.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Cet article présente un cadre de compression pour le calcul en réservoir qui utilise un mécanisme d'élagage basé sur la sensibilité pour optimiser les compromis entre précision, efficacité matérielle et consommation de ressources dans les implémentations FPGA, tout en maintenant des performances élevées sur diverses tâches de séries temporelles.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Cet article examine les techniques d'optimisation matérielle et présente une analyse des accélérateurs de réseaux de neurones basés sur les FPGA, en soulignant leurs avantages par rapport aux solutions ASIC et GPU pour répondre aux exigences croissantes des modèles d'apprentissage profond.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur Rahaman2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Ce papier présente Zipage, un moteur d'inférence LLM qui utilise la méthode Compressed PagedAttention pour maintenir une forte concurrence de requêtes lors du raisonnement tout en préservant 95 % des performances et en offrant un gain de vitesse de plus de 2,1 fois par rapport aux moteurs à cache KV complet.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Cette étude analyse systématiquement la sensibilité à la quantification FP4 (MXFP4 et NVFP4) des modèles Qwen2.5 à différentes échelles, révélant que les couches de projection MLP sont les plus critiques et que la sensibilité ne se limite pas uniquement aux derniers blocs du modèle.

Musa Cim, Burak Topcu, Mahmut Taylan Kandemir2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Cet article propose une théorie et une architecture canonique pour les modèles d'espace d'état 2D équivariants aux permutations, introduisant le modèle VI 2D Mamba qui élimine les dépendances séquentielles artificielles entre les variables pour atteindre des performances de pointe dans l'analyse de séries temporelles multivariées.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Le papier présente HCAPO, un cadre innovant qui intègre l'attribution de crédit rétrospectif via l'LLM lui-même pour surmonter les défis de l'apprentissage par renforcement dans les tâches à long horizon, surpassant ainsi les méthodes de pointe comme GRPO sur des benchmarks complexes.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

Ce papier présente Turn, un langage de programmation compilé et basé sur des acteurs conçu pour les logiciels autonomes, qui intègre nativement la sécurité des types pour les inférences LLM, un modèle de processus isolé, un système d'identité basé sur les capacités et l'absorption de schémas à la compilation pour garantir la fiabilité et la sécurité des agents.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Ce papier propose une réduction générale qui permet de transformer n'importe quelle fonction invariante sur un produit d'espaces en une fonction invariante sous l'action du sous-groupe d'isotropie, éliminant ainsi les contraintes structurelles des méthodes existantes pour les champs de réseaux neuronaux équivariants.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

L'article présente EDMFormer, un modèle de type transformer utilisant un apprentissage auto-supervisé sur un nouveau jeu de données annoté (EDM-98) pour améliorer la segmentation structurelle de la musique électronique, en se concentrant spécifiquement sur des caractéristiques comme l'énergie et le rythme plutôt que sur la mélodie ou les paroles.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song Bae2026-03-11🤖 cs.AI

← Précédent Suivant →