cs.AI articles | Gist.Science

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Cet article présente le CB-MCTS, une méthode de recherche arborescente Monte Carlo décentralisée qui remplace la politique UCT déterministe par une politique stochastique de Boltzmann avec un bonus d'entropie décroissant, permettant ainsi une exploration plus robuste et performante dans des environnements multi-agents à récompenses clairsemées ou trompeuses.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Ce papier présente FinTexTS, un nouveau jeu de données à grande échelle associant des séries temporelles financières à des textes, construit grâce à un cadre d'appariement sémantique et multi-niveaux qui capture les interdépendances complexes du marché et améliore la prévision des cours boursiers.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin AhnWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Ce papier propose SPARC, une méthode de planification de trajectoire multi-robots décentralisée qui améliore la communication en intégrant les distances spatiales dans un mécanisme d'attention relationnelle, permettant ainsi une coordination supérieure et une généralisation efficace à des essaims de grande taille dans des environnements denses.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Ce papier propose deux techniques logicielles, l'échelle consciente des débordements (OAS) et l'échelle de bloc macro (MBS), qui réduisent considérablement l'écart de précision entre le format MXFP4 et NVFP4 pour les grands modèles de langage, rendant ainsi MXFP4 une alternative pratique et économe en matériel sans nécessiter de modifications matérielles.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu KimWed, 11 Ma🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Le papier présente Design Conductor, un agent autonome capable de concevoir, vérifier et générer le fichier GDSII d'un processeur RISC-V Linux fonctionnel à 1,48 GHz en seulement 12 heures, marquant la première fois qu'un agent réalise un tel circuit complet de la spécification à la mise en production.

The Verkor Team, Ravi Krishna, Suresh Krishna, David ChinWed, 11 Ma🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Ce papier présente CktEvo, un benchmark et un cadre de référence pour l'évolution de code RTL au niveau d'un dépôt complet, permettant aux modèles de langage d'optimiser automatiquement la puissance, les performances et la surface (PPA) tout en préservant le comportement fonctionnel grâce à une boucle de rétroaction avec la chaîne d'outils.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang XuWed, 11 Ma🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

L'article présente SiliconMind-V1, un cadre multi-agents qui génère des données d'entraînement axées sur le raisonnement et intègre une vérification par banc d'essai pour permettre à des modèles de langage localement affinés de générer, tester et déboguer itérativement du code Verilog, surpassant ainsi les méthodes actuelles en matière de correction fonctionnelle avec moins de ressources.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung KungWed, 11 Ma🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Ce papier présente ALADIN, un cadre d'analyse de l'espace de conception pour les accélérateurs d'IA embarqués qui permet d'évaluer les compromis entre précision, latence et consommation de ressources des réseaux de neurones quantifiés sans nécessiter de déploiement physique sur la plateforme cible.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Cette étude préliminaire suggère que les techniques d'alignement des modèles de langage, en particulier lorsqu'elles impliquent une censure invisible ou des contraintes complexes, peuvent paradoxalement générer des pathologies collectives et des dissociations entre la compréhension et l'action au sein de systèmes multi-agents, révélant ainsi un risque de préjudice iatrogène inhérent aux interventions de sécurité actuelles.

Hiroki FukuiWed, 11 Ma🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Cette thèse de doctorat présente des méthodes novatrices et économiques pour évaluer et améliorer la fiabilité des accélérateurs matériels de réseaux de neurones profonds, notamment par le développement d'outils d'analyse, l'optimisation des compromis entre efficacité et tolérance aux pannes, et la création de la technique AdAM pour une amélioration de la fiabilité en temps réel sans surcoût matériel.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Ce papier présente ARKV, un cadre adaptatif et léger qui optimise la gestion du cache KV pour l'inférence de grands modèles de langage à contexte long en allouant dynamiquement des niveaux de précision aux tokens, permettant ainsi de réduire l'utilisation de la mémoire GPU par un facteur quatre tout en préservant la précision du modèle sans nécessiter de réentraînement.

Jianlong Lei, Shashikant IlagerWed, 11 Ma🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Cette étude comparative sur les processeurs supraconducteurs et à ions piégés démontre que le recyclage aveugle des ancillas permet de réduire considérablement la latence des cycles de correction d'erreurs tout en maintenant une propreté suffisante pour des codes de répétition, offrant ainsi des directives de déploiement spécifiques à chaque architecture.

Sangkeum LeeWed, 11 Ma⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Cet article présente une revue systématique et une évaluation comparative des techniques d'apprentissage fédéré dans les environnements de calcul en périphérie, en analysant cinq algorithmes majeurs sur des métriques clés et en identifiant les défis persistants pour orienter les recherches futures.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Ce papier présente Auralink SDC, une architecture d'agents IA autonomes déployés en périphérie pour gérer les infrastructures de recharge de véhicules électriques, permettant une résolution autonome des incidents avec une haute précision et une latence ultra-faible grâce à des modèles spécialisés et des mécanismes de raisonnement adaptatif.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Cet article présente un cadre de compression pour le calcul en réservoir qui utilise un mécanisme d'élagage basé sur la sensibilité pour optimiser les compromis entre précision, efficacité matérielle et consommation de ressources dans les implémentations FPGA, tout en maintenant des performances élevées sur diverses tâches de séries temporelles.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Cet article examine les techniques d'optimisation matérielle et présente une analyse des accélérateurs de réseaux de neurones basés sur les FPGA, en soulignant leurs avantages par rapport aux solutions ASIC et GPU pour répondre aux exigences croissantes des modèles d'apprentissage profond.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur RahamanWed, 11 Ma🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Ce papier présente Zipage, un moteur d'inférence LLM qui utilise la méthode Compressed PagedAttention pour maintenir une forte concurrence de requêtes lors du raisonnement tout en préservant 95 % des performances et en offrant un gain de vitesse de plus de 2,1 fois par rapport aux moteurs à cache KV complet.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Cette étude analyse systématiquement la sensibilité à la quantification FP4 (MXFP4 et NVFP4) des modèles Qwen2.5 à différentes échelles, révélant que les couches de projection MLP sont les plus critiques et que la sensibilité ne se limite pas uniquement aux derniers blocs du modèle.

Musa Cim, Burak Topcu, Mahmut Taylan KandemirWed, 11 Ma🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Cet article propose une théorie et une architecture canonique pour les modèles d'espace d'état 2D équivariants aux permutations, introduisant le modèle VI 2D Mamba qui élimine les dépendances séquentielles artificielles entre les variables pour atteindre des performances de pointe dans l'analyse de séries temporelles multivariées.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Le papier présente HCAPO, un cadre innovant qui intègre l'attribution de crédit rétrospectif via l'LLM lui-même pour surmonter les défis de l'apprentissage par renforcement dans les tâches à long horizon, surpassant ainsi les méthodes de pointe comme GRPO sur des benchmarks complexes.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

← Précédent Suivant →