cs.AI Arbeiten | Gist.Science

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Die Arbeit stellt Coordinated Boltzmann MCTS (CB-MCTS) vor, einen neuartigen dezentralen Planungsalgorithmus, der durch eine stochastische Boltzmann-Politik und einen abklingenden Entropie-Bonus die Robustheit gegenüber spärlichen Belohnungen und irreführenden Szenarien in kooperativen Multi-Agenten-Systemen im Vergleich zu herkömmlichen Dec-MCTS-Ansätzen signifikant verbessert.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Die Arbeit stellt FinTexTS vor, ein neues groß angelegtes Datenset für Finanzzeitreihen, das durch einen semantikbasierten und mehrstufigen Paarungsansatz mit LLMs erstellt wurde, um komplexe Marktinterdependenzen besser zu erfassen und die Vorhersagegenauigkeit von Aktienkursen zu verbessern.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin AhnWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Die Arbeit stellt SPARC vor, ein dezentralisiertes Multi-Roboter-Pfadplanungssystem, das durch eine relationenverstärkte Multi-Head-Aufmerksamkeitsmechanik (RMHA) räumliche Nähe in die Kommunikation integriert und damit in überfüllten Umgebungen sowie bei der Generalisierung auf deutlich größere Roboterschwärme signifikant bessere Erfolgsraten erzielt als bestehende Methoden.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Die Studie stellt zwei rein softwarebasierte Techniken, Overflow-Aware Scaling (OAS) und Macro Block Scaling (MBS), vor, die die Genauigkeit des MXFP4-Formats für Large Language Models signifikant verbessern und die Leistungslücke zu NVFP4 von durchschnittlich 10 % auf unter 1 % verringern, ohne Hardwareänderungen vorzunehmen.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu KimWed, 11 Ma🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Der autonome Agent „Design Conductor" hat es erstmals geschafft, innerhalb von 12 Stunden vollständig eigenständig einen funktionsfähigen RISC-V-Prozessor (VerCore) mit einer Taktfrequenz von 1,48 GHz von der Anforderungsspezifikation bis zur fertigen GDSII-Layoutdatei zu entwerfen und zu verifizieren.

The Verkor Team, Ravi Krishna, Suresh Krishna, David ChinWed, 11 Ma🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Das Paper stellt CktEvo vor, ein Benchmark und Referenzrahmen für die evolutionäre Optimierung von RTL-Code auf Repository-Ebene, der mittels eines geschlossenen Regelkreises aus LLM-Änderungen und Toolchain-Feedback funktionserhaltende Verbesserungen von Leistung, Leistungsaufnahme und Flächennutzung (PPA) in realen Hardware-Designs ohne menschliches Eingreifen ermöglicht.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang XuWed, 11 Ma🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Die Arbeit stellt SiliconMind-V1 vor, ein einheitliches Multi-Agenten-Framework, das durch testgestützte Verifikation und Debugging-Workflows lokal feinabgestimmte Sprachmodelle befähigt, funktional korrekten Verilog-Code effizienter zu generieren als bisherige State-of-the-Art-Ansätze.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung KungWed, 11 Ma🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Die Arbeit stellt ALADIN vor, ein Framework zur genauigkeits- und latenzbewussten Analyse des Designraums für gemischt-präzise quantisierte neuronale Netze auf eingebetteten KI-Beschleunigern, das die Bewertung von Trade-offs zwischen Genauigkeit, Latenz und Ressourcenverbrauch ohne physische Bereitstellung auf der Zielplattform ermöglicht.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Die Studie liefert vorläufige Belege dafür, dass Alignments-Techniken in Multi-Agenten-LLM-Systemen durch unsichtbare Zensur und komplexe Ausrichtungsbeschränkungen kollektive Pathologien und eine Dissociation zwischen Erkenntnis und Handeln hervorrufen können, was auf eine iatrogene Schädigung durch Sicherheitsmaßnahmen selbst hindeutet.

Hiroki FukuiWed, 11 Ma🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Diese Doktorarbeit stellt neuartige, kosteneffiziente Methoden zur Zuverlässigkeitsbewertung und -verbesserung von Deep-Learning-Hardware-Beschleunigern vor, darunter analytische Bewertungswerkzeuge, optimierte Kompromisse zwischen Quantisierung und Fehlertoleranz sowie die Echtzeit-Technik AdAM, die eine hohe Zuverlässigkeit bei deutlich reduzierten Hardwarekosten ermöglicht.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Das Paper stellt ARKV vor, einen adaptiven und ressourceneffizienten Rahmen zur Verwaltung des KV-Caches bei Large Language Models, der durch dynamische Zuweisung von Präzisionsniveaus basierend auf Aufmerksamkeitsdynamiken und Token-Wichtigkeit die Speichernutzung um den Faktor vier reduziert, während die Genauigkeit bei langen Kontexten nahezu erhalten bleibt.

Jianlong Lei, Shashikant IlagerWed, 11 Ma🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Diese Studie bewertet die blinden Reset-Verfahren zur ancilla-Wiederverwendung auf Superconducting- und Trapped-Ion-Plattformen und zeigt, dass durch sequenzbasiertes Recycling die Zykluslatenz um bis zu 38-fach reduziert werden kann, während die Ancilla-Reinheit und die logische Fehlerrate erhalten bleiben.

Sangkeum LeeWed, 11 Ma⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Diese Arbeit führt eine systematische Überprüfung und Leistungsbewertung von Federated-Learning-Methoden in Edge-Computing-Umgebungen durch, wobei verschiedene Algorithmen hinsichtlich Genauigkeit, Konvergenz und Ressourceneffizienz verglichen werden, um bestehende Herausforderungen wie Datenheterogenität zu identifizieren und eine Forschungsagenda für zukünftige robuste Systeme zu entwickeln.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Die Arbeit stellt Auralink SDC vor, ein Edge-Architekturkonzept mit spezialisierten KI-Agenten, das durch Techniken wie confidence-kalibrierte autonome Fehlerbehebung und adaptive Retrieval-Augmented Reasoning die Zuverlässigkeit und Reaktionsgeschwindigkeit von EV-Ladeinfrastruktur signifikant verbessert und dabei 78 % autonome Störungsbehebung bei sub-50ms-Latenz erreicht.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Diese Arbeit stellt einen Sensitivitäts-basierten Kompressionsrahmen für Reservoir Computing vor, der durch systematische Kombination von Pruning und Quantisierung die Hardware-Effizienz auf FPGAs erheblich steigert, ohne die Modellgenauigkeit zu beeinträchtigen.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Diese umfassende Übersicht untersucht FPGA-basierte KI-Beschleuniger, indem sie deren architektonische Vorteile gegenüber ASICs und GPUs hervorhebt, verschiedene Hardware-Optimierungstechniken analysiert und aktuelle Herausforderungen sowie zukünftige Innovationsmöglichkeiten für das Design solcher Beschleuniger aufzeigt.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur RahamanWed, 11 Ma🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Die Arbeit stellt Zipage vor, einen hochparallelen LLM-Inferenz-Engine, der durch die Kombination von tokenweiser KV-Cache-Komprimierung mit PagedAttention sowie fortschrittlichen Scheduling-Strategien den Speicherkonflikt bei komplexen Reasoning-Aufgaben löst und dabei über 2,1-fache Geschwindigkeitssteigerungen bei nur geringen Genauigkeitseinbußen erzielt.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Diese Studie führt eine systematische, schichten- und blockweise Sensitivitätsanalyse der FP4-Quantisierungsformate NVFP4 und MXFP4 auf verschiedenen Qwen2.5-Modellskalen durch und identifiziert dabei, dass MLP-Projektionsschichten die höchste Empfindlichkeit aufweisen, während die Sensitivität nicht ausschließlich auf die letzten Blöcke beschränkt ist.

Musa Cim, Burak Topcu, Mahmut Taylan KandemirWed, 11 Ma🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Die Arbeit führt das theoretisch fundierte, permutationsäquivariante VI 2D SSM ein, das durch den Verzicht auf künstliche Variablenreihenfolgen und die Reduzierung der Abhängigkeitstiefe auf konstante Komplexität einen neuen State-of-the-Art bei der Modellierung multivariater Zeitreihen erreicht.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Die Arbeit stellt HCAPO vor, ein neues Framework, das durch die Integration von Hindsight-Credit-Assignment und einem Multi-Scale-Vorteilsmechanismus die Effizienz und Erfolgsrate von LLM-Agenten bei langfristigen Aufgaben im Vergleich zu bestehenden Methoden wie GRPO signifikant verbessert.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

← Zurück Weiter →