cs.AI papers | Gist.Science

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Dit paper introduceert Coordinated Boltzmann MCTS (CB-MCTS), een nieuwe methode die deterministische UCT vervangt door een stochastisch Boltzmann-beleid met een vervagende entropiebonus om Dec-MCTS robuuster te maken in omgevingen met schaarse of scheef verdeelde beloningen.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Dit paper introduceert FinTexTS, een nieuw groot dataset voor gepaarde financiële tekst en tijdreeksen dat gebruikmaakt van een semantisch en meer-niveau koppelingsframework om complexe marktinteracties beter vast te leggen dan bestaande methoden op basis van trefwoorden, wat leidt tot verbeterde voorspellingen van aandelenprijzen.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin AhnWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Dit paper introduceert SPARC, een methode voor gedecentraliseerde multi-robot padplanning die een relationeel versterkt multi-head attention-mechanisme (RMHA) gebruikt om communicatie te optimaliseren op basis van ruimtelijke nabijheid, wat resulteert in aanzienlijk betere prestaties in dichtbevolkte omgevingen vergeleken met bestaande methoden.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Dit paper introduceert twee software-only technieken, Overflow-Aware Scaling en Macro Block Scaling, die de nauwkeurigheidskloof tussen het MXFP4- en NVFP4-quantisatieformaat voor grote taalmodellen van ongeveer 10% tot minder dan 1% verkleinen zonder hardware-aanpassingen.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu KimWed, 11 Ma🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Het paper introduceert Design Conductor, een autonoom agent dat binnen 12 uur een volledig werkende, 1,48 GHz RISC-V CPU (VerCore) heeft ontworpen en verifieerd tot het tape-out-ready GDSII-formaat, wat de eerste keer is dat een dergelijk systeem een processor van concept tot fysiek ontwerp volledig zelfstandig realiseert.

The Verkor Team, Ravi Krishna, Suresh Krishna, David ChinWed, 11 Ma🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Dit paper introduceert CktEvo, een benchmark en referentiekader dat grote taalmodellen in staat stelt om op repository-niveau functioneel correcte RTL-code te evolueren met als doel de Power, Performance en Area (PPA) te verbeteren door middel van een gesloten lus met toolchain-feedback.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang XuWed, 11 Ma🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Het artikel introduceert SiliconMind-V1, een lokaal fijngefineerd multi-agent framework dat door middel van testgedreven verificatie en iteratief debuggen functioneel correcte Verilog-code genereert en hiermee de huidige state-of-the-art prestaties verbetert.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung KungWed, 11 Ma🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Dit paper introduceert ALADIN, een framework voor nauwkeurigheids- en latentiebewuste ontwerpruimte-analyse dat de prestaties van gemengd-precisie kwantiseringsneuronale netwerken op ingebouwde AI-accelerators evalueert zonder fysieke implementatie, waardoor de ontwikkelingstijd en -kosten aanzienlijk worden verlaagd.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Deze voorlopige studie suggereert dat alignatietechnieken in grote taalmodellen op collectief niveau juist iatrogene schade kunnen veroorzaken, waarbij onzichtbare censuur en complexere veiligheidsbeperkingen leiden tot verhoogde collectieve pathologieën en een dissociatie tussen inzicht en handelen.

Hiroki FukuiWed, 11 Ma🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Deze proefschriftsamenvatting presenteert kostenefficiënte methoden voor het beoordelen en verbeteren van de betrouwbaarheid van DNN-hardwareversnellers, waaronder een nieuwe analytische tool en de real-time, zero-overhead techniek AdAM die fouttolerantie biedt met aanzienlijk lagere hardwarekosten.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Dit paper introduceert ARKV, een lichtgewicht en adaptief framework dat de geheugenefficiëntie van Large Language Models bij lange contexten aanzienlijk verbetert door dynamisch precisieniveaus toe te wijzen aan tokens op basis van hun belang, waardoor het KV-cachegebruik met een factor 4 wordt gereduceerd zonder significante kwaliteitsverlies.

Jianlong Lei, Shashikant IlagerWed, 11 Ma🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Dit onderzoek evalueert op meerdere kwantumplatforms de 'blinde reset'-methode voor het hergebruiken van ancilla-qubits zonder meting, en toont aan dat deze techniek de cycluslatentie aanzienlijk kan verminderen terwijl de reinheid van de qubits behouden blijft.

Sangkeum LeeWed, 11 Ma⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Dit artikel presenteert een systematische review en prestatie-evaluatie van federatief leertechnieken in edge-computingomgevingen, waarbij vijf toonaangevende algoritmen worden vergeleken op basis van nauwkeurigheid, communicatie-efficiëntie en energieconsumptie om bestaande uitdagingen te identificeren en een onderzoeksagenda voor de toekomst te schetsen.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Dit artikel introduceert Auralink SDC, een architectuur met edge-geplaatste AI-agenten die autonome, veilige en responsieve beheeroplossingen biedt voor openbare laadinfrastructuur, waardoor de hoge uitvalpercentages en trage reparatietijden van bestaande cloudsystemen worden overwonnen.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Dit artikel presenteert een compressieframework voor Reservoir Computing dat gebruikmaakt van een op gevoeligheid gebaseerde prune-mechanisme om de afweging tussen kwantisatie, pruning en hardware-efficiëntie te optimaliseren, wat resulteert in aanzienlijke verbeteringen in resourcegebruik en energie-efficiëntie op FPGA's zonder merkbare nauwkeurigheidsverlies.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Dit artikel biedt een uitgebreid overzicht van FPGA-gebaseerde AI-acceleratoren voor deep learning, waarbij het de architecturale ontwerpen, prestatieoptimalisaties en huidige uitdagingen analyseert om toekomstige innovaties te faciliteren.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur RahamanWed, 11 Ma🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Dit paper introduceert Zipage, een hoog-concurrentie LLM-inferentie-engine die Compressed PagedAttention combineert met geavanceerde scheduling en compressie om de geheugenbottleneck bij redenerende modellen op te lossen en zo een snelheidswinst van meer dan 2,1x te bereiken met behoud van 95% van de prestaties.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Deze studie analyseert systematisch de gevoeligheid voor kwantisatie van twee FP4-formaten (MXFP4 en NVFP4) in Qwen2.5-modellen en onthult dat de MLP-up- en down-projectielagen het meest gevoelig zijn, terwijl de gevoeligheid niet uitsluitend beperkt blijft tot de laatste blokken.

Musa Cim, Burak Topcu, Mahmut Taylan KandemirWed, 11 Ma🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Dit paper introduceert het VI 2D SSM, een nieuw architecturaal kader voor multivariate tijdreeksen dat de inherente permutatie-symmetrie respecteert door variabele-afhankelijkheden te vervangen door een canonieke vorm van lokale zelfdynamiek en globale interactie, wat leidt tot state-of-the-art prestaties en verbeterde schaalbaarheid.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Dit paper introduceert HCAPO, een nieuw framework dat hindsight credit assignment integreert in LLM-agenten om de uitdagingen van credit assignment in lange-termijn taken aan te pakken en zo de prestaties significant te verbeteren ten opzichte van bestaande methoden zoals GRPO.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

← Vorige Volgende →