cs.AI 편의 논문 | Gist.Science

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

이 논문은 희소하거나 편향된 보상 환경에서 기존 Dec-MCTS 의 한계를 극복하기 위해, 단일 에이전트 MCTS 에서 연구된 볼츠만 탐색을 다중 에이전트 시스템에 최초로 적용한 '조정된 볼츠만 MCTS(CB-MCTS)'를 제안하고, 이를 통해 기만적 시나리오에서 우수한 성능을 보이며 표준 벤치마크에서도 경쟁력 있는 강건한 분산 다중 에이전트 계획 솔루션을 제공함을 보여줍니다.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

이 논문은 단순한 키워드 매칭의 한계를 극복하기 위해 의미 기반 및 다수준 매칭 프레임워크를 제안하여, SEC filing 과 LLM 을 활용하여 뉴스와 주가 데이터를 정교하게 연결한 대규모 금융 텍스트-시계열 데이터셋 'FinTexTS'를 구축하고 주가 예측 성능을 입증했습니다.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin AhnWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

이 논문은 기존 학습 기반 통신 방식의 공간적 무관심 문제를 해결하기 위해 쌍별 맨해튼 거리를 주시 가중치 계산에 명시적으로 통합한 '관계 강화 멀티헤드 어텐션 (RMHA)'을 제안하여, 고밀도 환경에서 로봇 간 협업을 극대화하고 대규모 군집으로의 제로샷 일반화 성능을 획기적으로 향상시켰습니다.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

이 논문은 하드웨어 변경 없이 소프트웨어 기법인 오버플로우 인식 스케일링 (OAS) 과 매크로 블록 스케일링 (MBS) 을 도입하여 MXFP4 의 양자화 오차를 줄이고 NVFP4 와의 정확도 격차를 10% 에서 1% 미만으로 축소함으로써, MXFP4 를 하드웨어 효율성을 유지하면서 NVFP4 에 버금가는 성능을 내는 실용적인 대안으로 재탄생시켰음을 보여줍니다.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu KimWed, 11 Ma🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

이 논문은 219 단어의 요구사항 문서에서 시작해 12 시간 만에 1.48GHz 로 동작하는 완전한 RISC-V CPU(VerCore) 를 RTL 설계부터 GDSII 레이아웃까지 전 과정 자율적으로 구현한 'Design Conductor'라는 자율 에이전트를 소개합니다.

The Verkor Team, Ravi Krishna, Suresh Krishna, David ChinWed, 11 Ma🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

이 논문은 기존 벤치마크가 다루지 못했던 레포지토리 수준의 RTL 코드 진화를 평가하기 위해, 실제 IP 코어 간의 종속성을 고려하여 기능은 유지하면서 전력·성능·면적 (PPA) 을 개선하는 LLM 기반 벤치마크 및 폐루프 프레임워크인 'CktEvo'를 제안합니다.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang XuWed, 11 Ma🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

이 논문은 비용과 데이터 프라이버시 문제를 해결하고 기능적 정확성을 보장하기 위해 테스트벤치 기반 검증이 통합된 다중 에이전트 프레임워크를 제안하여, 로컬 파인튜닝 LLM 인 'SiliconMind-V1'이 테스트 시간 확장 방식을 통해 Verilog RTL 설계를 생성, 테스트, 디버깅할 수 있도록 함으로써 기존 최첨단 모델보다 우수한 성능을 달성했다고 설명합니다.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung KungWed, 11 Ma🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

이 논문은 임베디드 AI 가속기를 위한 정밀도-지연 시간 인식 설계 공간 추론 분석 프레임워크인 ALADIN 을 제안하여, 실제 플랫폼 배포 없이도 혼합 정밀도 양자화 신경망의 추론 병목 현상과 설계 트레이드오프를 정량적으로 평가하고 하드웨어 - 소프트웨어 공동 설계를 지원할 수 있음을 보여줍니다.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

이 논문은 대규모 언어 모델의 정렬 (alignment) 기법이 오히려 집단적 병리 현상을 유발할 수 있으며, 특히 보이지 않는 검열과 복잡한 정렬 제약이 모델 간 상호작용에서 해로운 결과를 초래할 수 있음을 시사합니다.

Hiroki FukuiWed, 11 Ma🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

이 논문은 DNN 하드웨어 가속기의 신뢰성을 평가하고 향상시키기 위해 기존 연구의 공백을 분석하고 새로운 분석 도구를 개발하며, 효율성과 내결함성 간의 균형을 최적화하는 방법론과 AdAM 이라는 실시간 무부하 신뢰성 향상 기법을 제안합니다.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

ARKV 는 LLM 의 긴 컨텍스트 추론 시 GPU 메모리 제약을 해결하기 위해 레이어별 어텐션 동역학과 토큰 중요도를 기반으로 정밀도 수준을 동적으로 할당하여 KV 캐시 메모리 사용량을 4 배 줄이면서도 기존 정확도의 약 97% 를 유지하는 경량 적응형 프레임워크를 제안합니다.

Jianlong Lei, Shashikant IlagerWed, 11 Ma🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

이 논문은 IQM, Rigetti, IonQ 등 다양한 양자 하드웨어 플랫폼에서 측정 없이 보조 큐비트를 재활용하는 '블라인드 리셋' 기법의 성능을 평가하여, 특정 조건에서 논리 오류를 유지하면서 사이클 지연 시간을 최대 38 배까지 단축할 수 있음을 입증하고 배포 전략을 제시합니다.

Sangkeum LeeWed, 11 Ma⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

이 논문은 엣지 컴퓨팅 환경에서 데이터 프라이버시와 대역폭 효율성이 중요한 Federated Learning 기술을 체계적으로 검토하고, 최적화 전략·통신 효율성·개인정보 보호·시스템 아키텍처 네 가지 차원으로 분류하여 SCAFFOLD 와 FedAvg 등 주요 알고리즘을 MNIST 와 CIFAR-10 등 다양한 데이터셋으로 성능 평가함으로써 향후 연구 방향과 개선 과제를 제시합니다.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

이 논문은 클라우드 의존도의 한계를 극복하고 전기차 충전 인프라의 고장률을 해결하기 위해, 에지 환경에서 신뢰성 있는 자율 복구와 실시간 의사결정을 가능하게 하는 'Auralink SDC' 아키텍처와 이를 뒷받침하는 다중 에이전트 시스템을 제안합니다.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

이 논문은 양자화 수준과 가지치기 비율 간의 트레이드오프를 체계적으로 탐색하여 정확도 저하 없이 FPGA 기반 리저버 컴퓨팅 가속기의 하드웨어 효율성을 극대화하는 민감도 기반 압축 프레임워크를 제안합니다.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

이 논문은 딥러닝 모델의 복잡성 증가에 따른 고성능 및 고효율 하드웨어 가속기의 필요성을 배경으로, ASIC 과 GPU 의 한계를 극복하는 재구성 가능한 FPGA 기반 가속기의 설계 최적화 기법과 최신 연구 동향을 종합적으로 검토하고 향후 과제를 제시합니다.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur RahamanWed, 11 Ma🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

이 논문은 토큰 단위 KV 캐시 제거와 PagedAttention 을 결합한 'Compressed PagedAttention'과 이를 구현한 'Zipage'를 제안하여, 대규모 수학 추론 작업에서 풀 KV 인ference 엔진의 성능을 약 95% 유지하면서 2.1 배 이상의 처리 속도 향상을 달성함을 보여줍니다.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

이 논문은 Qwen2.5 모델의 다양한 규모와 MXFP4 및 NVFP4 포맷을 대상으로 한 체계적인 분석을 통해, MLP 상/하단 프로젝션 레이어가 FP4 양자화에 가장 민감하며 민감도가 모델의 특정 블록에만 국한되지 않는다는 사실을 규명했습니다.

Musa Cim, Burak Topcu, Mahmut Taylan KandemirWed, 11 Ma🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

이 논문은 다변량 시계열 모델링에서 변수 순서의 인위적 의존성을 제거하기 위해 순열 동등성을 보장하는 이론적 기저를 제시하고, 이를 바탕으로 변수 축의 순차적 의존성을 제거하며 상태-of-the-art 성능을 달성하는 'VI 2D Mamba' 아키텍처를 제안합니다.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

이 논문은 희소 보상 환경에서 장기적 할당 문제를 해결하기 위해 사후 추론을 통해 단계별 가치 추정과 기준선을 정교화하는 새로운 프레임워크인 HCAPO 를 제안하며, WebShop 과 ALFWorld 등 다양한 벤치마크에서 기존 최첨단 방법론보다 뛰어난 성과를 입증했습니다.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

← 이전 다음 →