cs.AI 편의 논문 | Gist.Science

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

ARKV 는 LLM 의 긴 컨텍스트 추론 시 GPU 메모리 제약을 해결하기 위해 레이어별 어텐션 동역학과 토큰 중요도를 기반으로 정밀도 수준을 동적으로 할당하여 KV 캐시 메모리 사용량을 4 배 줄이면서도 기존 정확도의 약 97% 를 유지하는 경량 적응형 프레임워크를 제안합니다.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

이 논문은 IQM, Rigetti, IonQ 등 다양한 양자 하드웨어 플랫폼에서 측정 없이 보조 큐비트를 재활용하는 '블라인드 리셋' 기법의 성능을 평가하여, 특정 조건에서 논리 오류를 유지하면서 사이클 지연 시간을 최대 38 배까지 단축할 수 있음을 입증하고 배포 전략을 제시합니다.

Sangkeum Lee2026-03-11⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

이 논문은 엣지 컴퓨팅 환경에서 데이터 프라이버시와 대역폭 효율성이 중요한 Federated Learning 기술을 체계적으로 검토하고, 최적화 전략·통신 효율성·개인정보 보호·시스템 아키텍처 네 가지 차원으로 분류하여 SCAFFOLD 와 FedAvg 등 주요 알고리즘을 MNIST 와 CIFAR-10 등 다양한 데이터셋으로 성능 평가함으로써 향후 연구 방향과 개선 과제를 제시합니다.

Sales Aribe Jr., Gil Nicholas Cagande2026-03-11🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

이 논문은 클라우드 의존도의 한계를 극복하고 전기차 충전 인프라의 고장률을 해결하기 위해, 에지 환경에서 신뢰성 있는 자율 복구와 실시간 의사결정을 가능하게 하는 'Auralink SDC' 아키텍처와 이를 뒷받침하는 다중 에이전트 시스템을 제안합니다.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

이 논문은 양자화 수준과 가지치기 비율 간의 트레이드오프를 체계적으로 탐색하여 정확도 저하 없이 FPGA 기반 리저버 컴퓨팅 가속기의 하드웨어 효율성을 극대화하는 민감도 기반 압축 프레임워크를 제안합니다.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

이 논문은 딥러닝 모델의 복잡성 증가에 따른 고성능 및 고효율 하드웨어 가속기의 필요성을 배경으로, ASIC 과 GPU 의 한계를 극복하는 재구성 가능한 FPGA 기반 가속기의 설계 최적화 기법과 최신 연구 동향을 종합적으로 검토하고 향후 과제를 제시합니다.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur Rahaman2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

이 논문은 토큰 단위 KV 캐시 제거와 PagedAttention 을 결합한 'Compressed PagedAttention'과 이를 구현한 'Zipage'를 제안하여, 대규모 수학 추론 작업에서 풀 KV 인ference 엔진의 성능을 약 95% 유지하면서 2.1 배 이상의 처리 속도 향상을 달성함을 보여줍니다.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

이 논문은 Qwen2.5 모델의 다양한 규모와 MXFP4 및 NVFP4 포맷을 대상으로 한 체계적인 분석을 통해, MLP 상/하단 프로젝션 레이어가 FP4 양자화에 가장 민감하며 민감도가 모델의 특정 블록에만 국한되지 않는다는 사실을 규명했습니다.

Musa Cim, Burak Topcu, Mahmut Taylan Kandemir2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

이 논문은 다변량 시계열 모델링에서 변수 순서의 인위적 의존성을 제거하기 위해 순열 동등성을 보장하는 이론적 기저를 제시하고, 이를 바탕으로 변수 축의 순차적 의존성을 제거하며 상태-of-the-art 성능을 달성하는 'VI 2D Mamba' 아키텍처를 제안합니다.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

이 논문은 희소 보상 환경에서 장기적 할당 문제를 해결하기 위해 사후 추론을 통해 단계별 가치 추정과 기준선을 정교화하는 새로운 프레임워크인 HCAPO 를 제안하며, WebShop 과 ALFWorld 등 다양한 벤치마크에서 기존 최첨단 방법론보다 뛰어난 성과를 입증했습니다.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

이 논문은 LLM 추론을 타입 안전성, 신뢰성, 격리된 컨텍스트, 자격 증명 보호, 컴파일 시 스키마 바인딩을 보장하는 언어 수준 원시 기능으로 통합하여 자율적 에이전트 소프트웨어를 위한 컴파일된 액터 기반 프로그래밍 언어 'Turn'을 제안합니다.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

이 논문은 군 $G$ 가 공간 $M$ 에 전이적으로 작용할 때, $X \times M$ 위의 $G$ -불변 함수를 $M$ 의 등방성 부분군 $H$ 가 $X$ 에 작용하는 불변 함수로 명시적으로 축소하는 이론을 제시하여, 기존 방법의 구조적 제약을 해소하고 임의의 군 작용과 균질한 조건부 공간에 적용 가능한 일반화된 등변 신경장 (Equivariant Neural Fields) 을 확장합니다.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

이 논문은 EDM 의 구조적 특성에 맞춰 전문적으로 주석된 EDM-98 데이터셋과 자기지도 학습을 결합한 'EDMFormer' 모델을 제안하여, 기존 모델들이 어려움을 겪던 EDM 곡의 구조 분할 및 레이블링 성능을 크게 향상시켰음을 보여줍니다.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song Bae2026-03-11🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.

Shaun Feakins, Ibrahim Habli, Phillip Morgan2026-03-11🤖 cs.AI

Multi-level meta-reinforcement learning with skill-based curriculum

이 논문은 하위 작업들을 계층적으로 압축하고 기술을 임베딩과 기능으로 분해하여 커리큘럼 학습 프레임워크 내에서 복잡한 의사결정 문제의 효율성을 높이고 작업 간 전이를 가능하게 하는 다단계 메타-강화 학습 방법을 제안합니다.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)2026-03-11🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

이 논문은 지식 기반을 활용해 도구 생성 및 호출을 자동화하는 대규모 언어 모델 (LLM) 프레임워크를 제안하여 초전도 큐비트의 제어 및 측정 실험을 자동화하고, 공진기 특성 분석 및 양자 비파괴 측정 재현 등 다양한 실험을 성공적으로 수행한 사례를 소개합니다.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. Cleland2026-03-11⚛️ quant-ph

← 이전 다음 →

cs.AI