cs.DC 편의 논문 | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

이 논문은 NVLink, UALink, RDMA 등 현재 인터커넥트 기술들이 'Forward-In-Time-Only'라는 근본적인 범주 오류로 인해 각기 다른 벤더별 시맨틱이 분열된 위기에 처해 있으며, Open Compute Project 의 Open Atomic Ethernet(OAE) 과 같은 명시적 트랜잭션 원리를 통해 이 위기를 해결할 수 있는지를 탐구합니다.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

이 논문은 대규모 공간에서 링크 구성을, 소규모 공간에서 UAV 배치 및 자원 할당을 최적화하는 정밀 잠재 게임 기반 알고리즘에 LLM 을 결합하여 동적 환경에서의 UAV 네트워크 성능을 향상시키는 이중 공간 규모 최적화 프레임워크를 제안합니다.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

이 논문은 비즈니스 정책과 리소스 프로비저닝 간의 전략적 공백을 해소하고, 예측 기반의 계층적 다중 에이전트 시스템 (MAS-H2) 을 통해 클라우드 네이티브 환경의 자동 확장 성능을 획기적으로 개선하고 제로 다운타임 전략 마이그레이션을 가능하게 하는 종단 간 솔루션을 제안합니다.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

이 논문은 이기종 엣지 - 클라우드 환경에서 컨테이너 오케스트레이션을 자동화하는 오픈소스 프레임워크인 CODECO 툴킷을 기존 Kubernetes 워크플로우와 비교 평가하여, 수동 개입을 크게 줄이면서도 경쟁력 있는 성능과 허용 가능한 오버헤드를 유지함을 입증했습니다.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

이 논문은 현대 프로세서의 메모리 병목 현상을 해결하기 위해 실행 중 관찰된 데이터 패턴을 학습하고 애플리케이션 데이터의 의미적 특성을 활용하는 머신러닝 기반의 데이터 인식형 마이크로아키텍처 기법들을 제안하여 성능과 에너지 효율을 획기적으로 향상시켰음을 보여줍니다.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

이 논문은 메모리, 통신, 연산의 통합 최적화 및 다양한 병렬화 기법을 통해 MoE 모델의 확장성 문제를 해결하고, NVIDIA GB200/GB300 클러스터에서 높은 성능을 달성한 Megatron Core 기반의 실용적인 오픈소스 솔루션을 제시합니다.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

이 논문은 DHT 핑거 테이블과 패시브 안정화 기법을 활용하여 메시지 복잡도를 줄이고 글로벌 조정 없이도 임의의 네트워크 분할에 견고한 일관성을 보장하는 '구조화된 속삭임 DNS(Structured Gossip DNS)'를 제안합니다.

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

이 논문은 다중 코어 CPU 환경에서 NUMA 노드 간 메모리 접근 오버헤드를 줄이고 추론 처리량을 최대 46% 향상시키기 위해 ArcLight 라는 경량 LLM 추론 아키텍처를 제안합니다.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

이 논문은 호스트-디바이스 통신 지연을 제거하고 비동기 잠금 해제 작업 도용 풀을 도입하여 골드바흐의 추측을 검증하는 완전 GPU 거주 아키텍처를 제안함으로써, 단일 RTX 5090 에서 $10^{12}$까지의 검증을 36.5 초 만에 수행하는 등 기존 방식 대비 45.6 배의 속도 향상을 달성했다고 요약할 수 있습니다.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

이 논문은 CoPPar Tree 아키텍처의 정확성에 대한 상세한 증명을 제공하는 보완 문서입니다.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

이 논문은 예측 불가능한 출력 길이와 컴퓨팅 및 메모리 요구 사항의 혼재라는 LLM 추론의 특성을 해결하기 위해, 프롬프트와 과거 결과를 활용한 경량 출력 길이 예측과 불확실성을 고려한 스케줄링 정책을 통해 28.7% 이상의 효율성 향상을 달성한 'SageSched'를 제안합니다.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

본 논문은 시각적 노이즈와 물리적 연속성 문제를 해결하여 다양한 VLA 모델의 추론 속도를 최대 1.73 배 향상시키고 오버헤드를 5~7% 로 최소화하는 새로운 엣지 - 클라우드 협력 추론 프레임워크 RAPID 를 제안합니다.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

이 논문은 양자 내성 서명의 온체인 검증 비용을 획기적으로 줄이기 위해 서명 객체 대신 신원 기반의 영지식 증명을 사용하는 새로운 승인 계층 'ZK-ACE'를 제안하고, 그 보안성과 데이터 효율성을 수학적으로 증명합니다.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

이 논문은 포스트 양자 블록체인 환경에서 유효성 증명 (Proof) 을 중계 경로에서 제거하고 경량화된 인증서만 전달하여 대역폭을 획기적으로 줄이는 'AR-ACE' 프로토콜을 제안합니다.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

이 논문은 고장난 데이터 공유를 위한 연방 학습의 한계를 해결하기 위해, 희귀 사건과 데이터 품질을 고려한 샤플리 값을 기반으로 클라이언트 기여도를 평가하고 이를 블록체인 기반의 탈중앙화 합의 프로토콜과 결합하여 보안을 강화하고 자유-라이딩을 방지하는 'SI-ChainFL' 프레임워크를 제안합니다.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

본 논문은 FPGA 가속기와 네트워크 인터페이스를 공동 설계하여 SafarDB 를 제안함으로써, 기존 RDMA 기반 구현 대비 CRDT 및 WRDT 의 지연 시간과 처리량을 획기적으로 개선하고 고장 복원력을 강화한 분산 트랜잭션 시스템을 소개합니다.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

이 논문은 블록체인 프로토콜을 통해 허가 없는 참여를 허용하고 SparseLoCo 최적화기를 활용한 Covenant-72B 를 통해, 대규모 글로벌 분산 학습이 중앙 집중식 모델과 경쟁력 있는 성능을 내며 실현 가능함을 입증했습니다.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

이 논문은 서버리스 플랫폼의 서비스 운영 흐름을 분석하기 위해 토폴로지 모델과 호지 분해 (Hodge decomposition) 를 도입하여, 기능 간 상호작용에서 발생하는 조화 흐름을 구조적 특성으로 해석하고 이를 해결하기 위한 실행 가능한 개선 전략을 제시합니다.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

이 논문은 불규칙한 시계열 구조와 복잡한 질병 경로를 가진 중환자실 전자의무기록을 기반으로 사망 위험을 정확하고 해석 가능하게 예측하기 위해, 명시적 연속 시간 인코딩과 SNOMED 기반 의학적 개념 표현을 통합한 'TA-RNN-Medical-Hybrid'라는 새로운 딥러닝 프레임워크를 제안하고 MIMIC-III 데이터셋에서 우수한 성능과 임상적 통찰력을 입증합니다.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

이 논문은 항공기 엔진 블레이드의 수명 주기 전반에 걸쳐 다자간 승인, 자동화된 검사 일정 관리, AI 모델 출처 추적 및 암호화 증거 바인딩을 통합하여 위변조 방지 감사 가능한 유지보수 추적성을 제공하는 블록체인 기반 시스템 'BladeChain'을 제안하고 그 유효성을 입증합니다.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← 이전 다음 →