Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

이 논문은 대규모 공간에서 링크 구성을, 소규모 공간에서 UAV 배치 및 자원 할당을 최적화하는 정밀 잠재 게임 기반 알고리즘에 LLM 을 결합하여 동적 환경에서의 UAV 네트워크 성능을 향상시키는 이중 공간 규모 최적화 프레임워크를 제안합니다.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

이 논문은 비즈니스 정책과 리소스 프로비저닝 간의 전략적 공백을 해소하고, 예측 기반의 계층적 다중 에이전트 시스템 (MAS-H2) 을 통해 클라우드 네이티브 환경의 자동 확장 성능을 획기적으로 개선하고 제로 다운타임 전략 마이그레이션을 가능하게 하는 종단 간 솔루션을 제안합니다.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

이 논문은 이기종 엣지 - 클라우드 환경에서 컨테이너 오케스트레이션을 자동화하는 오픈소스 프레임워크인 CODECO 툴킷을 기존 Kubernetes 워크플로우와 비교 평가하여, 수동 개입을 크게 줄이면서도 경쟁력 있는 성능과 허용 가능한 오버헤드를 유지함을 입증했습니다.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

이 논문은 현대 프로세서의 메모리 병목 현상을 해결하기 위해 실행 중 관찰된 데이터 패턴을 학습하고 애플리케이션 데이터의 의미적 특성을 활용하는 머신러닝 기반의 데이터 인식형 마이크로아키텍처 기법들을 제안하여 성능과 에너지 효율을 획기적으로 향상시켰음을 보여줍니다.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

이 논문은 메모리, 통신, 연산의 통합 최적화 및 다양한 병렬화 기법을 통해 MoE 모델의 확장성 문제를 해결하고, NVIDIA GB200/GB300 클러스터에서 높은 성능을 달성한 Megatron Core 기반의 실용적인 오픈소스 솔루션을 제시합니다.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

이 논문은 호스트-디바이스 통신 지연을 제거하고 비동기 잠금 해제 작업 도용 풀을 도입하여 골드바흐의 추측을 검증하는 완전 GPU 거주 아키텍처를 제안함으로써, 단일 RTX 5090 에서 $10^{12}$까지의 검증을 36.5 초 만에 수행하는 등 기존 방식 대비 45.6 배의 속도 향상을 달성했다고 요약할 수 있습니다.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

이 논문은 예측 불가능한 출력 길이와 컴퓨팅 및 메모리 요구 사항의 혼재라는 LLM 추론의 특성을 해결하기 위해, 프롬프트와 과거 결과를 활용한 경량 출력 길이 예측과 불확실성을 고려한 스케줄링 정책을 통해 28.7% 이상의 효율성 향상을 달성한 'SageSched'를 제안합니다.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

본 논문은 시각적 노이즈와 물리적 연속성 문제를 해결하여 다양한 VLA 모델의 추론 속도를 최대 1.73 배 향상시키고 오버헤드를 5~7% 로 최소화하는 새로운 엣지 - 클라우드 협력 추론 프레임워크 RAPID 를 제안합니다.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

이 논문은 고장난 데이터 공유를 위한 연방 학습의 한계를 해결하기 위해, 희귀 사건과 데이터 품질을 고려한 샤플리 값을 기반으로 클라이언트 기여도를 평가하고 이를 블록체인 기반의 탈중앙화 합의 프로토콜과 결합하여 보안을 강화하고 자유-라이딩을 방지하는 'SI-ChainFL' 프레임워크를 제안합니다.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

이 논문은 블록체인 프로토콜을 통해 허가 없는 참여를 허용하고 SparseLoCo 최적화기를 활용한 Covenant-72B 를 통해, 대규모 글로벌 분산 학습이 중앙 집중식 모델과 경쟁력 있는 성능을 내며 실현 가능함을 입증했습니다.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

이 논문은 불규칙한 시계열 구조와 복잡한 질병 경로를 가진 중환자실 전자의무기록을 기반으로 사망 위험을 정확하고 해석 가능하게 예측하기 위해, 명시적 연속 시간 인코딩과 SNOMED 기반 의학적 개념 표현을 통합한 'TA-RNN-Medical-Hybrid'라는 새로운 딥러닝 프레임워크를 제안하고 MIMIC-III 데이터셋에서 우수한 성능과 임상적 통찰력을 입증합니다.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

이 논문은 항공기 엔진 블레이드의 수명 주기 전반에 걸쳐 다자간 승인, 자동화된 검사 일정 관리, AI 모델 출처 추적 및 암호화 증거 바인딩을 통합하여 위변조 방지 감사 가능한 유지보수 추적성을 제공하는 블록체인 기반 시스템 'BladeChain'을 제안하고 그 유효성을 입증합니다.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs