Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits
이 논문은 제한된 에지 자원과 불확실한 서비스 수요 하에서 지연을 최소화하는 최적의 서비스 배치를 찾기 위해, 소셀 네트워크의 기지국들이 협력하여 선형 밴딧 문제를 해결하는 분산형 적응적 최적-arm 식별 알고리즘을 제안하고 그 성능을 이론적·실험적으로 검증합니다.
2316 편의 논문
이 논문은 제한된 에지 자원과 불확실한 서비스 수요 하에서 지연을 최소화하는 최적의 서비스 배치를 찾기 위해, 소셀 네트워크의 기지국들이 협력하여 선형 밴딧 문제를 해결하는 분산형 적응적 최적-arm 식별 알고리즘을 제안하고 그 성능을 이론적·실험적으로 검증합니다.
이 논문은 그론월 부등식을 사용하여 볼록 및 비볼록 목적 함수 하에서 확률적 경사 하강법 (SGD) 과 확률적 헤비 볼 (SHB) 알고리즘의 마지막 반복에 대한 수렴 속도를 분석하고 새로운 수렴 오차 한계를 제시합니다.
본 논문은 지반공학의 압밀 문제에 DeepONet 아키텍처를 적용하여 물리 기반 모델 (Model 3) 과 푸리에 특징이 강화된 3D 모델 (Model 4) 의 성능을 비교 평가함으로써, 기존 수치 해석 대비 최대 1,000 배의 속도 향상과 불확실성 정량화 가속화를 가능하게 하는 과학적 머신러닝의 잠재력을 입증했습니다.
이 논문은 물리적 사전 지식 (관성, 감쇠, 학습된 퍼텐셜 등) 을 기반으로 한 언더댐프드 랑베인 방정식을 잠재 공간의 시간 진화에 적용하여, 생물학적 신경 집단의 진동 및 흐름 특성을 효과적으로 모델링하고 기존 최첨단 방법들보다 우수한 성능을 보이는 'LangevinFlow'라는 시퀀스 변분 오토인코더를 제안합니다.
이 논문은 다양한 신체 구조의 데이터를 광학 흐름을 통해 통합하여 세계 모델을 사전 학습한 후, 이를 타겟 로봇의 소량 데이터로 미세 조정하고 가치 함수를 활용해 행동 복제 정책을 최적화함으로써 저데이터 환경에서 로봇 시각-운동 정책의 성능을 획기적으로 향상시키는 '잠재 정책 조종 (LPS)' 방법을 제안합니다.
이 논문은 투명하고 검증 가능한 제어 정책 개발을 위해 멀티모달 대형 언어 모델과 진화적 탐색을 결합한 MLES 방식을 제안하며, 시각적 피드백을 통해 정책 생성을 자동화하고 PPO 와 유사한 성능을 달성함을 보여줍니다.
이 논문은 다양한 소스로부터의 데이터 분포 변화와 샘플 크기 편차를 해결하면서도 전체 정확도와 소스별 이질성을 동시에 보장하기 위해 교차 도메인 잔차 학습과 적응형 클러스터링을 결합한 메타학습 기법인 'CTRL'을 제안하고, 스위치 난민 프로그램 등 5 개 대규모 데이터셋을 통해 기존 벤치마크보다 우수한 성능을 입증합니다.
이 논문은 HeyGem 과 같은 오픈소스 도구를 활용해 텍스트 기반 강의 개요를 가상 아바타가 부르는 노래로 변환함으로써 학생들의 참여도와 정보 기억력을 향상시키는 새로운 교수법을 제안하고 그 효과를 입증했습니다.
본 논문은 단일 건물 모델의 한계를 극복하고 다양한 제어 시나리오에서 물리 기반의 정밀한 다중 건물 유연성 분석 및 조정을 가능하게 하는 확장 가능한 오픈소스 플랫폼 'MuFlex'를 제안하며, 이를 통해 강화학습 기반의 수요 반응 최적화 가능성을 입증했습니다.
이 논문은 RF 회로의 비선형적 특성과 높은 시뮬레이션 비용을 해결하기 위해 RFIC 도메인 지식을 그래프 신경망에 접목하여, 소량 데이터로도 다양한 토폴로지의 능동 RF 회로 성능을 기존 기술 대비 9.2 배 정밀하게 예측하는 경량화된 프레임워크를 제안합니다.
이 논문은 추상적 추론이 필요한 대수적 작업에서 일반화 능력을 향상시키기 위해, 테스트 데이터 분포보다 단순한 Few-shot 예제를 선택적으로 반복적으로 구성하는 새로운 인-컨텍스트 학습 전략을 제안하고 그 유효성을 입증합니다.
이 논문은 T-A 공식으로 생성된 유한요소법 데이터를 기반으로 학습된 잔류 신경망 (FCRN) 기반 대리 모델을 개발하여 고온 초전도 자석의 전류 분포를 신속하고 정확하게 예측함으로써 대규모 자석의 지능형 설계를 가능하게 했음을 보여줍니다.
이 논문은 구면 상의 함수 적분, 특히 슬라이스된 워터스테인 거리 계산을 위해 부정적 의존성을 가진 반발적 몬테카를로 방법 (DPP, 반발 점 과정 등) 과 UnifOrtho 추정기를 제안하고 벤치마크하여, 차원에 따라 무작위 준몬테카를로 또는 UnifOrtho 를 사용하는 것이 최적임을 규명합니다.
이 논문은 대규모 일반화 정책 기반의 로봇 학습 연구를 지원하기 위해 시뮬레이션과 실제 환경 간 전환을 원활하게 하는 경량화되고 모듈화된 로봇 제어 스택 (RCS) 을 제안하고, 그 아키텍처 설계 원리와 VLA 및 RL 정책 개발 과정에서의 유용성과 성능을 평가합니다.
이 논문은 생물학적 동기화 현상에서 영감을 받아 주기적 도메인에서 스토캐스틱 쿠라모토 동역학을 활용하여 지문 및 질감처럼 방향성이 풍부한 이미지의 생성 품질을 획기적으로 개선한 새로운 스코어 기반 생성 모델을 제안합니다.
이 논문은 LLM 코드 변이 에이전트인 AlphaEvolve 를 활용하여 MAX-CUT, MAX-4-CUT, MAX-3-CUT, 그리고 TSP 등 다양한 조합 최적화 문제의 근사 불가능성 하한을 개선하고, 생성된 구조물의 검증을 가속화하는 새로운 방법을 제시함으로써 인공지능이 복잡성 이론의 발전에 기여할 수 있음을 보여줍니다.
이 논문은 ConceptNet 과 WordNet 의 외부 지식 그래프를 통합하여 일반 비전 - 언어 모델의 한계를 극복하고, 재해 위성 및 UAV 이미지 설명의 정확성과 실용성을 획기적으로 향상시킨 'VLCE' 프레임워크를 제안하고 xBD 와 RescueNet 데이터셋에서 그 우수성을 입증합니다.
이 논문은 테스트 시간 엔트로피 최소화 과정에서 발생할 수 있는 모델 붕괴를 방지하고 학습 신호를 정규화하기 위해 비대칭 시아미즈 아키텍처인 ZeroSiam을 제안하여, 다양한 비전 및 언어 모델에서 안정적이고 효율적인 적응을 가능하게 합니다.
이 논문은 추가적인 학습 없이 기존 확산 또는 플로우 기반 로봇 정책들의 분포 점수를 결합하여 테스트 시간에 새로운 정책을 구성하는 '일반 정책 조합 (GPC)' 방법을 제안하고, 이를 통해 개별 정책보다 우수한 성능을 달성할 수 있음을 이론적 근거와 실험을 통해 입증합니다.
이 논문은 비선형 시변 시스템의 제어에서 심층 강화학습 (DRL) 의 성능을 극대화하고 시간 변화에 대한 강인성을 확보하기 위해, DRL 과 경계 극값 탐색 (ES) 을 결합한 하이브리드 제어기 개발과 그 유효성을 수치 시뮬레이션 및 로스 알라모스 중성자 과학 센터의 입자가속기 빔 수송 시스템 자동 튜닝 사례를 통해 입증했습니다.