Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
이 논문은 ReinMax 추정기의 높은 분산을 Rao-Blackwellisation 및 제어 변수 기법을 통해 개선한 ReinMax-Rao 와 ReinMax-CV 추정기를 제안하고, 이를 통해 이산 잠재 변수를 가진 변이 오토인코더의 학습 성능을 향상시켰음을 보여줍니다.
329 편의 논문
이 논문은 ReinMax 추정기의 높은 분산을 Rao-Blackwellisation 및 제어 변수 기법을 통해 개선한 ReinMax-Rao 와 ReinMax-CV 추정기를 제안하고, 이를 통해 이산 잠재 변수를 가진 변이 오토인코더의 학습 성능을 향상시켰음을 보여줍니다.
이 논문은 비구속 상태 공간에서 가우시안 프로세스 사후 샘플링 강화 학습 (GP-PSRL) 알고리즘의 베이지안 후회 상한을 유도하여, 최대 정보 획득량에 대한 최적의 의존성과 비구속 상태 공간의 문제를 해결하고 기존 이론적 한계를 극복했습니다.
이 논문은 유효성, 희소성, 근접성 및 새로운 소프트-DTW 기반의 타당성 요소를 결합한 손실 함수를 통해 시계열 분류 문제에 대해 현실적인 시간적 구조를 가진 반사실적 설명을 생성하는 새로운 방법을 제안하고, 기존 방법들보다 타겟 클래스와의 분포 정렬 및 시간적 현실성 측면에서 우수한 성능을 입증합니다.
이 논문은 온라인 A/B 테스트의 차분 평균 추정기와 최적 제어 변수를 갖춘 오프 정책 역확률 가중 추정기 간의 수학적 동등성, 그리고 회귀 보정 기법과 이중 강건 추정 간의 구조적 동등성을 증명하여 두 분야의 분산 감소 방법을 통합하는 이론적 틀을 제시합니다.
이 논문은 불균형 데이터의 과적합 문제를 해결하기 위해 국소적 가중치 업데이트를 역사적 시퀀스로 대체하는 '가중 분수 웨일 적분'을 기반으로 한 새로운 최적화 알고리즘을 제안하며, 의료 진단 및 금융 사기 탐지에서 기존 최적화 기법 대비 PR-AUC 를 약 40% 향상시키는 성과를 입증했습니다.
이 논문은 기존에 복잡한 모델에 적용하기 어려웠던 신념 집합 (credal sets) 기반의 불확실성 추정을, 앙상블 학습 없이도 효율적으로 수행할 수 있는 '탈교정 (decalibration)' 기법을 통해 가능하게 함으로써 안전-중요 분야에서 신뢰할 수 있는 불확실성 표현을 실현합니다.
이 논문은 다목적 강화학습의 오목 스칼라화 문제에서 발생하는 편향 장벽을 해결하기 위해 다단계 몬테카를로 추정기를 활용한 자연 정책 경계 알고리즘을 제안함으로써, -최적 정책을 계산하는 데 있어 최적의 샘플 복잡도 보장을 달성했습니다.
이 논문은 하류 위험 목표와 정렬된 생성기를 학습하여 다양한 정책 하에서 최악의 위험 편차를 식별하는 적대적 정책을 도입함으로써, VaR 및 ES 와 같은 조건부 위험 시나리오를 보다 정확하게 생성하는 '생성적 적대 회귀 (GAR)' 프레임워크를 제안합니다.
이 논문은 강화학습에서 상태 그래프의 대수적 연결성 (algebraic connectivity) 이 학습된 라플라시안 표현을 통한 가치 함수 근사 오차에 미치는 영향을 이론적으로 규명하고, 이를 일반 정책 하에서 검증하여 차원의 저주 문제를 해결하는 새로운 통찰을 제공합니다.
이 논문은 Nesterov 가속화를 매개변수 업데이트와 확률 분포 공간에 모두 도입하여 'Momentum SVGD-EM'이라는 새로운 알고리즘을 제안함으로써, 최대 주변 가능도 추정 (MMLE) 문제의 수렴 속도를 다양한 차원과 난이도에서 획기적으로 개선함을 보여줍니다.
이 논문은 고차원 변수 간의 인과 효과가 저차원 요약 통계량인 '병목'에 의존한다는 가정을 바탕으로, 기존 인과 표현 학습이나 추상화 학습의 대안이 될 수 있는 새로운 구조적 인과 모델인 '구조적 인과 병목 모델 (SCBMs)'을 제안하고 그 식별성, 정보 병목 이론과의 연관성, 그리고 실험적 추정 방법과 저샘플 전이 학습에서의 효과를 분석합니다.
이 논문은 기존 휴리스틱 방법론의 한계를 극복하고, 이산적 분기-한계 (disjunctive branch-and-bound) 기법과 새로운 볼록 완화 기법을 통해 저랭크 행렬 완성 문제를 최적성 보장을 갖는 방식으로 해결하는 새로운 접근법을 제시합니다.
이 논문은 분산된 데이터에서 각기 독립적으로 학습된 혼합 전문가 (MoE) 모델을 단일 통신 단계로 효율적으로 집계하기 위해 최적 수송 (Optimal Transport) 기반의 새로운 프레임워크를 제안하고, 이를 통해 중앙 집중식 학습과 유사한 성능을 유지하면서 계산 및 통신 비용을 크게 절감하는 방법을 제시합니다.
이 논문은 중도절단된 생존 데이터를 위해 절단된 평균 생존 시간과 버퍼링된 생존 확률을 최대화하는 두 가지 강건한 기준을 제안하고, 이를 학습하기 위한 샘플링 기반 차분-볼록 알고리즘을 개발하여 AIDS 임상 시험 데이터를 포함한 시뮬레이션 및 실제 데이터 분석을 통해 기존 방법보다 우수한 성능을 입증했습니다.
이 논문은 확률적 정지 시간을 제어하는 정규화 문제를 특이 제어 문제로 재해석하고, 이를 기반으로 모델 기반 및 모델 없는 강화 학습 알고리즘을 제안하여 고차원 환경에서도 확장 가능한 탐색적 최적 정지 전략을 도출합니다.
이 논문은 데이터 누수 및 주요 지진 시퀀스 누락 등의 문제를 해결하고 지진학계의 최신 표준을 반영한 'EarthquakeNPP' 벤치마크를 제안하며, 이를 통해 현재 테스트된 5 가지 신경 점 과정 (NPP) 모델이 ETAS 와 같은 기존 지진 예측 모델보다 성능이 떨어졌음을 규명했습니다.
이 논문은 확산 모델이 훈련 데이터를 기억하는 과정이 급격한 전환이 아니라 데이터가 부족해질 때 잠재 차원성이 서서히 축소되며 일반화와 완전한 복제 사이의 기하학적 기억 단계를 거친다는 이론을 제시하고 실험적으로 입증합니다.
이 논문은 LIME 과 SHAP 과 같은 기존 방법들의 한계를 극복하고, 지역적 변수 간 의존성과 상호작용을 포착하며 다중 분류 문제에 직접 적용 가능한 새로운 모델-무관 로컬 변수 중요도 측정법인 CLIQUE 를 제안합니다.
이 논문은 확률적 전이성을 가정하지 않고 저차원 반대칭 행렬을 통해 쌍별 비교 확률을 모델링하여, 기존 브래들리 - 테리 모델의 한계를 극복하고 희소 데이터에서도 최적의 예측 성능을 보장하는 새로운 통계적 추정 방법론을 제안합니다.
이 논문은 유클리드 공간의 최대 마진 원리가 비유클리드 공간에서는 최적이지 않음을 지적하고, 클래스 공분산 구조의 초로레스키 분해를 활용하여 공분산 보정 SVM 분류기를 반복적으로 추정하는 알고리즘을 제안함으로써 비유클리드 공간에서의 분류 성능을 기존 SVM 보다 크게 향상시켰음을 보여줍니다.