Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

이 논문은 비구속 상태 공간에서 가우시안 프로세스 사후 샘플링 강화 학습 (GP-PSRL) 알고리즘의 베이지안 후회 상한을 유도하여, 최대 정보 획득량에 대한 최적의 의존성과 비구속 상태 공간의 문제를 해결하고 기존 이론적 한계를 극복했습니다.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

이 논문은 유효성, 희소성, 근접성 및 새로운 소프트-DTW 기반의 타당성 요소를 결합한 손실 함수를 통해 시계열 분류 문제에 대해 현실적인 시간적 구조를 가진 반사실적 설명을 생성하는 새로운 방법을 제안하고, 기존 방법들보다 타겟 클래스와의 분포 정렬 및 시간적 현실성 측면에서 우수한 성능을 입증합니다.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

이 논문은 불균형 데이터의 과적합 문제를 해결하기 위해 국소적 가중치 업데이트를 역사적 시퀀스로 대체하는 '가중 분수 웨일 적분'을 기반으로 한 새로운 최적화 알고리즘을 제안하며, 의료 진단 및 금융 사기 탐지에서 기존 최적화 기법 대비 PR-AUC 를 약 40% 향상시키는 성과를 입증했습니다.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

이 논문은 다목적 강화학습의 오목 스칼라화 문제에서 발생하는 편향 장벽을 해결하기 위해 다단계 몬테카를로 추정기를 활용한 자연 정책 경계 알고리즘을 제안함으로써, ϵ\epsilon-최적 정책을 계산하는 데 있어 최적의 O~(ϵ2)\widetilde{\mathcal{O}}(\epsilon^{-2}) 샘플 복잡도 보장을 달성했습니다.

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

이 논문은 강화학습에서 상태 그래프의 대수적 연결성 (algebraic connectivity) 이 학습된 라플라시안 표현을 통한 가치 함수 근사 오차에 미치는 영향을 이론적으로 규명하고, 이를 일반 정책 하에서 검증하여 차원의 저주 문제를 해결하는 새로운 통찰을 제공합니다.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

이 논문은 고차원 변수 간의 인과 효과가 저차원 요약 통계량인 '병목'에 의존한다는 가정을 바탕으로, 기존 인과 표현 학습이나 추상화 학습의 대안이 될 수 있는 새로운 구조적 인과 모델인 '구조적 인과 병목 모델 (SCBMs)'을 제안하고 그 식별성, 정보 병목 이론과의 연관성, 그리고 실험적 추정 방법과 저샘플 전이 학습에서의 효과를 분석합니다.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Optimal Transport Aggregation for Distributed Mixture-of-Experts

이 논문은 분산된 데이터에서 각기 독립적으로 학습된 혼합 전문가 (MoE) 모델을 단일 통신 단계로 효율적으로 집계하기 위해 최적 수송 (Optimal Transport) 기반의 새로운 프레임워크를 제안하고, 이를 통해 중앙 집중식 학습과 유사한 성능을 유지하면서 계산 및 통신 비용을 크게 절감하는 방법을 제시합니다.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

이 논문은 중도절단된 생존 데이터를 위해 절단된 평균 생존 시간과 버퍼링된 생존 확률을 최대화하는 두 가지 강건한 기준을 제안하고, 이를 학습하기 위한 샘플링 기반 차분-볼록 알고리즘을 개발하여 AIDS 임상 시험 데이터를 포함한 시뮬레이션 및 실제 데이터 분석을 통해 기존 방법보다 우수한 성능을 입증했습니다.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

이 논문은 데이터 누수 및 주요 지진 시퀀스 누락 등의 문제를 해결하고 지진학계의 최신 표준을 반영한 'EarthquakeNPP' 벤치마크를 제안하며, 이를 통해 현재 테스트된 5 가지 신경 점 과정 (NPP) 모델이 ETAS 와 같은 기존 지진 예측 모델보다 성능이 떨어졌음을 규명했습니다.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

이 논문은 확산 모델이 훈련 데이터를 기억하는 과정이 급격한 전환이 아니라 데이터가 부족해질 때 잠재 차원성이 서서히 축소되며 일반화와 완전한 복제 사이의 기하학적 기억 단계를 거친다는 이론을 제시하고 실험적으로 입증합니다.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

이 논문은 유클리드 공간의 최대 마진 원리가 비유클리드 공간에서는 최적이지 않음을 지적하고, 클래스 공분산 구조의 초로레스키 분해를 활용하여 공분산 보정 SVM 분류기를 반복적으로 추정하는 알고리즘을 제안함으로써 비유클리드 공간에서의 분류 성능을 기존 SVM 보다 크게 향상시켰음을 보여줍니다.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat