OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

이 논문은 최적 수송 이론에서 유도된 정규화와 볼록 통합 문제를 통해 국소 리프시츠 연속성을 보장하면서도 훈련 데이터를 정확하게 적합할 수 있는 새로운 2 단계 적대적 방어 모델 OTAD 를 제안하여 기존 방법들의 한계를 극복하고 다양한 데이터셋에서 우수한 성능을 입증했습니다.

Kuo Gai, Sicong Wang, Shihua ZhangTue, 10 Ma🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

이 논문은 미니배치 확률적 경사 하강법 (SGD) 을 사용하는 딥 콕스 모델의 통계적 기반을 규명하여 미니배치 최대 부분우도 추정량 (mb-MPLE) 의 일관성과 최적 수렴 속도를 증명하고, 학습률과 배치 크기의 비율 등 실용적 가이드라인을 제시하며 대규모 실제 데이터 적용 가능성을 입증합니다.

Lang Zeng, Weijing Tang, Zhao Ren, Ying DingTue, 10 Ma🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

이 논문은 고차원 공간이나 복잡한 데이터셋에서 기존 방법의 한계를 극복하기 위해 어닐링 중요도 샘플링 (AIS) 과 재매개변수화 기법을 결합하여 가우시안 프로세스 잠재 변수 모델 (GPLVM) 의 변분 추론 성능을 획기적으로 개선하는 새로운 알고리즘을 제안합니다.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John PaisleyTue, 10 Ma🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

이 논문은 볼츠만 분포에서 독립적이고 동일한 분포 (IID) 를 가진 샘플을 생성하기 위해 에너지 함수를 기반으로 한 확산 기반 샘플러 'Noised Energy Matching(NEM)'과 편향과 분산을 균형 있게 조절하는 부트스트래핑 기법을 도입한 'BNEM'을 제안하며, 다양한 실험을 통해 기존 방법보다 뛰어난 성능과 견고함을 입증합니다.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-LobatoTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

이 논문은 주 데이터와 보조 데이터 간의 잠재적 군집 구조 차이를 자동으로 보정하여 편향 - 분산 최적화를 통해 전이 학습 기반 군집화의 효율성을 극대화하는 '적응형 전이 군집화 (ATC)' 프레임워크를 제안하고, 가우시안 혼합 모델 하에서의 이론적 최적성과 다양한 실험을 통한 유효성을 입증합니다.

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

이 논문은 오프라인 데이터의 풍부함과 온라인 학습의 적응력을 결합하면서도 데이터 품질과 포용성 문제를 해결하기 위해, 정책의 진화적 필요에 따라 오프라인 및 온라인 데이터를 동적으로 우선순위화하는 '신뢰도 인식형 능동 우위 정렬 (A3)' 샘플링 전략을 도입한 A3RL 알고리즘을 제안하고, 이를 통해 기존 방법들보다 우수한 성능을 입증합니다.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin ChenTue, 10 Ma🤖 cs.LG

Adaptive Replication Strategies in Trust-Region-Based Bayesian Optimization of Stochastic Functions

이 논문은 신뢰영역 기반 베이지안 최적화 프레임워크 내에서 목적 함수의 분산이 큰 확률적 시뮬레이션 문제를 해결하기 위해, 획득 함수 수정 및 비용 인식 평가 전략을 활용한 적응적 복제 방식을 도입하여 해의 정확도와 계산 효율성을 획기적으로 향상시키는 방법을 제시합니다.

Mickael Binois (ACUMES), Jeffrey Larson (ANL)Tue, 10 Ma🔢 math

Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data

이 논문은 이질적인 데이터에서 개별 최적 정책을 찾기 위해 개인 잠재 변수를 활용한 이질적 모델과 페널티를 부과한 비관적 개인화 정책 학습 (P4L) 알고리즘을 제안하며, 약한 부분 커버리지 가정 하에 평균 후회율의 빠른 수렴을 보장하고 기존 방법보다 우수한 성능을 입증합니다.

Rui Miao, Babak Shahbaba, Annie QuTue, 10 Ma🤖 cs.LG

Online Decision-Focused Learning

이 논문은 고정된 배치 데이터가 아닌 시간에 따라 변화하는 동적 환경에서 의사결정 중심 학습 (DFL) 을 위해 미분 가능성과 비볼록성 문제를 해결하는 두 가지 온라인 알고리즘을 제안하고, 정적 및 동적 후회 (regret) 한계를 증명하여 해당 분야에서 최초의 이론적 보장을 제시합니다.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain DurmusTue, 10 Ma🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 pp차 유한 차분을 기반으로 한 F2^2SA-pp 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao ZhangTue, 10 Ma🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

이 논문은 딥러닝과 동적 입력 컨덕턴스 (DIC) 프레임워크를 결합하여 스파이크 타이밍만으로 이온 채널 전도도의 다양한 조합으로 구성된 퇴화 신경 집단 (degenerate populations) 을 밀리초 단위로 빠르고 정확하게 재구성하는 새로운 방법을 제시합니다.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur FyonTue, 10 Ma🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.

Valentyn Melnychuk, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

이 논문은 관측 데이터를 기반으로 마르코프 결정 과정에서의 개인별 잠재 결과를 예측하기 위해 이중 강건성, Neyman 직교성, 준-오라클 효율성을 보장하는 새로운 메타 러너인 DRQ-learner 를 제안하고 이론적 근거와 실증적 유효성을 입증합니다.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG