Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I
이 논문은 관측치나 행동을 예측하지 않고 비용만 예측하는 비용 주도적 접근법을 통해 부분 관측 가능 선형 2 차 가우시안 (LQG) 제어 문제에서 최적의 잠재 상태 표현과 제어기를 학습할 수 있음을 증명하는 유한 표본 보장을 제시합니다.
329 편의 논문
이 논문은 관측치나 행동을 예측하지 않고 비용만 예측하는 비용 주도적 접근법을 통해 부분 관측 가능 선형 2 차 가우시안 (LQG) 제어 문제에서 최적의 잠재 상태 표현과 제어기를 학습할 수 있음을 증명하는 유한 표본 보장을 제시합니다.
이 논문은 이중 강건 함수를 추정할 때, 낮은 정칙성 조건에서도 최소극대 수렴 속도를 달성하기 위해 nuisance 함수의 과소/과소 평활화 조정과 샘플 분할 전략을 신중하게 결합해야 함을 이론적으로 증명하고 시뮬레이션으로 입증합니다.
이 논문은 역사적 데이터를 기반으로 한 비모수 밀도 추정과 신뢰구간을 활용하여 다중 품목 경매의 실행 비용을 줄이면서도 공정성과 인센티브 호환성을 보장하는 새로운 통계적 학습 전략을 제안하고, 이를 통해 수익 극대화와 비용 절감을 동시에 달성함을 입증합니다.
이 논문은 최적 수송 이론에서 유도된 정규화와 볼록 통합 문제를 통해 국소 리프시츠 연속성을 보장하면서도 훈련 데이터를 정확하게 적합할 수 있는 새로운 2 단계 적대적 방어 모델 OTAD 를 제안하여 기존 방법들의 한계를 극복하고 다양한 데이터셋에서 우수한 성능을 입증했습니다.
이 논문은 미니배치 확률적 경사 하강법 (SGD) 을 사용하는 딥 콕스 모델의 통계적 기반을 규명하여 미니배치 최대 부분우도 추정량 (mb-MPLE) 의 일관성과 최적 수렴 속도를 증명하고, 학습률과 배치 크기의 비율 등 실용적 가이드라인을 제시하며 대규모 실제 데이터 적용 가능성을 입증합니다.
이 논문은 고차원 공간이나 복잡한 데이터셋에서 기존 방법의 한계를 극복하기 위해 어닐링 중요도 샘플링 (AIS) 과 재매개변수화 기법을 결합하여 가우시안 프로세스 잠재 변수 모델 (GPLVM) 의 변분 추론 성능을 획기적으로 개선하는 새로운 알고리즘을 제안합니다.
이 논문은 볼츠만 분포에서 독립적이고 동일한 분포 (IID) 를 가진 샘플을 생성하기 위해 에너지 함수를 기반으로 한 확산 기반 샘플러 'Noised Energy Matching(NEM)'과 편향과 분산을 균형 있게 조절하는 부트스트래핑 기법을 도입한 'BNEM'을 제안하며, 다양한 실험을 통해 기존 방법보다 뛰어난 성능과 견고함을 입증합니다.
이 논문은 주 데이터와 보조 데이터 간의 잠재적 군집 구조 차이를 자동으로 보정하여 편향 - 분산 최적화를 통해 전이 학습 기반 군집화의 효율성을 극대화하는 '적응형 전이 군집화 (ATC)' 프레임워크를 제안하고, 가우시안 혼합 모델 하에서의 이론적 최적성과 다양한 실험을 통한 유효성을 입증합니다.
이 논문은 딥러닝 프레임워크 내 노이즈가 있는 레이블을 가진 분류 문제에서 초과 위험의 오차 상한을 유도하고, 이를 통계적 오차와 근사 오차로 분해하여 종속성 처리, 벡터 값 설정, 저차원 매니폴드 가정을 통해 각각 분석합니다.
이 논문은 오프라인 데이터의 풍부함과 온라인 학습의 적응력을 결합하면서도 데이터 품질과 포용성 문제를 해결하기 위해, 정책의 진화적 필요에 따라 오프라인 및 온라인 데이터를 동적으로 우선순위화하는 '신뢰도 인식형 능동 우위 정렬 (A3)' 샘플링 전략을 도입한 A3RL 알고리즘을 제안하고, 이를 통해 기존 방법들보다 우수한 성능을 입증합니다.
이 논문은 신뢰영역 기반 베이지안 최적화 프레임워크 내에서 목적 함수의 분산이 큰 확률적 시뮬레이션 문제를 해결하기 위해, 획득 함수 수정 및 비용 인식 평가 전략을 활용한 적응적 복제 방식을 도입하여 해의 정확도와 계산 효율성을 획기적으로 향상시키는 방법을 제시합니다.
이 논문은 이질적인 데이터에서 개별 최적 정책을 찾기 위해 개인 잠재 변수를 활용한 이질적 모델과 페널티를 부과한 비관적 개인화 정책 학습 (P4L) 알고리즘을 제안하며, 약한 부분 커버리지 가정 하에 평균 후회율의 빠른 수렴을 보장하고 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 고정된 배치 데이터가 아닌 시간에 따라 변화하는 동적 환경에서 의사결정 중심 학습 (DFL) 을 위해 미분 가능성과 비볼록성 문제를 해결하는 두 가지 온라인 알고리즘을 제안하고, 정적 및 동적 후회 (regret) 한계를 증명하여 해당 분야에서 최초의 이론적 보장을 제시합니다.
이 논문은 보험료 산정을 위한 합성 데이터 생성 기법으로 심층 생성 모델 (VAE, CTGAN) 과 비교하여 다변량 연쇄 방정식 (MICE) 기반 방법이 변수 분포와 다변량 관계를 잘 보존하면서도 구현이 용이하고 GLM 모델 성능 향상에 효과적임을 입증했습니다.
본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 차 유한 차분을 기반으로 한 FSA- 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.
이 논문은 딥러닝과 동적 입력 컨덕턴스 (DIC) 프레임워크를 결합하여 스파이크 타이밍만으로 이온 채널 전도도의 다양한 조합으로 구성된 퇴화 신경 집단 (degenerate populations) 을 밀리초 단위로 빠르고 정확하게 재구성하는 새로운 방법을 제시합니다.
이 논문은 유한 상태 공간에서 의사 스펙트럼 갭에 대한 경험적 상한을 도출하여, 기존 이론적 상수 의존성을 제거한 마르코프 체인을 위한 최초의 완전 경험적 PAC-Bayes 경계를 제시합니다.
이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.
이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.
이 논문은 관측 데이터를 기반으로 마르코프 결정 과정에서의 개인별 잠재 결과를 예측하기 위해 이중 강건성, Neyman 직교성, 준-오라클 효율성을 보장하는 새로운 메타 러너인 DRQ-learner 를 제안하고 이론적 근거와 실증적 유효성을 입증합니다.