Invariance-Based Dynamic Regret Minimization
이 논문은 비정상적인 선형 밴드트 환경에서 보상 모델의 불변성 (invariance) 을 학습하여 과거 데이터를 활용함으로써 차원을 축소하고 동적 후회 (dynamic regret) 를 줄이는 'ISD-linUCB' 알고리즘을 제안합니다.
335 편의 논문
이 논문은 비정상적인 선형 밴드트 환경에서 보상 모델의 불변성 (invariance) 을 학습하여 과거 데이터를 활용함으로써 차원을 축소하고 동적 후회 (dynamic regret) 를 줄이는 'ISD-linUCB' 알고리즘을 제안합니다.
이 논문은 계층적 베이지안 프레임워크, 최대 주변 가능도 추정, 앙상블 MALA 샘플링, 그리고 FNO 와 PINN 기반의 이단계 최적화 대체 모델을 결합하여, 개별 시스템의 매개변수를 추정하고 공유되는 미지 동역학을 학습하는 ODE/PDE 역문제 해결을 위한 새로운 방법론을 제안합니다.
이 논문은 그룹화된 밴딧 환경에서 모든 속성이 임계값을 만족하는 feasible 한 팔 중 평균이 가장 큰 팔을 고정 예산 하에 식별하기 위한 하한을 유도하고, 이를 달성하는 새로운 알고리즘 FCSR 을 제안하며 실험을 통해 그 우수성을 입증합니다.
이 논문은 Max-Plus 신경망의 고유한 대수적 구조에서 발생하는 서브그래디언트 희소성을 표준 역전파가 활용하지 못하는 문제를 해결하기 위해, 희소성을 명시적으로 활용하는 새로운 최적화 알고리즘을 제안하여 계산 효율성을 높이고 이론적 보장을 유지하는 방법을 제시합니다.
이 논문은 L2 가중치 정규화를 Sparse Autoencoder(SAE) 에 적용하면 학습의 안정성과 교차 시드 간 특징 일관성이 향상되며, 언어 모델 특징에 대한 활성화 조종 (steering) 성공률이 약 두 배로 증가하고 자동 해석 가능성 점수와의 상관관계가 개선됨을 보여줍니다.
이 논문은 로그 가능도 관점에서 일반화된 평균을 분석하여 선형 및 기하학적 풀링이 개별 분포보다 체계적인 개선을 보장하는 유일한 범위임을 이론적으로 증명하고, 딥 앙상블 실험을 통해 이를 검증했습니다.
이 논문은 소량의 쌍을 이룬 데이터와 풍부한 쌍을 이루지 않은 데이터를 활용하여 잠재 공간 분포 매칭 (LSDM) 을 통해 조건부 분포를 모델링하는 새로운 프레임워크를 제안하고, 이를 통해 생성 품질을 향상시킬 뿐만 아니라 잠재 확산 모델 (LDM) 의 이론적 일관성을 입증합니다.
이 논문은 영속적 호몰로지에서 도출된 위상 기술자를 활용하여 그래디언트 공유를 대체함으로써 데이터 재구성 공격 위험을 줄이고 비동일 분포 (Non-IID) 환경에서도 개인화된 학습 성능을 극대화하는 새로운 프라이버시 보호 개인화 연동 학습 프레임워크인 PTOPOFL 을 제안합니다.
이 논문은 양자 신경망의 학습 능력을 보장하기 위해 상태 도달성 대신 데이터와 가중치의 결합된 기하학적 변형 제어 (aCLS 기준) 를 요구하는 설계 원칙을 제시하고, 이를 통해 기존 방식보다 적은 게이트 연산으로 우수한 성능을 달성할 수 있음을 증명합니다.
이 논문은 비평형 열역학에서 영감을 받은 확산 확률 모델을 사용하여 CIFAR-10 과 LSUN 데이터셋에서 최첨단 이미지 생성 성능을 달성한 방법을 제시합니다.
이 논문은 언어 모델의 성능이 모델 크기, 데이터셋 크기, 컴퓨팅 자원에 대해 멱함수 법칙을 따르며, 주어진 컴퓨팅 예산 내에서 최적의 효율성을 달성하기 위해서는 상대적으로 적은 데이터로 매우 큰 모델을 학습시키고 수렴 전에 중단하는 것이 가장 효과적임을 규명합니다.
이 논문은 생성 모델 G 와 판별 모델 D 를 적대적으로 훈련하여 데이터 분포를 추정하는 새로운 프레임워크인 생성적 적대 신경망 (GAN) 을 제안하고, 이를 통해 마르코프 체인 없이도 고품질 샘플을 생성할 수 있음을 보여줍니다.
이 논문은 연속적인 잠재 변수와 대규모 데이터셋을 가진 방향성 확률 모델에서 효율적인 추론과 학습을 가능하게 하는 재파라미터화 기법을 활용한 확률적 변분 추론 알고리즘 (VAE) 을 제안합니다.