stat.ML 편의 논문 | Gist.Science

Invariance-Based Dynamic Regret Minimization

이 논문은 비정상적인 선형 밴드트 환경에서 보상 모델의 불변성 (invariance) 을 학습하여 과거 데이터를 활용함으로써 차원을 축소하고 동적 후회 (dynamic regret) 를 줄이는 'ISD-linUCB' 알고리즘을 제안합니다.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

이 논문은 계층적 베이지안 프레임워크, 최대 주변 가능도 추정, 앙상블 MALA 샘플링, 그리고 FNO 와 PINN 기반의 이단계 최적화 대체 모델을 결합하여, 개별 시스템의 매개변수를 추정하고 공유되는 미지 동역학을 학습하는 ODE/PDE 역문제 해결을 위한 새로운 방법론을 제안합니다.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

이 논문은 그룹화된 밴딧 환경에서 모든 속성이 임계값을 만족하는 feasible 한 팔 중 평균이 가장 큰 팔을 고정 예산 하에 식별하기 위한 하한을 유도하고, 이를 달성하는 새로운 알고리즘 FCSR 을 제안하며 실험을 통해 그 우수성을 입증합니다.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

이 논문은 Max-Plus 신경망의 고유한 대수적 구조에서 발생하는 서브그래디언트 희소성을 표준 역전파가 활용하지 못하는 문제를 해결하기 위해, 희소성을 명시적으로 활용하는 새로운 최적화 알고리즘을 제안하여 계산 효율성을 높이고 이론적 보장을 유지하는 방법을 제시합니다.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

이 논문은 L2 가중치 정규화를 Sparse Autoencoder(SAE) 에 적용하면 학습의 안정성과 교차 시드 간 특징 일관성이 향상되며, 언어 모델 특징에 대한 활성화 조종 (steering) 성공률이 약 두 배로 증가하고 자동 해석 가능성 점수와의 상관관계가 개선됨을 보여줍니다.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

이 논문은 로그 가능도 관점에서 일반화된 평균을 분석하여 선형 및 기하학적 풀링이 개별 분포보다 체계적인 개선을 보장하는 유일한 범위임을 이론적으로 증명하고, 딥 앙상블 실험을 통해 이를 검증했습니다.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

이 논문은 소량의 쌍을 이룬 데이터와 풍부한 쌍을 이루지 않은 데이터를 활용하여 잠재 공간 분포 매칭 (LSDM) 을 통해 조건부 분포를 모델링하는 새로운 프레임워크를 제안하고, 이를 통해 생성 품질을 향상시킬 뿐만 아니라 잠재 확산 모델 (LDM) 의 이론적 일관성을 입증합니다.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

이 논문은 영속적 호몰로지에서 도출된 위상 기술자를 활용하여 그래디언트 공유를 대체함으로써 데이터 재구성 공격 위험을 줄이고 비동일 분포 (Non-IID) 환경에서도 개인화된 학습 성능을 극대화하는 새로운 프라이버시 보호 개인화 연동 학습 프레임워크인 PTOPOFL 을 제안합니다.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

이 논문은 양자 신경망의 학습 능력을 보장하기 위해 상태 도달성 대신 데이터와 가중치의 결합된 기하학적 변형 제어 (aCLS 기준) 를 요구하는 설계 원칙을 제시하고, 이를 통해 기존 방식보다 적은 게이트 연산으로 우수한 성능을 달성할 수 있음을 증명합니다.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

이 논문은 비평형 열역학에서 영감을 받은 확산 확률 모델을 사용하여 CIFAR-10 과 LSUN 데이터셋에서 최첨단 이미지 생성 성능을 달성한 방법을 제시합니다.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

이 논문은 언어 모델의 성능이 모델 크기, 데이터셋 크기, 컴퓨팅 자원에 대해 멱함수 법칙을 따르며, 주어진 컴퓨팅 예산 내에서 최적의 효율성을 달성하기 위해서는 상대적으로 적은 데이터로 매우 큰 모델을 학습시키고 수렴 전에 중단하는 것이 가장 효과적임을 규명합니다.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

이 논문은 생성 모델 G 와 판별 모델 D 를 적대적으로 훈련하여 데이터 분포를 추정하는 새로운 프레임워크인 생성적 적대 신경망 (GAN) 을 제안하고, 이를 통해 마르코프 체인 없이도 고품질 샘플을 생성할 수 있음을 보여줍니다.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

이 논문은 연속적인 잠재 변수와 대규모 데이터셋을 가진 방향성 확률 모델에서 효율적인 추론과 학습을 가능하게 하는 재파라미터화 기법을 활용한 확률적 변분 추론 알고리즘 (VAE) 을 제안합니다.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← 이전