stat.ML 편의 논문 | Gist.Science

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

이 논문은 데이터 재사용으로 인한 상관관계를 고려한 새로운 평균 안정성 분석 기법을 개발하여, 다중 패스 전처리 SGD 의 일반화 성능을 유효 차원과 연결하고 부적절한 전처리 행렬이 최적화 및 일반화 모두에서 비최적의 성능을 초래할 수 있음을 증명합니다.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

이 논문은 NLI 기반 크로스-인코더, 임베딩 모델, 리랭커, 그리고 지시 튜닝 LLM 등 다양한 아키텍처의 제로샷 텍스트 분류 능력을 공정하게 평가하기 위해 22 개의 데이터셋으로 구성된 벤치마크 'BTZSC'를 제안하고, 현대 리랭커가 새로운 최첨단 성능을 달성했으며 임베딩 모델이 정확도와 지연 시간 간 최적의 균형을 보인다는 결과를 제시합니다.

Ilias AarabFri, 13 Ma💬 cs.CL

Chemical Reaction Networks Learn Better than Spiking Neural Networks

이 논문은 은닉층이 없는 화학 반응 네트워크가 은닉층이 필요한 스파이킹 신경망보다 분류 작업을 더 정확하게 효율적으로 학습할 수 있음을 수학적으로 증명하고 실험을 통해 검증함으로써, 화학적 컴퓨터의 기계 학습 가능성과 생물학적 세포의 학습 효율성을 설명합니다.

Sophie Jaffard, Ivo F. SbalzariniFri, 13 Ma📊 stat

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

이 논문은 배치 베이지안 최적 실험 설계 (BOED) 문제를 확률 측도 공간으로 확률론적으로 승격시키고 엔트로피 정규화를 도입하여, Wasserstein 기울기 흐름과 입자 기반 알고리즘을 통해 고차원 비볼록 최적화 문제를 해결하는 새로운 접근법을 제안합니다.

Louis SharrockFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

이 논문은 포스트 트레이닝 중 발생하는 망각을 '질량 소실'과 '구성 요소 이동'으로 정의하고, KL 발산 방향, 기하학적 행동 중복도, 샘플링 전략 및 과거 데이터 가시성 간의 상호작용을 통해 망각을 정량화하는 이론적 틀을 제시합니다.

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat

Riemannian Laplace Approximation with the Fisher Metric

이 논문은 기존 리만 라플라스 근사법의 한계를 지적하고 피셔 계량을 기반으로 데이터가 무한히 많아질 때 정확한 근사가 가능하도록 두 가지 대안 변형을 개발하여 이론적 분석을 확장하고 실험적 개선을 입증합니다.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

이 논문은 KL 정규화가 유도하는 최적화 환경과 낙관적 보상 추정을 활용하여 온라인 KL 정규화 강화학습에 대해 기존 연구의 한계를 극복하는 로그(regret) 오차 상한을 달성하는 새로운 알고리즘과 이론적 분석을 제시합니다.

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

이 논문은 지정학적 충격이 국가부도 리스크를 직접적으로 재평가하는 반면, 지경제학적 충격은 통화정책과 글로벌 금융 사이클을 통해 전파된다는 '가위 패턴'을 2018~2025 년 42 개국의 데이터를 통해 실증적으로 규명하고, 이에 따라 유동성 공급이 금융 사이클 매개 스프레드 확대에는 대응할 수 있으나 지정학적 리스크 프리미엄의 지속적 요소에는 한계가 있음을 시사합니다.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

이 논문은 온라인 수학 튜터링 플랫폼 데이터를 활용하여 학습자의 과거 수행과 특성을 기반으로 컨텍스트 톰슨 샘플링을 적용한 밴딧 기반 추천 시스템을 제안함으로써, 대규모 학습자에게 개인화된 연습 문제를 제공하여 기술 향상도를 극대화하는 방법을 제시합니다.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

이 논문은 에이전트 기반 모델의 민감도 분석을 용이하게 하기 위해 고안된 머신러닝 기반의 SSRCA 파이프라인을 소개하며, 이를 통해 민감한 매개변수를 식별하고 출력 패턴을 규명하는 동시에 기존 소볼 방법보다 더 견고한 결과를 제공함을 보여줍니다.

Edward H. Rohr, John T. Nardini2026-03-11🧬 q-bio

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

이 논문은 선형 예측자와 BART 모델 간의 공유 공변량으로 인한 편향과 비식별성 문제를 해결하기 위해 BART의 트리 생성 과정을 수정하여, 공변량이 중복되더라도 복잡한 상호작용을 모델링할 수 있는 새로운 준모수적 베이지안 가법 회귀 트리 (BART) 방법을 제안합니다.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

이 논문은 리만 다양체 상의 제약 조건을 가진 블록 좌표 최적화 문제를 해결하기 위한 블록 대변화 - 최소화 (BMM) 알고리즘의 점근적 수렴성과 $\widetilde{O}(\epsilon^{-2})$ 반복 횟수 내의 $\epsilon$ -정상점 도달 복잡도를 증명하고, 다양한 리만 제약 알고리즘에 적용 가능함을 이론적으로 분석하며 실험적으로 검증했습니다.

Yuchen Li, Laura Balzano, Deanna Needell + 1 more2026-03-10📊 stat

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

이 논문은 결합된 선형 제약 조건이 있는 비볼록-강한 오목 및 비볼록-오목 미니맥스 문제를 해결하기 위해 두 가지 제로차 순환 알고리즘 (ZO-PDAPG 및 ZO-RMPDPG) 을 제안하고, 결정론적 및 확률적 환경에서의 반복 복잡도 보장을 통해 기존 제로차 알고리즘보다 우수한 성능을 입증합니다.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

← 이전 다음 →

stat.ML

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

A Quantitative Characterization of Forgetting in Post-Training

Riemannian Laplace Approximation with the Fisher Metric

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Towards a Fairer Non-negative Matrix Factorization

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Curse of Dimensionality in Neural Network Optimization

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Variational Formulation of Particle Flow

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference