cs.LG 편의 논문 | Gist.Science

Personalized Federated Learning via Gaussian Generative Modeling

이 논문은 데이터 이질성 문제를 해결하기 위해 가우시안 생성 모델링과 베이지안 추론을 기반으로 전역적 협력과 개인화를 균형 있게 결합한 새로운 개인화 연방 학습 방법인 pFedGM 을 제안합니다.

Peng Hu, Jianwei Ma2026-03-13🤖 cs.LG

Simple Recipe Works: Vision-Language-Action Models are Natural Continual Learners with Reinforcement Learning

이 논문은 대규모 사전 학습된 비전 - 언어 - 행동 (VLA) 모델에서 복잡한 지속적 강화학습 전략 대신, 저랭크 적응 (LoRA) 을 활용한 단순한 순차적 파인튜닝이 오히려 catastrophic forgetting 을 최소화하면서 뛰어난 적응력과 일반화 성능을 보여준다는 것을 발견했습니다.

Jiaheng Hu, Jay Shim, Chen Tang, Yoonchang Sung, Bo Liu, Peter Stone, Roberto Martin-Martin2026-03-13🤖 cs.LG

Context-dependent manifold learning: A neuromodulated constrained autoencoder approach

이 논문은 물리적 파라미터나 환경 조건의 변화에 적응할 수 있도록 신경조절 메커니즘을 통합하여 컨텍스트에 따라 매니폴드 기하학을 학습하는 '신경조절 제약 오토인코더 (NcAE)'를 제안하고, 이를 통해 전역적 컨텍스트 파라미터와 지역적 매니폴드 표현을 효과적으로 분리할 수 있음을 입증했습니다.

Jérôme Adriaens (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Guillaume Drion (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Pierre Sacré (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège)2026-03-13🤖 cs.LG

Entropy-Preserving Reinforcement Learning

이 논문은 정책 경사 알고리즘이 학습 과정에서 엔트로피가 감소하여 탐색 다양성이 저하되는 문제를 지적하고, REPO 와 ADAPO 와 같은 엔트로피 보존 메커니즘을 제안하여 학습 중 다양성을 유지함으로써 최종 성능과 새로운 환경에서의 연속 학습 능력을 향상시키는 방법을 제시합니다.

Aleksei Petrenko, Ben Lipkin, Kevin Chen, Erik Wijmans, Marco Cusumano-Towner, Raja Giryes, Philipp Krähenbühl2026-03-13🤖 cs.LG

Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2

이 논문은 FastSpeech2 아키텍처에 명시적인 감정 조건부와 반사실적 훈련 목표를 도입하여 텍스트, 감정, 화자가 말초리 (지속 시간, 피치, 에너지) 를 통해 음성 파형에 미치는 인과적 관계를 모델링함으로써, 언어적 내용과 감정적 프로소디를 분리하고 자연스러운 감정 표현과 정교한 프로소디 제어가 가능한 새로운 TTS 프레임워크를 제안합니다.

Suvendu Sekhar Mohanty2026-03-13🤖 cs.AI

Decomposing Observational Multiplicity in Decision Trees: Leaf and Structural Regret

이 논문은 의사결정나무 모델의 관측적 다중성을 '리프 후회'와 '구조적 후회'로 분해하여 구조적 불안정성이 주요 원인임을 규명하고, 이를 선택적 예측의 거절 메커니즘으로 활용함으로써 모델 안전성을 향상시키는 새로운 프레임워크를 제시합니다.

Mustafa Cavus2026-03-13📊 stat

EvoFlows: Evolutionary Edit-Based Flow-Matching for Protein Engineering

이 논문은 템플릿 단백질 서열에서 특정 위치와 종류를 제어 가능한 삽입, 삭제, 치환을 통해 자연스러운 변이체를 생성하는 새로운 단백질 공학 모델인 EvoFlows 를 제안하고, 기존 모델과 유사한 분포 학습 능력과 함께 더 우수한 변이 생성 성능을 입증합니다.

Nicolas Deutschmann, Constance Ferragu, Jonathan D. Ziegler, Shayan Aziznejad, Eli Bixby2026-03-13🤖 cs.LG

Cross-Resolution Attention Network for High-Resolution PM2.5 Prediction

이 논문은 단일 GPU 에서 유럽 전역의 초고해상도 (1km) PM2.5 지도를 1.8 초 만에 생성하면서도 기존 단일 스케일 기반선보다 예측 오차를 크게 줄이고 복잡한 지형에서의 편향을 감소시킨, 교차 해상도 어텐션 메커니즘을 활용한 CRAN-PM 모델을 제안합니다.

Ammar Kheder, Helmi Toropainen, Wenqing Peng, Samuel Antão, Zhi-Song Liu, Michael Boy2026-03-13🤖 cs.LG

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

이 논문은 전력망과 같은 복잡한 시계열 데이터의 노이즈와 이상치를 처리하기 위해 이상 탐지와 결측치 보정을 단일 엔드투엔드 시스템으로 통합한 확률적 프레임워크 'CINDI'를 제안하고, 이를 통해 데이터의 물리적 및 통계적 특성을 보존하면서 강건한 성능을 입증합니다.

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI

Mitigating the Multiplicity Burden: The Role of Calibration in Reducing Predictive Multiplicity of Classifiers

이 논문은 다양한 신용 리스크 데이터셋을 분석하여 사후 보정 (특히 플랫 스케일링과 등방성 회귀) 이 예측 다중성 (예측 다중성) 을 줄이고 소수 클래스의 불공정한 부담을 완화하여 절차적 공정성을 증진할 수 있음을 실증적으로 보여줍니다.

Mustafa Cavus2026-03-13🤖 cs.LG

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

이 논문은 관측 공간의 가능도 최대화의 한계를 극복하기 위해 조건부 정규화 흐름의 잠재 공간에 명시적 유도 편향을 도입하여 시간적 역학의 위배를 통계적 적합도 검정으로 정의함으로써, 고가능도 영역에서도 효과적으로 이상을 탐지하고 해석 가능한 진단을 제공하는 새로운 프레임워크를 제안합니다.

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

이 논문은 보상에 대한 정보 없이도 다른 에이전트의 행동만을 관찰하여 그들의 전문성을 추정하고 이를 개인 경험과 통합함으로써 비전문가 및 다양한 에이전트 집단에서도 최적 정책을 수렴하고 로그 후회 (logarithmic regret) 를 달성하는 자유 에너지 기반의 사회적 밴딧 학습 알고리즘을 제안합니다.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat

Modeling Trial-and-Error Navigation With a Sequential Decision Model of Information Scent

이 논문은 사용자의 기억 제약과 시간 예산을 고려한 순차적 의사결정 모델로 정보 냄새 이론을 확장하여, 링크를 즉시 선택하거나 실수 후 되돌아가는 탐색 오류와 복원 행동을 성공적으로 설명함을 보여줍니다.

Xiaofu Jin, Yunpeng Bai, Antti Oulasvirta2026-03-13🤖 cs.LG

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for $m$ -Set Semi-Bandit Problem

본 논문은 $m$ -set 반-밴딧 문제에서 프레체 (Fréchet) 및 파레토 (Pareto) 분포를 활용한 FTPL 알고리즘이 적대적 환경과 확률적 환경 모두에서 최적의 후회 (regret) 보장을 달성하고, 조건부 기하학적 리샘플링을 통해 계산 복잡도를 획기적으로 낮추는 효율적인 알고리즘을 제안합니다.

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya Honda2026-03-13📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

이 논문은 생성된 텍스트가 학습 데이터에 재유입되는 '리플레이'가 언어 생성의 수렴성에 미치는 영향을 학습이론적 관점에서 분석하여, 균일 생성에는 무해하지만 비균일 생성과 극한 생성에서는 성능 저하를 초래할 수 있음을 증명하고, 이를 완화하는 실용적 기법들의 이론적 한계를 규명합니다.

Giorgio Racca, Michal Valko, Amartya Sanyal2026-03-13📊 stat

Disentangled Representation Learning through Unsupervised Symmetry Group Discovery

이 논문은 기존 방법의 제약 없이 자율 에이전트가 환경 상호작용을 통해 대칭군 구조를 무감독적으로 발견하고, 이를 통해 최소 가정 하에 선형 대칭 기반 해리 표현을 학습하는 새로운 방법론을 제안하고 그 유효성을 입증합니다.

Dang-Nhu Barthélémy, Annabi Louis, Argentieri Sylvain2026-03-13🤖 cs.LG

Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA

이 논문은 기존Membership Inference Attack(LiRA, RMIA) 을 지수족 로그우도비 프레임워크로 통합하여 계층 구조를 규명하고, 소규모 섀도 모델 예산 환경에서 분산 추정을 개선한 베이지안 기반의 BaVarIA 를 제안하여 기존 기법보다 우수한 성능을 입증합니다.

Rickard Brännvall2026-03-13🤖 cs.LG

OSM-based Domain Adaptation for Remote Sensing VLMs

이 논문은 대규모 교사 모델에 의존하지 않고 오픈스트리트맵 (OSM) 데이터와 오픈소스 VLM 의 자체 능력을 활용하여 원격 탐사 도메인 적응을 위한 고품질 데이터 생성 및 모델 학습을 가능하게 하는 'OSMDA' 프레임워크를 제안하고, 이를 통해 비용 효율적으로 최첨단 성능을 달성함을 보여줍니다.

Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Mohammad Mahdi (INSAIT, Sofia University "St. Kliment Ohridski"), Delyan Boychev (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-13🤖 cs.LG

Hypercomplex Widely Linear Processing: Fundamentals for Quaternion Machine Learning

이 논문은 머신러닝 분야에서 3 차원 회전 모델링의 강력한 능력을 가진 쿼터니온의 부흥을 배경으로, 증강 통계, 광선형 모델, 쿼터니온 미적분 및 평균 제곱 추정 등을 체계적으로 다루어 쿼터니온 머신러닝 연구의 기초를 마련합니다.

Sayed Pouria Talebi, Clive Cheong Took2026-03-13📊 stat

Inverse Neural Operator for ODE Parameter Optimization

이 논문은 희소하고 부분적인 관측 데이터로부터 숨겨진 ODE 매개변수를 복원하기 위해 스펙트럴 정규화를 통한 C-FNO 기반의 대리 모델과 역전파 없이 매개변수 공간을 이동하는 ADM 을 결합한 '역 신경 연산자 (INO)'를 제안하며, 이를 통해 강성 (stiff) 환경에서 기존 경사하강법 대비 487 배 빠른 추론 속도와 높은 정확도를 달성함을 보여줍니다.

Zhi-Song Liu, Wenqing Peng, Helmi Toropainen, Ammar Kheder, Andreas Rupp, Holger Froning, Xiaojie Lin, Michael Boy2026-03-13🤖 cs.LG

← 이전 다음 →

cs.LG