Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

이 논문은 군 엔트로피와 군 이론적 미러 맵을 활용하여 머신러닝의 미러 강하 (Mirror Descent) 알고리즘을 무한히 유연한 가족으로 확장하고, '미러 쌍대성' 개념을 통해 학습률 제약을 만족하면서 데이터의 통계적 특성에 맞춰 최적화 업데이트를 적응적으로 조정하는 새로운 이론 및 알고리즘 프레임워크를 제안합니다.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

이 논문은 검증 가능한 보상을 활용한 비지도 강화학습 (URLVR) 이 초기 모델의 분포를 강화하는 메커니즘을 통해 학습이 일시적으로 향상되다가 결국 붕괴된다는 이론적·실험적 한계를 규명하고, 이를 극복하기 위한 외부 보상 기반 접근법의 가능성을 제시합니다.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

이 논문은 고차원 변수 간의 인과 효과가 저차원 요약 통계량인 '병목'에 의존한다는 가정을 바탕으로, 기존 인과 표현 학습이나 추상화 학습의 대안이 될 수 있는 새로운 구조적 인과 모델인 '구조적 인과 병목 모델 (SCBMs)'을 제안하고 그 식별성, 정보 병목 이론과의 연관성, 그리고 실험적 추정 방법과 저샘플 전이 학습에서의 효과를 분석합니다.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

이 논문은 분할 연합 학습 (SFL) 의 모델 분할 계층과 클라이언트 - 집계기 할당이 정확도, 지연 시간, 오버헤드에 미치는 영향을 고려하여 NP-난해한 최적화 문제를 해결하는 새로운 휴리스틱 알고리즘을 제안함으로써, 기존 방식 대비 정확도를 3% 향상시키고 지연 시간을 20% 단축하며 오버헤드를 50% 감소시킨다고 주장합니다.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

이 논문은 모방 학습의 한계를 극복하고 에이전트가 행동의 질에 대한 자율적 추론 능력을 기르도록 하는 새로운 강화 학습 패러다임인 '에이전틱 크리티컬 트레이닝 (ACT)'을 제안하며, 이를 통해 다양한 벤치마크에서 모방 학습 및 기존 강화 학습 대비 성능을 크게 향상시키고 일반화 능력을 입증했습니다.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

이 논문은 정적 데이터 분할의 한계를 극복하고 지속 가능한 성능 평가를 위해 GitHub 활동 데이터를 기반으로 실시간으로 업데이트되는 새로운 시간 계열 예측 벤치마크 'Impermanent'를 제안합니다.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

이 논문은 PMU 측정을 기반으로 한 전력 시스템 상태 추정을 위해 요인 그래프 상의 그래프 신경망 (GNN) 을 도입하여, 높은 정확도와 확장성을 유지하면서도 센서 고장이나 통신 장애와 같은 국부적 오류가 전체 시스템에 미치는 영향을 최소화하는 견고하고 효율적인 선형 상태 추정 알고리즘을 제안합니다.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

이 논문은 잠재 교란 변수가 있는 인과 시스템을 표현하는 조상 그래프 (Ancestral Graphs) 에 대한 분포 추론과 사전·사후 전문가 지식을 통합하여, 불확실한 피드백을 기반으로 최적의 인과 구조를 학습하는 강화 학습 기반 알고리즘 'Ancestral GFlowNet (AGFN)'을 제안하고 그 유효성을 입증합니다.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

이 논문은 임의의 선형 샘플로부터 비선형 모델 클래스를 학습하는 문제를 해결하기 위해, 모델 클래스의 구조적 특성과 측정 과정 간의 상호작용을 정량화하는 새로운 통합 프레임워크를 제시하고 이를 통해 기존 결과들을 일반화하며 최적에 가까운 일반화 보장을 확립합니다.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

이 논문은 물리적 메모리의 에너지 장벽을 조절하여 최적화 및 어닐링 역학과 일치시키는 이상적인 뉴로모픽 학습 인 메모리 (LIM) 옵티마이저의 에너지 소산 하한을 유도하고, 이를 대규모 AI 워크로드에 적용하여 모델-중립적인 에너지 효율성 추정치를 제시합니다.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI