When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

이 논문은 PPO actor-critic 학습에서 학습률 선택의 실패를 조기에 감지하기 위해 은닉 뉴런의 활성화 패턴 균형을 측정하는 OUI (Overfitting-Underfitting Indicator) 지표를 제안하고, 이를 통해 학습 초기 단계에서 성공적인 학습률을 효과적으로 선별할 수 있음을 실증합니다.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

이 논문은 기존 신경 해석기의 한계를 극복하고 프론트 및 백워드 실행을Debugger 동작에 따라 모델링하는 '신경 디버거'를 제안하여, 향후 에이전트 기반 코딩 시스템 및 자동화된 디버깅의 기반을 마련했다고 요약할 수 있습니다. 더 간결하게 한 문장으로 정리하면 다음과 같습니다: **이 논문은 프론트 및 백워드 실행을 디버거 동작에 따라 모델링하는 '신경 디버거'를 제안하여 향후 에이전트 기반 코딩 시스템과 자동화된 디버깅의 기반을 마련했습니다.**

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

이 논문은 행렬 연산자 노름의 관점에서 신경망 옵티마이저의 폭 확장성을 분석하고, 층별 합성 가능한 평균 정규화 노름을 도입하여 폭에 무관한 학습률 전이를 가능하게 하는 새로운 옵티마이저 MOGA 를 제안하며, 대규모 사전 학습에서 Muon 과 경쟁력 있으면서도 더 빠른 성능을 입증합니다.

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

이 논문은 의미적, 인스턴스, 픽셀 수준의 세 가지 데이터 세분성을 명시적으로 학습하는 계층적 구조와 점진적 마스킹 커리큘럼을 통해 대비 학습과 마스킹 이미지 모델링 간의 긴장 관계를 해결하고 더 강력하고 일반화 가능한 시각 표현을 학습하는 C2FMAE 를 제안합니다.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

이 논문은 기존 연구와 달리 인간과 달리 대형 언어 모델 (LLM) 은 추론 과정을 거칠수록 정직해지며, 이는 추론 내용 자체보다는 정직한 답변이 속한 표현 공간이 기만적인 영역보다 더 안정적이기 때문임을 규명했습니다.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

이 논문은 기존 초과완전 표현 (superposition) 이론이 상관관계를 고려하지 않은 이상적인 가정에 기반하고 있음을 지적하고, 실제 데이터의 상관관계가 간섭을 단순한 노이즈가 아닌 구성적 요소로 활용하여 의미적 클러스터와 순환 구조를 자연스럽게 형성한다는 'Bag-of-Words Superposition (BOWS)' 모델을 통해 이를 설명합니다.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

이 논문은 선형 예측자와 BART 모델 간의 공유 공변량으로 인한 편향과 비식별성 문제를 해결하기 위해 BART의 트리 생성 과정을 수정하여, 공변량이 중복되더라도 복잡한 상호작용을 모델링할 수 있는 새로운 준모수적 베이지안 가법 회귀 트리 (BART) 방법을 제안합니다.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

이 논문은 톱니형 밀링 커터의 실시간 스핀들 진동 특성을 분석하여 공구 상태를 감시하기 위해 의사결정나무 기반의 특성 선택과 5 가지 군집 최적화 알고리즘을 적용한 백-박스 서포트 벡터 머신 (SVM) 프레임워크를 제안합니다.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. Patange2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

이 논문은 강화 학습의 모델링, 알고리즘 선택, 하이퍼파라미터 최적화 등 다양한 구성 요소를 자동화하는 '자동화 강화 학습 (AutoRL)'의 최신 연구 동향, 특히 대규모 언어 모델 (LLM) 기반 기법을 포함한 문헌을 종합하고 향후 연구 방향과 과제를 논의합니다.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Empirical Asset Pricing via Ensemble Gaussian Process Regression

이 논문은 주식 및 거시경제 정보를 기반으로 조건부 기대 수익률을 예측하기 위해 가우시안 프로세스 회귀 (GPR) 기반 앙상블 학습 방법을 제안하며, 1962 년부터 2016 년까지의 미국 주식 데이터를 통해 기존 머신러닝 모델보다 통계적·경제적 성능이 우수하고 불확실성을 고려한 최적 포트폴리오 구성이 가능함을 입증했습니다.

Damir Filipovic, Puneet Pasricha2026-03-10🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

이 논문은 기존 심리측정학 기반의 컴퓨터 적응형 검사 (CAT) 를 머신러닝 관점에서 재조명하여 측정 모델, 문항 선정, 문항지 구성, 검사 통제 등 핵심 요소를 최적화하는 방안을 제시하고, 향후 보다 포괄적이고 학제적인 접근을 촉구하는 종합적 조사를 제공합니다.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

이 논문은 환경의 기억 효과를 소산자 (dissipatons) 로 인코딩하여 신경 양자 상태 (NQS) 와 소산자 임베디드 양자 마스터 방정식 (DQME) 을 결합함으로써, 기존 수치적 방법과 유사한 정확도를 유지하면서도 비마코프 열린 양자 역학 시뮬레이션의 확장성을 획기적으로 개선한 새로운 프레임워크를 제시합니다.

Long Cao, Liwei Ge, Daochi Zhang, Xiang Li, Yao Wang, Rui-Xue Xu, YiJing Yan, Xiao Zheng2026-03-10⚛️ quant-ph

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

이 논문은 사전 학습된 자기 주의 네트워크와 개별 저랭크 행렬을 공유하는 LoRA 기반의 효율적인 앙상블 방법인 'LoRA-Ensemble'을 제안하여, 명시적 앙상블 수준의 정확도와 우수한 보정 능력을 유지하면서 계산 비용과 메모리 오버헤드를 크게 줄인다고 요약할 수 있습니다.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

이 논문은 기존 방법의 비효율성과 특수성 문제를 해결하기 위해 정책 경사법을 활용해 확률 분포로 표현된 어트리뷰션 기반 설명을 최적화하는 'Fast Explanation (FEX)' 프레임워크를 제안하며, 이미지 및 텍스트 분류 작업에서 추론 시간을 97% 이상 단축하고 메모리 사용량을 70% 줄이면서도 높은 설명 품질과 일반성을 유지함을 입증했습니다.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG