Automated Reinforcement Learning: An Overview

이 논문은 강화 학습의 모델링, 알고리즘 선택, 하이퍼파라미터 최적화 등 다양한 구성 요소를 자동화하는 '자동화 강화 학습 (AutoRL)'의 최신 연구 동향, 특히 대규모 언어 모델 (LLM) 기반 기법을 포함한 문헌을 종합하고 향후 연구 방향과 과제를 논의합니다.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Online Dispatching and Routing for Automated Guided Vehicles in Pickup and Delivery Systems on Loop-Based Graphs

이 논문은 순환 기반 그래프에서 용량과 작업 순서가 지정된 자동 유도 차량 (AGV) 을 위한 온라인 충돌 방지 스케줄링 및 라우팅을 해결하는 새로운 알고리즘을 제안하고, 이를 기존 방법론들과 비교하여 더 짧은 계산 시간 내에 동등하거나 우수한 성능을 입증했습니다.

Louis Stubbe, Jens Goemaere, Jan Goedgebeur2026-03-10💻 cs

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

이 논문은 기존 심리측정학 기반의 컴퓨터 적응형 검사 (CAT) 를 머신러닝 관점에서 재조명하여 측정 모델, 문항 선정, 문항지 구성, 검사 통제 등 핵심 요소를 최적화하는 방안을 제시하고, 향후 보다 포괄적이고 학제적인 접근을 촉구하는 종합적 조사를 제공합니다.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

이 논문은 기존 방법의 비효율성과 특수성 문제를 해결하기 위해 정책 경사법을 활용해 확률 분포로 표현된 어트리뷰션 기반 설명을 최적화하는 'Fast Explanation (FEX)' 프레임워크를 제안하며, 이미지 및 텍스트 분류 작업에서 추론 시간을 97% 이상 단축하고 메모리 사용량을 70% 줄이면서도 높은 설명 품질과 일반성을 유지함을 입증했습니다.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

이 논문은 최적 수송 이론에서 유도된 정규화와 볼록 통합 문제를 통해 국소 리프시츠 연속성을 보장하면서도 훈련 데이터를 정확하게 적합할 수 있는 새로운 2 단계 적대적 방어 모델 OTAD 를 제안하여 기존 방법들의 한계를 극복하고 다양한 데이터셋에서 우수한 성능을 입증했습니다.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

이 논문은 고차원 공간이나 복잡한 데이터셋에서 기존 방법의 한계를 극복하기 위해 어닐링 중요도 샘플링 (AIS) 과 재매개변수화 기법을 결합하여 가우시안 프로세스 잠재 변수 모델 (GPLVM) 의 변분 추론 성능을 획기적으로 개선하는 새로운 알고리즘을 제안합니다.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

이 논문은 기존 평가의 한계를 지적하고, 데이터 이동 및 메모리 접근 오버헤드를 고려한 정밀한 에너지 모델을 통해 특정 운영 조건 (낮은 스파이크율과 적절한 시간 창) 에서만 SNN 이 QNN 보다 에너지 효율이 우수함을 입증하고, 이를 통해 스마트워치 배터리 수명을 두 배로 늘릴 수 있음을 보여줍니다.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

이 논문은 물리 시스템의 수학적 구조와 안정성을 보존하고 입력-잠재 공간 매핑을 가역적으로 만드는 새로운 결합 진동자 네트워크 (CON) 모델을 제안하여, 이미지 기반의 복잡한 비선형 역학을 학습하고 잠재 공간에서 폐형 모델 기반 제어를 가능하게 함으로써 연성 로봇 제어에 탁월한 성능을 입증합니다.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

이 논문은 볼츠만 분포에서 독립적이고 동일한 분포 (IID) 를 가진 샘플을 생성하기 위해 에너지 함수를 기반으로 한 확산 기반 샘플러 'Noised Energy Matching(NEM)'과 편향과 분산을 균형 있게 조절하는 부트스트래핑 기법을 도입한 'BNEM'을 제안하며, 다양한 실험을 통해 기존 방법보다 뛰어난 성능과 견고함을 입증합니다.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

이 논문은 부분 관측 가능한 동적 시스템에서 숨겨진 변수와 메모리 항 간의 이론적 연결을 제공하는 모리 - 츠반지 (Mori-Zwanzig) 형식주의에 영감을 받아, 데이터로부터 비마코프 역학을 직접 학습하기 위한 상수 지연 신경 지연 미분 방정식 (NDDEs) 프레임워크를 제안하고 다양한 시뮬레이션 및 실험 데이터를 통해 기존 방법들보다 우수한 성능을 입증합니다.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG