ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

이 논문은 부분 관측 환경에서 최대 안전 집합을 근사하고 엄격한 안전 보장을 제공하는 관측 조건부 잔류 신경 제어 장벽 함수 (ORN-CBF) 를 제안하며, 하밀토니안-야코비 접근법과 하이퍼네트워크 아키텍처를 활용하여 시뮬레이션 및 실제 로봇 실험에서 기존 방법보다 우수한 안전성과 일반화 성능을 입증했습니다.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

이 논문은 엣지-희소 이분 지식 그래프의 링크 예측 성능을 향상시키기 위해 기존 엣지만을 재샘플링하거나 의미적 KNN 을 활용한 데이터 증강 프레임워크인 AEGIS 를 제안하고, 다양한 희소성 환경에서 이 방법이 기존 베이스라인 대비 성능과 보정력을 개선함을 입증합니다.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

이 논문은 웨어러블 센서 기반의 인간 활동 인식에서 새로운 사용자의 데이터로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 자기지도 학습 트랜스포머와 지식 증류 기반 CNN 을 결합한 CLAD-Net 을 제안하고, 제한된 라벨 데이터 환경에서도 기존 방법들보다 뛰어난 성능과 낮은 망각률을 보임을 입증합니다.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

이 논문은 관측 데이터를 기반으로 마르코프 결정 과정에서의 개인별 잠재 결과를 예측하기 위해 이중 강건성, Neyman 직교성, 준-오라클 효율성을 보장하는 새로운 메타 러너인 DRQ-learner 를 제안하고 이론적 근거와 실증적 유효성을 입증합니다.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

이 논문은 시연 데이터의 실패 및 복구 패턴과 같은 시간적 구조를 명시적으로 모델링하기 위해 상태 전이 어텐션 (STA) 메커니즘을 도입한 'CroSTAta'라는 새로운 트랜스포머 아키텍처를 제안하며, 이를 통해 로봇 조작 정책의 강건성과 정밀도를 기존 방법론보다 크게 향상시켰음을 보여줍니다.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

이 논문은 동적 변분 오토인코더 기반의 '이중 투영 (double projection)' 방법을 제안하여 관측 데이터로부터 시스템 상태 궤적과 잡음 시계열을 동시에 추정함으로써, 저차원 상태 공간에서 다단계 예측이 가능한 확률적 동적 시스템을 학습하고 이를 결정론적 모델과 비교 평가합니다.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

이 논문은 대규모 LLM 기반 에이전트 워크플로우를 활용해 약 1 만 편의 과학 논문에서 열전 및 구조적 특성을 자동 추출하여 2 만 7 천 8 백여 개의 레코드로 구성된 가장 큰 규모의 데이터셋을 구축하고, 이를 통해 재료 발견을 가속화할 수 있는 확장 가능한 파이프라인과 공개 도구를 제시합니다.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci