SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

이 논문은 노드 특징과 레이블 간의 허위 상관관계를 힐베르트-슈미트 독립성 기준 (HSIC) 을 통해 식별하고 완화하는 메커니즘과 이중 수준 최적화 전략을 도입하여, 분포 변화 (OOD) 상황에서도 강건한 일반화 성능을 달성하는 새로운 그래프 신경망 프레임워크인 SCL-GNN 을 제안합니다.

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

이 논문은 불규칙한 시계열 구조와 복잡한 질병 경로를 가진 중환자실 전자의무기록을 기반으로 사망 위험을 정확하고 해석 가능하게 예측하기 위해, 명시적 연속 시간 인코딩과 SNOMED 기반 의학적 개념 표현을 통합한 'TA-RNN-Medical-Hybrid'라는 새로운 딥러닝 프레임워크를 제안하고 MIMIC-III 데이터셋에서 우수한 성능과 임상적 통찰력을 입증합니다.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

이 논문은 물리적 및 기하학적 지식을 활용하여 복잡한 물리 법칙으로 제약된 최적화 문제를 효율적인 다면체 재형식으로 변환함으로써 계산 속도를 최대 6,400 배 향상시키고 메모리 사용량을 99.87% 줄이면서 고품질 해를 제공하는 'PolyFormer'를 제안합니다.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

이 논문은 비구속 상태 공간에서 가우시안 프로세스 사후 샘플링 강화 학습 (GP-PSRL) 알고리즘의 베이지안 후회 상한을 유도하여, 최대 정보 획득량에 대한 최적의 의존성과 비구속 상태 공간의 문제를 해결하고 기존 이론적 한계를 극복했습니다.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

이 논문은 선형 분리 가능한 이진 분류에서 심층 선형 대각 네트워크를 학습할 때, SAM(Sharpness-Aware Minimization) 이 깊이 L=2L=2 이상에서 초기화에 민감하게 반응하거나 '순차적 특징 증폭' 현상을 보이는 등 경사 하강법 (GD) 과는 근본적으로 다른 암시적 편향을 가짐을 이론적으로 증명하고 실험적으로 검증합니다.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

이 논문은 LLM 과 VLM 을 활용해 자동 생성된 개념 기반 마스크를 사용하여 비전 트랜스포머 (ViT) 의 내부 관련성 지도를 정렬함으로써, 배경과 같은 허위 상관관계에 의존하는 문제를 해결하고 분포 변화에 대한 강건성을 향상시키는 새로운 파인튜닝 프레임워크를 제안합니다.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

이 논문은 확산 행렬을 알지 못하는 연속 시간 선형 정상 확률 미분방정식에서 인과 구조 하의 드리프트 계수 부호의 식별 가능성 (edge-sign identifiability) 을 연구하고, 충실도 (faithfulness) 개념을 기반으로 일반 그래프에 대한 식별성 판별 기준을 제시하며 다양한 인과 구조에서의 부호 식별성을 규명합니다.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

이 논문은 디지털 병리학에서 다중 인스턴스 학습 (MIL) 모델의 주석 열지도 (heatmap) 의 유효성을 검증하기 위한 새로운 평가 프레임워크를 제시하고, 기존 주의 메커니즘 기반 방법보다 교란 (perturbation) 및 계층별 관련성 전파 (LRP) 같은 기법이 모델 의사결정 메커니즘을 더 정확하게 반영하여 생물학적 통찰력을 제공할 수 있음을 대규모 벤치마크 실험을 통해 입증했습니다.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

이 논문은 유효성, 희소성, 근접성 및 새로운 소프트-DTW 기반의 타당성 요소를 결합한 손실 함수를 통해 시계열 분류 문제에 대해 현실적인 시간적 구조를 가진 반사실적 설명을 생성하는 새로운 방법을 제안하고, 기존 방법들보다 타겟 클래스와의 분포 정렬 및 시간적 현실성 측면에서 우수한 성능을 입증합니다.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

이 논문은 불균형 데이터의 과적합 문제를 해결하기 위해 국소적 가중치 업데이트를 역사적 시퀀스로 대체하는 '가중 분수 웨일 적분'을 기반으로 한 새로운 최적화 알고리즘을 제안하며, 의료 진단 및 금융 사기 탐지에서 기존 최적화 기법 대비 PR-AUC 를 약 40% 향상시키는 성과를 입증했습니다.

Gustavo A. Dorrego2026-03-10🤖 cs.LG

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

이 논문은 토큰 조건부 생성과 강화 학습을 결합한 ToCoRL 프레임워크를 제안하여 대규모 언어 모델이 재학습 없이도 상황에 맞는 행동을 유연하게 전환하고 학습할 수 있도록 함으로써, 복잡한 추론 모델이 사실 기반 질문 답변과 같은 다른 영역에서도 뛰어난 성능을 발휘하도록 함을 보여줍니다.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG