cs.LG 편의 논문 | Gist.Science

FlowTouch: View-Invariant Visuo-Tactile Prediction

이 논문은 카메라 시점과 센서 설정에 구애받지 않고 시각 정보를 기반으로 접촉 패턴을 예측하여 시뮬레이션과 현실 간의 격차를 해소하고 그립 안정성 예측에 활용 가능한 새로운 모델 'FlowTouch'를 제안합니다.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

이 논문은 ReinMax 추정기의 높은 분산을 Rao-Blackwellisation 및 제어 변수 기법을 통해 개선한 ReinMax-Rao 와 ReinMax-CV 추정기를 제안하고, 이를 통해 이산 잠재 변수를 가진 변이 오토인코더의 학습 성능을 향상시켰음을 보여줍니다.

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

이 논문은 사전 보정 비행 없이 항공기 자기 간섭을 실시간으로 보상하여 위성 항법에 대한 견고한 대안을 제공하는, 물리 기반 보정 모델과 신경망을 결합한 적응형 공중 자기 이상 항법 (MagNav) 아키텍처를 제안합니다.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

이 논문은 금융 언어 모델의 편향을 탐지하는 데 드는 막대한 계산 비용을 줄이기 위해, 여러 모델 간 편향 패턴의 유사성을 분석하고 한 모델의 결과를 활용해 다른 모델의 편향 유발 입력을 조기에 식리는 효율적인 방법을 제안합니다.

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

이 논문은 노드 특징과 레이블 간의 허위 상관관계를 힐베르트-슈미트 독립성 기준 (HSIC) 을 통해 식별하고 완화하는 메커니즘과 이중 수준 최적화 전략을 도입하여, 분포 변화 (OOD) 상황에서도 강건한 일반화 성능을 달성하는 새로운 그래프 신경망 프레임워크인 SCL-GNN 을 제안합니다.

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

이 논문은 불규칙한 시계열 구조와 복잡한 질병 경로를 가진 중환자실 전자의무기록을 기반으로 사망 위험을 정확하고 해석 가능하게 예측하기 위해, 명시적 연속 시간 인코딩과 SNOMED 기반 의학적 개념 표현을 통합한 'TA-RNN-Medical-Hybrid'라는 새로운 딥러닝 프레임워크를 제안하고 MIMIC-III 데이터셋에서 우수한 성능과 임상적 통찰력을 입증합니다.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

이 논문은 물리적 및 기하학적 지식을 활용하여 복잡한 물리 법칙으로 제약된 최적화 문제를 효율적인 다면체 재형식으로 변환함으로써 계산 속도를 최대 6,400 배 향상시키고 메모리 사용량을 99.87% 줄이면서 고품질 해를 제공하는 'PolyFormer'를 제안합니다.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

이 논문은 비구속 상태 공간에서 가우시안 프로세스 사후 샘플링 강화 학습 (GP-PSRL) 알고리즘의 베이지안 후회 상한을 유도하여, 최대 정보 획득량에 대한 최적의 의존성과 비구속 상태 공간의 문제를 해결하고 기존 이론적 한계를 극복했습니다.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

이 논문은 선형 분리 가능한 이진 분류에서 심층 선형 대각 네트워크를 학습할 때, SAM(Sharpness-Aware Minimization) 이 깊이 $L=2$ 이상에서 초기화에 민감하게 반응하거나 '순차적 특징 증폭' 현상을 보이는 등 경사 하강법 (GD) 과는 근본적으로 다른 암시적 편향을 가짐을 이론적으로 증명하고 실험적으로 검증합니다.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

이 논문은 다양한 경계 조건을 가진 매개변수 편미분방정식 (PDE) 의 효율적이고 정확한 시뮬레이션을 위해, 기존 축소 차원 기법의 한계를 극복하고 복잡한 PDE 를 강력하게 표현할 수 있는 그래프 지시 신경망 (GINN) 프레임워크를 제안합니다.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

이 논문은 LLM 과 VLM 을 활용해 자동 생성된 개념 기반 마스크를 사용하여 비전 트랜스포머 (ViT) 의 내부 관련성 지도를 정렬함으로써, 배경과 같은 허위 상관관계에 의존하는 문제를 해결하고 분포 변화에 대한 강건성을 향상시키는 새로운 파인튜닝 프레임워크를 제안합니다.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

이 논문은 확산 행렬을 알지 못하는 연속 시간 선형 정상 확률 미분방정식에서 인과 구조 하의 드리프트 계수 부호의 식별 가능성 (edge-sign identifiability) 을 연구하고, 충실도 (faithfulness) 개념을 기반으로 일반 그래프에 대한 식별성 판별 기준을 제시하며 다양한 인과 구조에서의 부호 식별성을 규명합니다.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

이 논문은 디지털 병리학에서 다중 인스턴스 학습 (MIL) 모델의 주석 열지도 (heatmap) 의 유효성을 검증하기 위한 새로운 평가 프레임워크를 제시하고, 기존 주의 메커니즘 기반 방법보다 교란 (perturbation) 및 계층별 관련성 전파 (LRP) 같은 기법이 모델 의사결정 메커니즘을 더 정확하게 반영하여 생물학적 통찰력을 제공할 수 있음을 대규모 벤치마크 실험을 통해 입증했습니다.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Towards a more efficient bias detection in financial language models

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Towards plausibility in time series counterfactual explanations

Unifying On- and Off-Policy Variance Reduction Methods

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective