LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

이 논문은 낮은 신호 대 잡음비와 높은 개인 간 변이성으로 인한 EEG 분류의 어려움을 해결하기 위해, 사전 학습을 통해 공통 패턴을 포착하고 로렌츠 저랭크 어댑터를 활용해 개인별 특성을 학습하는 'LAtte'라는 새로운 프레임워크를 제안하여 교차 대상 EEG 분류 성능을 크게 향상시켰음을 보여줍니다.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

이 논문은 대규모 추론 모델의 강화학습 미세조정 과정에서 비용이 많이 드는 롤아웃을 줄이고 학습 효율성을 극대화하기 위해, 히든 마르코프 모델을 기반으로 한 동적 예측 샘플링 (DPS) 을 제안하여 학습 동역학을 사전에 예측하고 정보량이 풍부한 프롬프트를 선별하는 방법을 제시합니다.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

이 논문은 드래프트 생성 없이 파라미터 효율적인 모듈을 통해 미래의 KV 중요도를 예측함으로써, 기존 방법들보다 훨씬 낮은 오버헤드로 긴 컨텍스트 작업에서 KV 캐시 제거의 정확성과 속도를 동시에 향상시키는 'LookaheadKV'를 제안합니다.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

이 논문은 기대값 기반의 안전성 제약을 전체 비용 분포를 비교하는 1 차 확률적 우세 (FSD) 제약으로 대체하고, 최적 수송 프레임워크와 양자 가중치를 통해 보편적 스펙트럼 위험 측도를 통제하는 새로운 정렬 프레임워크인 RAD 를 제안하여 안전 RLHF 의 강건성과 위험 민감성을 향상시킵니다.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

이 논문은 질량 스펙트럼으로부터 분자 구조를 식별하는 기계학습 모델의 신뢰성을 높이기 위해, 불확실성이 높은 경우 예측을 보류하는 선택적 예측 프레임워크를 제안하고, 특히 검색 수준에서의 알레토릭 불확실성 측정이 위험 - 커버리지 트레이드오프를 효과적으로 개선하여 사용자가 허용 가능한 오차율을 설정하고 이를 만족하는 주석의 하위 집합을 보장할 수 있음을 보여줍니다.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

이 논문은 인간 운동의 하위 운동 (submovement) 이론에 기반한 토큰화 전략과 마스크된 운동 구간 재구성을 통해 사전 학습된 트랜스포머 모델을 제안함으로써, 레이블이 부족한 환경에서도 기존 방법론보다 우수한 성능과 데이터 효율성을 보이는 손목형 IMU 신호 기반 인간 활동 인식 (HAR) 시스템을 개발했습니다.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

이 논문은 CVE 데이터베이스를 기반으로 새로운 취약점이 지속적으로 통합될 수 있는 확장 가능한 벤치마크인 TOSSS 를 제안하여, 대규모 언어 모델이 보안과 취약한 코드 조각 중 올바른 선택을 할 수 있는 능력을 0 에서 1 사이의 점수로 평가하는 방법을 제시합니다.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

본 논문은 B5G 셀프리 mmWave 네트워크에서 다중 RIS 구성과 도청자 탐지를 위해 프라이버시를 보호하는 연산 효율적인 연합 학습 (FL) 기반 프레임워크를 제안하며, 이를 통해 기존 방식 대비 약 30% 의 비밀 통신률 (Secrecy Rate) 향상을 달성함을 보여줍니다.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

본 논문은 LEO 6G 비지구 네트워크의 동적 전파 환경에서 고도 플랫폼 스테이션 (HAPS) 을 활용한 연방 학습 기반 빔 관리를 연구하여, MLP 보다 낮은 고도각에서 빔 예측 정확도와 안정성이 뛰어난 그래프 신경망 (GNN) 모델이 경량화되고 지능적인 빔 관리에 효과적임을 입증했습니다.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

이 논문은 트랜스포머의 MLP 계층이 연속 신호를 이진 라우팅하여 처리하며, 특히 GPT-2 Small 모델에서 후기 계층으로 갈수록 '기본 활성화' 뉴런과 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다. **한 줄 요약:** 이 논문은 트랜스포머 모델의 MLP 계층이 연속적인 신호를 이진 라우팅 방식으로 처리하며, GPT-2 Small 의 후기 계층에서 '기본 활성화'와 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다.

Peter Balogh2026-03-12🤖 cs.LG