cs.LG 편의 논문 | Gist.Science

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

SNPgen 은 표현형 정보를 조건으로 한 잠재 확산 모델을 통해 개인 식별 정보가 완전히 제거된 채 질병 예측 성능을 유지하는 합성 유전자형 데이터를 생성하는 새로운 프레임워크를 제안합니다.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

이 논문은 낮은 신호 대 잡음비와 높은 개인 간 변이성으로 인한 EEG 분류의 어려움을 해결하기 위해, 사전 학습을 통해 공통 패턴을 포착하고 로렌츠 저랭크 어댑터를 활용해 개인별 특성을 학습하는 'LAtte'라는 새로운 프레임워크를 제안하여 교차 대상 EEG 분류 성능을 크게 향상시켰음을 보여줍니다.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

이 논문은 U-Net 을 변형한 파라미터 효율적인 Diffusion Transformer 를 도입하여 200bp 세포 유형별 조절 DNA 서열을 생성하고, Enformer 기반 보상 모델을 활용한 DDPO 미세조정을 통해 예측된 조절 활성을 38 배 향상시켰음을 보고합니다.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

이 논문은 기존 동등성 검정의 한계를 극복하고 분포 전체의 차이를 평가하기 위해 커널 스타인 불일치와 최대 평균 불일치를 활용한 새로운 커널 기반 동등성 검정 방법을 제안합니다.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

이 논문은 대규모 추론 모델의 강화학습 미세조정 과정에서 비용이 많이 드는 롤아웃을 줄이고 학습 효율성을 극대화하기 위해, 히든 마르코프 모델을 기반으로 한 동적 예측 샘플링 (DPS) 을 제안하여 학습 동역학을 사전에 예측하고 정보량이 풍부한 프롬프트를 선별하는 방법을 제시합니다.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

이 논문은 강화학습에서 비에르고딕 보상 과정 하에서 단일 에이전트의 장기적 성능을 최적화하기 위해 기대값 대신 개별 궤적의 평균을 고려해야 함을 예시를 통해 설명하고, 기존 해결 방안들을 제시합니다.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

이 논문은 드래프트 생성 없이 파라미터 효율적인 모듈을 통해 미래의 KV 중요도를 예측함으로써, 기존 방법들보다 훨씬 낮은 오버헤드로 긴 컨텍스트 작업에서 KV 캐시 제거의 정확성과 속도를 동시에 향상시키는 'LookaheadKV'를 제안합니다.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

이 논문은 랭크-스코어 특성 함수와 인지 다양성을 활용한 결합적 융합 분석 (CFA) 을 통해 2024 년 NCAA 토너먼트 결과 예측 정확도를 기존 최상위 시스템보다 높은 74.60% 로 끌어올린 새로운 접근법을 제시합니다.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

이 논문은 차량 내 배포 환경의 제한된 컴퓨팅 자원 하에서 예측 가능한 지연 시간과 안정성을 보장하기 위해, 기존 정확도 중심 평가의 한계를 극복하고 다양한 이상 탐지 모델의 실제 배포 적합성을 체계적으로 평가하는 'ECoLAD' 프로토콜을 제안합니다.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

이 논문은 가우시안 혼합 모델 클러스터링의 다중성을 활용하여 반복적인 선택 과정을 통해 '역사적 합의 (Historical Consensus)'를 형성함으로써, 아키텍처 제약이나 하이퍼파라미터 튜닝 없이도 후방 붕괴를 근본적으로 방지하는 새로운 VAE 학습 기법을 제안합니다.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

이 논문은 커널 밀도 추정 (KDE) 을 기반으로 훈련 데이터의 분포와 합성 데이터 간의 거리 분포를 모델링하여, 기존 방법보다 정밀하고 계산 효율적으로 표본 합성 데이터의 구성원 유출 위험을 정량화하는 실용적인 프레임워크를 제안합니다.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

이 논문은 기대값 기반의 안전성 제약을 전체 비용 분포를 비교하는 1 차 확률적 우세 (FSD) 제약으로 대체하고, 최적 수송 프레임워크와 양자 가중치를 통해 보편적 스펙트럼 위험 측도를 통제하는 새로운 정렬 프레임워크인 RAD 를 제안하여 안전 RLHF 의 강건성과 위험 민감성을 향상시킵니다.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

이 논문은 질량 스펙트럼으로부터 분자 구조를 식별하는 기계학습 모델의 신뢰성을 높이기 위해, 불확실성이 높은 경우 예측을 보류하는 선택적 예측 프레임워크를 제안하고, 특히 검색 수준에서의 알레토릭 불확실성 측정이 위험 - 커버리지 트레이드오프를 효과적으로 개선하여 사용자가 허용 가능한 오차율을 설정하고 이를 만족하는 주석의 하위 집합을 보장할 수 있음을 보여줍니다.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

이 논문은 테스트 시간 확장 하에서 추론형 LLM 을 평가하기 위한 통계적 순위 산출 방법들을 구현한 오픈소스 라이브러리 'Scorio'를 소개하고, 다양한 벤치마크에서 이 방법들이 신뢰할 수 있는 모델 순위 매기기를 가능하게 함을 보여줍니다.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

이 논문은 인간 운동의 하위 운동 (submovement) 이론에 기반한 토큰화 전략과 마스크된 운동 구간 재구성을 통해 사전 학습된 트랜스포머 모델을 제안함으로써, 레이블이 부족한 환경에서도 기존 방법론보다 우수한 성능과 데이터 효율성을 보이는 손목형 IMU 신호 기반 인간 활동 인식 (HAR) 시스템을 개발했습니다.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

이 논문은 언어나 시각 데이터에 대한 대규모 교차 모달 지도 학습에 의존하지 않고, 39k 개의 점구름 데이터로만 학습된 경량 트랜스포머 아키텍처 'Pointy'를 제안하여, 훨씬 더 방대한 데이터로 훈련된 기존 기반 모델들을 능가하거나 경쟁하는 성능을 입증하고 있습니다.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

이 논문은 CVE 데이터베이스를 기반으로 새로운 취약점이 지속적으로 통합될 수 있는 확장 가능한 벤치마크인 TOSSS 를 제안하여, 대규모 언어 모델이 보안과 취약한 코드 조각 중 올바른 선택을 할 수 있는 능력을 0 에서 1 사이의 점수로 평가하는 방법을 제시합니다.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

본 논문은 B5G 셀프리 mmWave 네트워크에서 다중 RIS 구성과 도청자 탐지를 위해 프라이버시를 보호하는 연산 효율적인 연합 학습 (FL) 기반 프레임워크를 제안하며, 이를 통해 기존 방식 대비 약 30% 의 비밀 통신률 (Secrecy Rate) 향상을 달성함을 보여줍니다.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

본 논문은 LEO 6G 비지구 네트워크의 동적 전파 환경에서 고도 플랫폼 스테이션 (HAPS) 을 활용한 연방 학습 기반 빔 관리를 연구하여, MLP 보다 낮은 고도각에서 빔 예측 정확도와 안정성이 뛰어난 그래프 신경망 (GNN) 모델이 경량화되고 지능적인 빔 관리에 효과적임을 입증했습니다.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

이 논문은 트랜스포머의 MLP 계층이 연속 신호를 이진 라우팅하여 처리하며, 특히 GPT-2 Small 모델에서 후기 계층으로 갈수록 '기본 활성화' 뉴런과 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다. **한 줄 요약:** 이 논문은 트랜스포머 모델의 MLP 계층이 연속적인 신호를 이진 라우팅 방식으로 처리하며, GPT-2 Small 의 후기 계층에서 '기본 활성화'와 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다.

Peter Balogh2026-03-12🤖 cs.LG

← 이전 다음 →