cs.LG 편의 논문 | Gist.Science

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

이 논문은 기대값 기반의 안전성 제약을 전체 비용 분포를 비교하는 1 차 확률적 우세 (FSD) 제약으로 대체하고, 최적 수송 프레임워크와 양자 가중치를 통해 보편적 스펙트럼 위험 측도를 통제하는 새로운 정렬 프레임워크인 RAD 를 제안하여 안전 RLHF 의 강건성과 위험 민감성을 향상시킵니다.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

이 논문은 질량 스펙트럼으로부터 분자 구조를 식별하는 기계학습 모델의 신뢰성을 높이기 위해, 불확실성이 높은 경우 예측을 보류하는 선택적 예측 프레임워크를 제안하고, 특히 검색 수준에서의 알레토릭 불확실성 측정이 위험 - 커버리지 트레이드오프를 효과적으로 개선하여 사용자가 허용 가능한 오차율을 설정하고 이를 만족하는 주석의 하위 집합을 보장할 수 있음을 보여줍니다.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

이 논문은 테스트 시간 확장 하에서 추론형 LLM 을 평가하기 위한 통계적 순위 산출 방법들을 구현한 오픈소스 라이브러리 'Scorio'를 소개하고, 다양한 벤치마크에서 이 방법들이 신뢰할 수 있는 모델 순위 매기기를 가능하게 함을 보여줍니다.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

이 논문은 인간 운동의 하위 운동 (submovement) 이론에 기반한 토큰화 전략과 마스크된 운동 구간 재구성을 통해 사전 학습된 트랜스포머 모델을 제안함으로써, 레이블이 부족한 환경에서도 기존 방법론보다 우수한 성능과 데이터 효율성을 보이는 손목형 IMU 신호 기반 인간 활동 인식 (HAR) 시스템을 개발했습니다.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

이 논문은 언어나 시각 데이터에 대한 대규모 교차 모달 지도 학습에 의존하지 않고, 39k 개의 점구름 데이터로만 학습된 경량 트랜스포머 아키텍처 'Pointy'를 제안하여, 훨씬 더 방대한 데이터로 훈련된 기존 기반 모델들을 능가하거나 경쟁하는 성능을 입증하고 있습니다.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

이 논문은 CVE 데이터베이스를 기반으로 새로운 취약점이 지속적으로 통합될 수 있는 확장 가능한 벤치마크인 TOSSS 를 제안하여, 대규모 언어 모델이 보안과 취약한 코드 조각 중 올바른 선택을 할 수 있는 능력을 0 에서 1 사이의 점수로 평가하는 방법을 제시합니다.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

본 논문은 B5G 셀프리 mmWave 네트워크에서 다중 RIS 구성과 도청자 탐지를 위해 프라이버시를 보호하는 연산 효율적인 연합 학습 (FL) 기반 프레임워크를 제안하며, 이를 통해 기존 방식 대비 약 30% 의 비밀 통신률 (Secrecy Rate) 향상을 달성함을 보여줍니다.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

본 논문은 LEO 6G 비지구 네트워크의 동적 전파 환경에서 고도 플랫폼 스테이션 (HAPS) 을 활용한 연방 학습 기반 빔 관리를 연구하여, MLP 보다 낮은 고도각에서 빔 예측 정확도와 안정성이 뛰어난 그래프 신경망 (GNN) 모델이 경량화되고 지능적인 빔 관리에 효과적임을 입증했습니다.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

이 논문은 트랜스포머의 MLP 계층이 연속 신호를 이진 라우팅하여 처리하며, 특히 GPT-2 Small 모델에서 후기 계층으로 갈수록 '기본 활성화' 뉴런과 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다. **한 줄 요약:** 이 논문은 트랜스포머 모델의 MLP 계층이 연속적인 신호를 이진 라우팅 방식으로 처리하며, GPT-2 Small 의 후기 계층에서 '기본 활성화'와 '예외 처리' 뉴런 간의 합의 구조가 발달하여 비선형 처리가 필요한 토큰을 결정하는 메커니즘을 발견하고 이를 실험적으로 입증했다고 요약할 수 있습니다.

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

이 논문은 물리 모델의 매개변수 분포를 마르코프 연쇄 몬테 카를로 (MCMC) 를 통해 신경망 훈련에 입력함으로써, 기존 방법의 비효율성과 비물리적 파라미터 문제를 해결하고 계산 비용을 크게 줄이면서 동적 시스템의 불확실성 정량화를 가능하게 하는 새로운 대리 모델 접근법을 제안합니다.

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

이 논문은 시뮬레이션 데이터와 평균 제곱 오차 손실 함수를 사용하여 단일 요약 네트워크로 매개변수 추정 역문제를 해결하는 'ForwardFlow'라는 심층 학습 기반의 빈도주의 통계적 추론 프레임워크를 제안하며, 유한 표본 정확성, 데이터 오염에 대한 강건성, 알고리즘 근사라는 세 가지 이상적 특성을 입증합니다.

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

이 논문은 가우시안 과정 회귀와 베이지안 최적화를 통합된 6 단계 서브로프 프레임워크로 결합하여, 미분 정보와 적응형 기법을 활용함으로써 포텐셜 에너지 표면상의 정류점 탐색 (최소점, 단일 및 양끝점 안장점) 의 효율성과 정확도를 획기적으로 향상시키는 방법을 제시합니다.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

이 논문은 물리적 시스템의 고차원 비선형 동역학을 장기 예측, 매개변수 일반화 및 스펙트럼 분석이 가능한 방식으로 모델링하기 위해, 공간 모드와 시간 진화를 분리하는 인과적 신경장 파라미터화를 기반으로 한 '분해된 신경 암시적 DMD' 방법을 제안합니다.

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

이 논문은 마우스와 인간 대뇌 피질의 GABAergic 억제성 interneuron 데이터를 활용하여 전기생리학적 기록을 전사체학 정체성에 매핑하는 프레임워크를 재현하고, 주어진 시퀀스 모델을 통해 인간 데이터에서 마우스 데이터의 전이 학습이 분류 성능 향상에 기여함을 입증했습니다.

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

이 논문은 24 차원에서 최적의 구 포장 성질을 가진 리치 격자 (Leech lattice) 를 기반으로 인덱싱, 각도 탐색, 병렬 역양자화 커널을 가능하게 하는 '리치 격자 벡터 양자화 (LLVQ)' 알고리즘을 제안하여, 기존 방법들보다 우수한 성능으로 대규모 언어 모델 (LLM) 을 효율적으로 압축하는 새로운 접근법을 제시합니다.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

이 논문은 텍스트-음악 생성 모델을 비디오 이벤트 곡선으로만 미세 조정하고 추론 시 비디오 이벤트 곡선으로 대체하는 V2M-Zero 를 제안하여, 짝지어진 데이터 없이도 비디오와 음악 간의 시간적 정렬을 달성함을 보여줍니다.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

이 논문은 전통적인 열화상 기법의 한계를 극복하고 경성 물리 법칙을 준수하는 미분 가능 물리 솔버를 활용하여 3D 열 확산 장을 연속 신경장으로 파라미터화함으로써, 비파괴 검사를 위한 정량적 3D 재료 특성 재구성 및 결함 위치 파악의 정확도를 획기적으로 향상시킨 'NeFTY' 프레임워크를 제안합니다.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

이 논문은 기존 코드베이스에 추가 수정 없이 통합 가능하며, 아키텍처 제약을 두지 않으면서도 역전파 시 중간 활성화 메모리 사용을 2 배 이상 절감하고 확률적 경사 하강법과 유사한 수렴성을 보장하는 새로운 합성곱 레이어인 XConv 를 제안합니다.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

이 논문은 2018 년부터 2026 년 초까지의 탈중앙화 연방학습 (DFL) 연구들을 체계적으로 검토하고, 기존 중앙집중식 FL 의 한계를 극복하는 두 가지 아키텍처를 분류하며, 핵심 병목 현상에 기반한 통합 분류 체계를 제시하고 향후 연구 방향을 제안합니다.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

이 논문은 다차원 랜덤 부분합 문제의 최근 발전을 활용하여 구조적 가지치기 (structured pruning) 를 위한 강한 로또 티켓 가설을 수학적으로 증명하고, 무작위 초기화된 합성곱 신경망이 훈련 없이도 효율적인 구조적 서브네트워크를 포함함을 보여줍니다.

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG

← 이전 다음 →