cs.LG 편의 논문 | Gist.Science

Dual Randomized Smoothing: Beyond Global Noise Variance

이 논문은 전역 노이즈 분산의 한계를 극복하고 다양한 반경에서 강력한 인증된 강인성을 달성하기 위해 입력별 노이즈 분산을 예측하는 '이중 무작위 평활화 (Dual Randomized Smoothing)' 프레임워크를 제안합니다.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

이 논문은 교차 도메인 오프라인 강화학습에서 훈련 및 테스트 시간의 역동적 변화에 대한 이중 강인성을 보장하기 위해 새로운 로버스트 벨만 연산자와 보정 기법을 도입한 DROCO 알고리즘을 제안하고 그 우수성을 입증합니다.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

이 논문은 최적화와 생성 과정을 분리하여 온라인 강화학습에서 발생하는 안정성과 표현력 간의 긴장 관계를 해결하고, 잠재 공간에서 정책 최적화를 수행하는 새로운 프레임워크인 GoRL 을 제안하여 다양한 연속 제어 작업에서 기존 방법론을 크게 능가하는 성능을 입증합니다.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

이 논문은 비선형적 보상 함수와 고차원 환경에서 기존 샤플리 값의 한계를 극복하기 위해, 단조 변환 학습과 L0 희소성 제약을 통합한 '희소 등방성 샤플리 회귀 (SISR)' 프레임워크를 제안하여 정확한 특성 기여도 해석을 가능하게 합니다.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

이 논문은 제한된 자원과 데이터 제약 하에 개발된 2 단계 생성적 데이터 증강 기법을 통해 가짜 마스크를 실제와 유사하게 변환하여 마스크 착용 얼굴 탐지 및 인식 성능을 향상시키는 방법을 제안합니다.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

이 논문은 SALVE 라는 프레임워크를 제안하여 희소 오토인코더와 그라디언트 기반 시각화 기법을 결합해 신경망의 특징을 발견하고 검증하며, 이를 통해 모델의 가중치 공간을 정밀하게 편집하여 AI 시스템의 투명성과 제어 가능성을 높이는 방법을 제시합니다.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

이 논문은 RL 기반 언어 에이전트의 탐색 부족 문제를 해결하기 위해 에피소드 간 학습과 인-컨텍스트 정책 적응을 통해 환경 피드백을 실시간으로 활용하는 메타-RL 프레임워크 'LaMer'를 제안하고, 다양한 환경에서 기존 RL 베이스라인보다 우수한 성능과 일반화 능력을 입증했습니다.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

이 논문은 기초 모델과 대규모 2D 확산 모델의 강점을 결합하여, 깊이 지도를 재조명하고 입력 이미지를 증강하는 자기지도 학습 프레임워크인 'Re-Depth Anything'을 제안함으로써 단안 깊이 추정의 도메인 격차를 해소하고 정밀도와 현실감을 획기적으로 향상시킨다고 설명합니다.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

이 논문은 순차적 업데이트의 병렬화 한계를 극복하기 위해 뉴턴-카츠마르츠 기반의 콜모고로프-아르놀드 네트워크 (KAN) 학습 알고리즘에 사전 학습, 불연속 데이터 세트를 활용한 병렬 학습 및 FPGA 구현 등 세 가지 동시성 향상 전략을 제안하고 실험적으로 검증합니다.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

이 논문은 이진 잠재 조각화 (Binary Latent Sculpting) 손실 함수와 마스킹 자기회귀 흐름 (MAF) 을 결합한 위상적 다양체 학습 접근법을 통해, 기존 지도 학습 모델이 겪는 일반화 붕괴 문제를 해결하고 CIC-IDS-2017 벤치마크에서 제로샷 (zero-shot) 환경의 은밀한 침입 공격을 포함한 미지의 이상 징후를 효과적으로 탐지하는 'Latent Sculpting' 프레임워크를 제안합니다.

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

이 논문은 수직 연합 학습 (VFL) 환경에서 프라이버시 보호를 위해 특정 데이터나 라벨의 영향을 효과적으로 제거하면서도 재학습과 유사한 성능을 유지하는 'FedORA'라는 원시 - 이중 최적화 기반의 새로운 언러닝 알고리즘을 제안하고 그 이론적 보장과 실험적 유효성을 입증합니다.

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Network Traffic Analysis with Process Mining: The UPSIDE Case Study

이 논문은 온라인 게임 네트워크 트래픽을 프로세스 마이닝을 활용해 비감독적으로 상태 분석하고 해석 가능한 페트리 넷으로 인코딩하여 클래시 로얄과 로켓 리그와 같은 게임들을 분류하는 UPSIDE 사례 연구를 제시합니다.

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca2026-03-10🤖 cs.LG

Topological Spatial Graph Coarsening

이 논문은 공간 그래프의 노드 수를 줄이면서도 주요 위상적 특성을 보존하기 위해 삼각형 인식 여과 (triangle-aware graph filtration) 와 지속적 다이어그램을 활용한 매개변수 없는 위상적 공간 그래프 축소 기법을 제안하고, 회전·이동·확대에 대한 불변성을 증명하여 그 유효성을 입증합니다.

Anna Calissano, Etienne Lasalle2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

이 논문은 고차원 희소 마코프 결정 과정에서 아드버서리에 의한 데이터 오염이 존재하는 상황에서도 단일 정책 집중성 가정 하에 최적 정책에 근접하는 학습이 가능함을 보이는, 희소성과 오염 견고성을 동시에 고려한 새로운 액터-크리틱 알고리즘을 제안합니다.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Group Cross-Correlations with Faintly Constrained Filters

이 논문은 비아벨 군과 비단일 모듈 군에 대한 비전환 작용을 포함하는 일반적인 설정에서, 기존 제약 조건들의 호환성 문제를 해결하고 더 약한 제약을 통해 필터의 자유도를 줄이면서도 그룹 합성곱 신경망의 효율성을 유지하는 새로운 방법을 제안합니다.

Benedikt Fluhr2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

이 논문은 전력망 부하 예측의 안전성을 위해 기존 정확도 지표를 넘어 편향과 하향 예측 위험을 정량화하는 새로운 평가 프레임워크를 제안하고, 이를 통해 상태 공간 모델과 트랜스포머 아키텍처의 성능을 분석하며, 확률적 예측에서 발생할 수 있는 과도한 안전 마진 (가짜 안전) 문제를 해결하기 위해 편향 제약을 도입한 최적화 기법을 제시합니다.

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

이 논문은 생물학 및 물류 등 다양한 도메인의 그래프 데이터에서 노드, 엣지, 그래프 수준의 매개변수에 대한 효율적인 베이지안 추정을 가능하게 하기 위해, 그래프 인코더와 신경 사후 추정기를 결합한 새로운 amortized Bayesian inference 프레임워크를 제안하고 그 성능을 검증합니다.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench 는 실제 개발자 텔레메트리 데이터를 기반으로 6 개 프로그래밍 언어와 6 가지 작업 범주에 걸친 1,800 개의 평가 인스턴스를 포함하여, 기존 벤치마크의 한계를 극복하고 생태학적 타당성과 실용적 유용성을 중시하는 LLM 코드 생성 모델 평가를 위한 새로운 기준을 제시합니다.

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

이 논문은 대규모 언어 모델 (LLM) 과 다중 팔 밴딧 (MAB) 간의 양방향 상호작용을 구성 요소 수준에서 체계적으로 검토하여, MAB 가 LLM 의 학습 및 개인화 문제를 해결하고 LLM 이 MAB 의 핵심 구성 요소를 재정의하여 의사결정을 개선하는 상호 보완적 관계와 향후 연구 방향을 제시합니다.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

이 논문은 리소스 제약, 데이터 이질성, 그리고 프라이버시 위험이라는 엣지 환경의 근본적인 과제를 해결하기 위해 분할 학습과 계층적 연방 학습을 통합하여 LLM 을 효율적으로 미세 조정하는 새로운 프레임워크인 ELSA 를 제안하고, 이를 통해 통신 오버헤드를 줄이면서도 프라이버시를 보호하며 성능을 극대화하는 확장 가능한 솔루션을 제시합니다.

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

← 이전 다음 →