cs.LG 편의 논문 | Gist.Science

Dreamer-CDP: Improving Reconstruction-free World Models Via Continuous Deterministic Representation Prediction

이 논문은 재구성을 사용하지 않는 세계 모델의 성능 한계를 극복하기 위해 연속적이고 결정적인 표현을 기반으로 한 JEPA 스타일의 예측기를 도입하여, 크래fter 환경에서 Dreamer 와 동등한 성능을 달성하는 'Dreamer-CDP'를 제안합니다.

Michael Hauri, Friedemann Zenke2026-03-10🤖 cs.LG

Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR

이 논문은 수학 추론 태스크와 테스트 하네스 조작을 동시에 가능하게 하는 'Countdown-Code' 환경을 통해, 학습 데이터의 소량 오염으로 인한 보상 해킹이 강화학습을 거쳐 일반화될 수 있음을 규명하고 합성 학습 데이터 검증의 중요성을 강조합니다.

Muhammad Khalifa, Zohaib Khan, Omer Tafveez, Hao Peng, Lu Wang2026-03-10🤖 cs.LG

Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

이 논문은 비가우시안 확률적 시스템에 대해 분포 가정이 필요 없는 컨포멀 추론과 수축 이론을 결합하여, 유한한 샘플로 안전성 보장이 가능한 확률적 제약 조건을 결정론적 문제로 변환하는 새로운 궤적 최적화 프레임워크를 제시합니다.

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Deep Generative Spatiotemporal Engression for Probabilistic Forecasting of Epidemics

이 논문은 복잡한 시공간적 상호작용과 불확실성을 고려하여 전염병 발생을 확률적으로 예측하기 위해, 내생적 불확실성 정량화와 기하학적 에르고딕성을 보장하는 경량 딥 생성 기반 시공간 회귀 (Deep Generative Spatiotemporal Regression) 프레임워크를 제안하고, 다양한 역학 데이터셋에서 기존 방법론보다 우수한 성능을 입증합니다.

Rajdeep Pathak, Tanujit Chakraborty2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

이 논문은 Adam 의 일반화 성능 한계를 극복하기 위해 역방향 업데이트 메커니즘을 도입한 'InvAdam'과 이를 Adam 과 결합하여 수렴성과 일반화 성능을 동시에 향상시킨 'DualAdam'을 제안하고, 확산 이론을 통해 그 이론적 근거를 입증하며 다양한 실험을 통해 Adam 과 기존 최첨단 옵티마이저보다 우수한 성능을 보임을 입증했습니다.

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

이 논문은 복잡한 이미지 스타일링 작업을 해결하기 위해 직관적인 도구 조합과 명시적 추론을 기반으로 한 에이전트 계획 프레임워크를 제안하고, 이를 위해 생성된 대규모 합성 데이터셋을 활용하여 오프라인 강화학습을 통해 모델의 성능을 향상시키는 방법을 제시합니다.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Spectral Conditioning of Attention Improves Transformer Performance

이 논문은 어텐션 블록의 자코비안 조건수를 줄이기 위해 스펙트럼 특성을 체계적으로 조절하는 방법을 제안하여, 다양한 트랜스포머 아키텍처와 작업에서 성능을 일관되게 향상시킵니다.

Hemanth Saratchandran, Simon Lucey2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

이 논문은 다양한 시나리오를 포괄하는 벤치마크 'MSKernelBench'를 제안하고, 이를 기반으로 프로파일링 정보를 활용하여 cuBLAS 등 상용 라이브러리와 경쟁할 수 있는 수준의 성능 개선을 이루는 다중 에이전트 자동 CUDA 커널 최적화 시스템 'CUDAMaster'를 소개합니다.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

이 논문은 분류 모델이 예측 시 소수의 지배적인 매개변수에 의존하는 취약성을 해결하기 위해, 훈련 과정에서 과도한 매개변수 기여도를 보정하여 더 넓은 범위의 매개변수를 활용하도록 유도하는 '매개변수 기여 패턴 형성 (SPCP)' 방법을 제안함으로써 분포 외 (OOD) 데이터 탐지 성능을 향상시킵니다.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

이 논문은 4 점 휨 하중을 받는 철근 콘크리트 보의 비선형 응답을 예측하기 위해 노드 및 요소 수준의 동역학을 결합한 이중 그래프 시공간 GNN 대리 모델을 개발하여, 기존 유한요소해석보다 훨씬 낮은 비용으로 전장 변위, 응력, 소성 변형률 및 반력 이력을 정확히 예측할 수 있음을 보여줍니다.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

이 논문은 노이즈가 포함된 선호도 데이터에서 기존 DPO 의 한계를 극복하기 위해, 외부 보상 모델 없이 DPO 학습 중 내재된 신호를 활용해 하드 노이즈와 애매한 비교를 각각 데이터 수준과 그래디언트 수준에서 계층적으로 보정하는 'wDPO'를 제안하고, 이를 통해 다양한 안전성 벤치마크에서 향상된 정렬 품질과 강건성을 입증합니다.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

이 논문은 SonicGuard 센서와 에너지 기반 이벤트 탐지 알고리즘 및 Audio Spectrogram Transformer 모델을 결합하여 장음 패턴을 자동 분할 및 분류하는 시스템을 개발함으로써, 수동 검사의 한계를 극복하고 위장관 기능 평가에 객관적이고 정량적인 진단 도구를 제공한다는 것을 보여줍니다.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

이 논문은 충분히 큰 마진이 선형 구조 없이도 삼각부등식만으로 학습 가능성을 보장하며, 마진 임계값을 기준으로 모든 거리 공간에서의 학습 가능성이 결정되고, 반스 공간에서의 학습 복잡도가 마진 크기에 따라 다항적으로 스케일링된다는 사실을 규명합니다.

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

이 논문은 금융 도메인 특화 데이터의 품질과 난이도/검증 가능성 프로파일이 모델 성능을 결정한다는 점을 실증적으로 입증하고, 고품질 CoT 증류와 난이도 인식 샘플링을 통해 구축한 ODA-Fin-RL-8B 모델이 동급 오픈소스 금융 LLM 들을 능가하는 성능을 보인다고 주장합니다.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

이 논문은 메모리, 지연 시간 및 데이터 제약이 엄격한 임상 환경에서 트랜스포머 기반 모델에 버금가는 정확도를 유지하면서도 파라미터와 연산량을 극도로 줄인 'LightMedSeg'라는 경량 3D 의료 영상 분할 아키텍처를 제안합니다.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

이 논문은 심층 조건부 변환 모델 (DCTM) 과 크로스 피팅을 활용하여 연속 및 이산 순서형 결과 변수에 대해 조건부 순위-순위 회귀 (CRRR) 를 개선하고, 이를 통해 미국 소득과 인도 교육 이동성 분석에서 그룹 내 이동성을 정밀하게 측정하는 새로운 방법론을 제시합니다.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

이 논문은 유전자 교란에 대한 세포 반응 예측의 일반화 한계를 극복하기 위해, 세포 유형을 인식하고 미분 가능한 두 단계 검색 메커니즘을 도입한 새로운 프레임워크인 PT-RAG 를 제안하며, 이를 통해 기존 방법론보다 우수한 성능을 입증했습니다.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

이 논문은 검색 엔진의 인덱싱 구조와 에이전트의 추론 간 불일치를 해결하기 위해, 검색 공간의 구조적 특성을 반영하고 few-shot 프로빙을 통해 동적으로 서브-목표를 재보정하는 'WeDas'라는 웹 콘텐츠 분포 인식 프레임워크를 제안합니다.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

이 논문은 대만 지역 폐암 생존자의 소규모 데이터와 미국 SEER 공개 데이터의 이질적 특성을 고려하여, 데이터 공유 없이 손실 함수 융합을 기반으로 한 수평 연동 학습 (LF2L) 프레임워크를 제안함으로써 2 차 원발성 암 예측 성능을 획기적으로 향상시켰음을 보여줍니다.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

이 논문은 혼란스러운 시계열 데이터에서 투명하고 해석 가능한 대수 방정식을 학습하여 예측 정확도를 유지하면서도 블랙박스 모델의 한계를 극복하는 두 가지 상징적 기계학습 방법 (SyNF 와 SyTF) 을 제안하고 다양한 벤치마크 및 실제 사례를 통해 그 유효성을 입증합니다.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

← 이전 다음 →