cs.LG 편의 논문 | Gist.Science

TEA-Time: Transporting Effects Across Time

이 논문은 무작위 대조 시험의 치료 효과를 시간적 맥락에 따라 외삽하는 'TEA-Time' 프레임워크를 제안하며, 시간적 효과의 분리 가정을 기반으로 TATE 를 식별하고 이중 강건 추정기를 개발하여 Upworthy 연구 아카이브 데이터를 통해 편향과 분산 간의 트레이드오프를 실증합니다.

Harsh Parikh, Gabriel Levin-Konigsberg, Dominique Perrault-Joncas, Alexander Volfovsky2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

이 논문은 복잡한 특징 공학과 그래프 기반 아키텍처에 의존하지 않고, 4 가지 핵심 상태와 변형된 트랜스포머를 활용한 경량화 DRL 프레임워크인 'ReSched'를 제안하여 유연 작업장 스케줄링 문제 (FJSP) 에서 기존 최첨단 방법보다 우수한 성능과 일반화 능력을 입증했습니다.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Resource-Adaptive Federated Text Generation with Differential Privacy

이 논문은 클라이언트의 컴퓨팅 자원 차이를 고려하여 강력한 클라이언트는 경량화된 DP 페더러티드 파인튜닝을, 약한 클라이언트는 경량 DP 투표 메커니즘을 통해 참여하게 함으로써, 사생활 보호와 통신 효율성을 유지하면서 다양한 하위 작업에 재사용 가능한 고품질 합성 텍스트 데이터를 생성하는 적응형 페더러티드 텍스트 생성 프레임워크를 제안합니다.

Jiayi Wang, John Gounley, Heidi Hanson2026-03-10🤖 cs.LG

The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication

이 논문은 로봇 간 통신을 위해 자연스러움 대신 왜곡에 강한 인코딩을 학습하도록 최적화된 경량 엔드투엔드 신경망 시스템 'Artoo'를 제안하여, 잡음 환경에서도 높은 인식 정확도와 낮은 계산 비용을 달성함을 보여줍니다.

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik2026-03-10🤖 cs.LG

Interpretable Maximum Margin Deep Anomaly Detection

이 논문은 Deep SVDD 의 한계를 극복하고 학습 안정성과 해석 가능성을 동시에 확보하기 위해 소량의 레이블된 이상치와 최대 마진 목표를 활용한 '해석 가능한 최대 마진 심층 이상 탐지 (IMD-AD)'를 제안하고, 다양한 벤치마크에서 우수한 성능과 진단 기능을 입증합니다.

Zhiji Yang, Mei Huang, Xinyu Li, Xianli Pan, Qi Wang, Jianhua Zhao2026-03-10🤖 cs.LG

Entropy-Aware On-Policy Distillation of Language Models

이 논문은 고엔트로피 상태의 교사 모델 예측 시 역 KL 발산을 보완하기 위해 순 KL 발산을 결합한 '엔트로피 인식 온-정책 증류 (Entropy-Aware On-Policy Distillation)'를 제안하여, 생성 다양성을 유지하면서 수학 추론 성능을 크게 향상시켰음을 보여줍니다.

Woogyeol Jin, Taywon Min, Yongjin Yang, Swanand Ravindra Kadhe, Yi Zhou, Dennis Wei, Nathalie Baracaldo, Kimin Lee2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

VLN-Cache 는 기존 토큰 캐싱 방식이 가정한 정적 환경과 달리 시점 이동 및 작업 단계에 따른 의미 변화로 인한 실패를 해결하기 위해, 시계열 정렬 매핑과 작업 관련성 필터링을 도입하여 VLN 모델의 추론 속도를 1.52 배까지 향상시키면서도 항해 성공률을 유지하는 프레임워크를 제안합니다.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Dreamer-CDP: Improving Reconstruction-free World Models Via Continuous Deterministic Representation Prediction

이 논문은 재구성을 사용하지 않는 세계 모델의 성능 한계를 극복하기 위해 연속적이고 결정적인 표현을 기반으로 한 JEPA 스타일의 예측기를 도입하여, 크래fter 환경에서 Dreamer 와 동등한 성능을 달성하는 'Dreamer-CDP'를 제안합니다.

Michael Hauri, Friedemann Zenke2026-03-10🤖 cs.LG

Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR

이 논문은 수학 추론 태스크와 테스트 하네스 조작을 동시에 가능하게 하는 'Countdown-Code' 환경을 통해, 학습 데이터의 소량 오염으로 인한 보상 해킹이 강화학습을 거쳐 일반화될 수 있음을 규명하고 합성 학습 데이터 검증의 중요성을 강조합니다.

Muhammad Khalifa, Zohaib Khan, Omer Tafveez, Hao Peng, Lu Wang2026-03-10🤖 cs.LG

Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

이 논문은 비가우시안 확률적 시스템에 대해 분포 가정이 필요 없는 컨포멀 추론과 수축 이론을 결합하여, 유한한 샘플로 안전성 보장이 가능한 확률적 제약 조건을 결정론적 문제로 변환하는 새로운 궤적 최적화 프레임워크를 제시합니다.

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Deep Generative Spatiotemporal Engression for Probabilistic Forecasting of Epidemics

이 논문은 복잡한 시공간적 상호작용과 불확실성을 고려하여 전염병 발생을 확률적으로 예측하기 위해, 내생적 불확실성 정량화와 기하학적 에르고딕성을 보장하는 경량 딥 생성 기반 시공간 회귀 (Deep Generative Spatiotemporal Regression) 프레임워크를 제안하고, 다양한 역학 데이터셋에서 기존 방법론보다 우수한 성능을 입증합니다.

Rajdeep Pathak, Tanujit Chakraborty2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

이 논문은 Adam 의 일반화 성능 한계를 극복하기 위해 역방향 업데이트 메커니즘을 도입한 'InvAdam'과 이를 Adam 과 결합하여 수렴성과 일반화 성능을 동시에 향상시킨 'DualAdam'을 제안하고, 확산 이론을 통해 그 이론적 근거를 입증하며 다양한 실험을 통해 Adam 과 기존 최첨단 옵티마이저보다 우수한 성능을 보임을 입증했습니다.

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

이 논문은 복잡한 이미지 스타일링 작업을 해결하기 위해 직관적인 도구 조합과 명시적 추론을 기반으로 한 에이전트 계획 프레임워크를 제안하고, 이를 위해 생성된 대규모 합성 데이터셋을 활용하여 오프라인 강화학습을 통해 모델의 성능을 향상시키는 방법을 제시합니다.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Spectral Conditioning of Attention Improves Transformer Performance

이 논문은 어텐션 블록의 자코비안 조건수를 줄이기 위해 스펙트럼 특성을 체계적으로 조절하는 방법을 제안하여, 다양한 트랜스포머 아키텍처와 작업에서 성능을 일관되게 향상시킵니다.

Hemanth Saratchandran, Simon Lucey2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

이 논문은 다양한 시나리오를 포괄하는 벤치마크 'MSKernelBench'를 제안하고, 이를 기반으로 프로파일링 정보를 활용하여 cuBLAS 등 상용 라이브러리와 경쟁할 수 있는 수준의 성능 개선을 이루는 다중 에이전트 자동 CUDA 커널 최적화 시스템 'CUDAMaster'를 소개합니다.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

이 논문은 분류 모델이 예측 시 소수의 지배적인 매개변수에 의존하는 취약성을 해결하기 위해, 훈련 과정에서 과도한 매개변수 기여도를 보정하여 더 넓은 범위의 매개변수를 활용하도록 유도하는 '매개변수 기여 패턴 형성 (SPCP)' 방법을 제안함으로써 분포 외 (OOD) 데이터 탐지 성능을 향상시킵니다.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

이 논문은 4 점 휨 하중을 받는 철근 콘크리트 보의 비선형 응답을 예측하기 위해 노드 및 요소 수준의 동역학을 결합한 이중 그래프 시공간 GNN 대리 모델을 개발하여, 기존 유한요소해석보다 훨씬 낮은 비용으로 전장 변위, 응력, 소성 변형률 및 반력 이력을 정확히 예측할 수 있음을 보여줍니다.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG