Markovian Generation Chains in Large Language Models

이 논문은 대규모 언어 모델이 이전 출력을 기반으로 반복적으로 텍스트를 생성하는 '마르코프 생성 사슬' 과정을 분석하여, 온도 파라미터와 초기 입력에 따라 문장 다양성이 증가하거나 감소할 수 있음을 규명하고 다중 에이전트 시스템에 대한 시사점을 제시합니다.

Mingmeng Geng, Amr Mohamed, Guokan Shang, Michalis Vazirgiannis, Thierry Poibeau2026-03-13💬 cs.CL

Differentiable Thermodynamic Phase-Equilibria for Machine Learning

본 논문은 통계 열역학 기반의 이산 열역학 상태 열거와 마스킹 소프트맥스 집계, 그리고 스트레이트-스루 기울기 추정기를 결합하여 훈련 및 추론 단계에서 열역학적 일관성을 보장하는 미분 가능한 상평형 계산 알고리즘 'DISCOMAX'를 제안하고, 이를 통해 액체 - 액체 상평형 데이터에 대한 기존 방법보다 우수한 성능을 입증했습니다.

Karim K. Ben Hicham, Moreno Ascani, Jan G. Rittig, Alexander Mitsos2026-03-13🤖 cs.LG

Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

이 논문은 단일 도메인 데이터로 학습된 모델에서 발생하는 '도메인 민감도 붕괴 (DSC)' 문제를 해결하기 위해, 추론 시 오버헤드 없이 DINOv2 기반의 교사 모델을 통해 잔차 구조를 증류하는 '교사 유도 학습 (TGT)'을 제안하여 원치 않는 분포 (OOD) 탐지 성능을 획기적으로 개선함을 보여줍니다.

Hong Yang, Devroop Kar, Qi Yu, Travis Desell, Alex Ororbia2026-03-13🤖 cs.LG

Duration Aware Scheduling for ASR Serving Under Workload Drift

이 논문은 ASR 서비스의 부하 변동 상황에서 오디오 길이를 처리 시간의 정확한 지표로 활용하여 vLLM 에 SJF 와 HRRN 스케줄링을 적용함으로써, FCFS 방식 대비 중위수 지연을 획기적으로 줄이면서도 기아 현상을 완화하고 처리량 저하 없이 지연 시간을 효과적으로 최적화하는 방법을 제시합니다.

Darshan Makwana, Yash Jogi, Harsh Kotta, Aayush Kubba2026-03-13🤖 cs.LG

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

이 논문은 교차검증 기반 정규화 과정의 확률적 특성을 탐험의 원천으로 활용하여 블랙박스 추정기에서도 효과적으로 작동하는 'RIE-Greedy' 알고리즘을 제안하고, 이것이 이론적으로 톰슨 샘플링과 동등하며 실전 환경에서 기존 방법들보다 우수한 성능을 보임을 입증합니다.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. Williams2026-03-13📊 stat

Single molecule localization microscopy challenge: a biologically inspired benchmark for long-sequence modeling

이 논문은 생물학적 이미징의 희소하고 불규칙한 시공간 점 과정 데이터를 평가하기 위해 '단일 분자 국소화 현미경 챌린지 (SMLM-C)' 벤치마크를 제안하고, 상태 공간 모델이 시간적 단절이 심한 깜빡임 역학을 모델링하는 데 있어 근본적인 한계를 보임을 규명했습니다.

Fatemeh Valeh, Monika Farsang, Radu Grosu, Gerhard Schütz2026-03-13🧬 q-bio

MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors

이 논문은 임상에서 흔히 사용되는 가중 MRI 데이터로 사전 학습된 딥러닝 기반 잡음 제거 모델을 활용하여, 정량적 MRI 데이터의 부족 문제를 해결하고 압축 샘플링 아티팩트를 효과적으로 보정하는 새로운 재구성 프레임워크 'MRI2Qmap'을 제안합니다.

Mohammad Golbabaee, Matteo Cencini, Carolin Pirkl, Marion Menzel, Michela Tosetti, Bjoern Menze2026-03-13🔬 physics

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

이 논문은 과거 에피소드에서 생성된 명시적 자기 성찰을 컨텍스트로 활용하여 에이전트 검색 전략을 학습하고 테스트 시간 탐색을 개선하는 메타 강화 학습 프레임워크인 MR-Search 를 제안하며, 다양한 벤치마크에서 기존 RL 기반 방법보다 뛰어난 일반화 성능과 9.2%~19.3% 의 상대적 개선을 입증합니다.

Teng Xiao, Yige Yuan, Hamish Ivison, Huaisheng Zhu, Faeze Brahman, Nathan Lambert, Pradeep Dasigi, Noah A. Smith, Hannaneh Hajishirzi2026-03-13🤖 cs.LG

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

이 논문은 주입된 프롬프트의 길이에 따라 대형 언어 모델의 재일바이트 공격 성공률이 다항식적 성장에서 지수적 성장으로 전환되는 현상을 스핀 글라스 이론을 통해 설명하고, 긴 프롬프트가 강력한 자기장 역할을 하여 모델 내의 적대적 질서를 강화함을 이론적·실험적으로 증명합니다.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG