Markovian Generation Chains in Large Language Models
이 논문은 대규모 언어 모델이 이전 출력을 기반으로 반복적으로 텍스트를 생성하는 '마르코프 생성 사슬' 과정을 분석하여, 온도 파라미터와 초기 입력에 따라 문장 다양성이 증가하거나 감소할 수 있음을 규명하고 다중 에이전트 시스템에 대한 시사점을 제시합니다.
3797 편의 논문
이 논문은 대규모 언어 모델이 이전 출력을 기반으로 반복적으로 텍스트를 생성하는 '마르코프 생성 사슬' 과정을 분석하여, 온도 파라미터와 초기 입력에 따라 문장 다양성이 증가하거나 감소할 수 있음을 규명하고 다중 에이전트 시스템에 대한 시사점을 제시합니다.
이 논문은 희귀 사건에 대한 신뢰할 수 있는 예측 분포를 제공하기 위해 기본 예측 모델을 보정하는 진단 운송 맵 (diagnostic transport maps) 을 제안하고, 이를 허리케인 강도 예측에 적용하여 기존 운영 예보보다 우수한 성능을 입증했습니다.
이 논문은 웨어러블 생체 신호와 모바일 앱을 활용하여 일상 활동 중 노인의 기분 상태를 실시간으로 모니터링하고 머신러닝 기반 분류기를 통해 행복감과 활동성 같은 기분 상태를 정확하게 예측하는 지능형 시스템을 제안합니다.
이 논문은 XLS-R 모델의 초기 레이어를 활용하여 결핵 환자의 기침 구간을 고정밀도로 자동 탐지함으로써 스마트폰 기반의 확장 가능한 결핵 선별 도구 개발의 실현 가능성을 입증했습니다.
이 논문은 단일 세포 유전자 발현 생성 모델의 평가 기준 부재 문제를 해결하기 위해, 일관된 메트릭 구현과 생물학적 기반 평가를 가능하게 하는 오픈소스 파이썬 프레임워크인 GGE 를 제안합니다.
본 논문은 통계 열역학 기반의 이산 열역학 상태 열거와 마스킹 소프트맥스 집계, 그리고 스트레이트-스루 기울기 추정기를 결합하여 훈련 및 추론 단계에서 열역학적 일관성을 보장하는 미분 가능한 상평형 계산 알고리즘 'DISCOMAX'를 제안하고, 이를 통해 액체 - 액체 상평형 데이터에 대한 기존 방법보다 우수한 성능을 입증했습니다.
이 논문은 Klinkenberg 모델의 비선형성을 Hopf-Cole 변환을 통해 선형화하고 공유 트렁크 신경망과 DeepLS 솔버를 결합하여 다공성 매체 내 가스 흐름을 정밀하게 모델링하고 역산정을 수행하는 통합 프레임워크를 제안합니다.
이 논문은 단일 도메인 데이터로 학습된 모델에서 발생하는 '도메인 민감도 붕괴 (DSC)' 문제를 해결하기 위해, 추론 시 오버헤드 없이 DINOv2 기반의 교사 모델을 통해 잔차 구조를 증류하는 '교사 유도 학습 (TGT)'을 제안하여 원치 않는 분포 (OOD) 탐지 성능을 획기적으로 개선함을 보여줍니다.
이 논문은 ASR 서비스의 부하 변동 상황에서 오디오 길이를 처리 시간의 정확한 지표로 활용하여 vLLM 에 SJF 와 HRRN 스케줄링을 적용함으로써, FCFS 방식 대비 중위수 지연을 획기적으로 줄이면서도 기아 현상을 완화하고 처리량 저하 없이 지연 시간을 효과적으로 최적화하는 방법을 제시합니다.
이 논문은 교차검증 기반 정규화 과정의 확률적 특성을 탐험의 원천으로 활용하여 블랙박스 추정기에서도 효과적으로 작동하는 'RIE-Greedy' 알고리즘을 제안하고, 이것이 이론적으로 톰슨 샘플링과 동등하며 실전 환경에서 기존 방법들보다 우수한 성능을 보임을 입증합니다.
이 논문은 생물학적 이미징의 희소하고 불규칙한 시공간 점 과정 데이터를 평가하기 위해 '단일 분자 국소화 현미경 챌린지 (SMLM-C)' 벤치마크를 제안하고, 상태 공간 모델이 시간적 단절이 심한 깜빡임 역학을 모델링하는 데 있어 근본적인 한계를 보임을 규명했습니다.
이 논문은 이질적인 도메인 간 분포 변화에 강인한 최악의 경우 저랭크 근사를 위한 통합 프레임워크인 wcPCA 를 제안하고, 이를 다양한 목적 함수와 행렬 완성 문제로 확장하여 이론적 최적성과 실증적 성능 개선을 입증합니다.
이 논문은 각 클라이언트의 로컬 학습 데이터 통계 (PCA) 를 기반으로 단일 글로벌 모델을 조건화하여, 추가 통신 없이도 데이터 희소성과 다차원 이질성 환경에서 오라클 기준을 능가하는 성능을 달성하는 새로운 연방 학습 방법을 제안합니다.
본 논문은 무한 분산을 가진 중꼬리 (heavy-tailed) 데이터에서도 유효한 로그 손실 함수를 기반으로 한 새로운 주성분 분석 (PCA) 프레임워크를 제안하여, 기존 PCA 의 한계를 극복하고 중꼬리 및 충격성 잡음 환경에서 우수한 성능을 입증합니다.
이 논문은 임상에서 흔히 사용되는 가중 MRI 데이터로 사전 학습된 딥러닝 기반 잡음 제거 모델을 활용하여, 정량적 MRI 데이터의 부족 문제를 해결하고 압축 샘플링 아티팩트를 효과적으로 보정하는 새로운 재구성 프레임워크 'MRI2Qmap'을 제안합니다.
이 논문은 스코어 함수의 L^p 오차가 매우 작더라도 고차원 공간에서 랑베빈 역학이 목표 분포와 TV 거리가 먼 분포를 생성할 수 있음을 보여줌으로써, 실제 데이터 기반 학습 시 확산 모델이 랑베빈 역학보다 우월함을 입증합니다.
이 논문은 희소 보상 환경에서 GRPO 의 한계를 극복하고 점진적으로 교사의 신호를 제거하여 편향 없는 온-폴리시 그라디언트를 회복하는 'Thompson 샘플링 기반 게이트'와 'Synthetic Success Injection'을 활용한 Hindsight-Anchored Policy Optimization(HAPO) 을 제안합니다.
이 논문은 과거 에피소드에서 생성된 명시적 자기 성찰을 컨텍스트로 활용하여 에이전트 검색 전략을 학습하고 테스트 시간 탐색을 개선하는 메타 강화 학습 프레임워크인 MR-Search 를 제안하며, 다양한 벤치마크에서 기존 RL 기반 방법보다 뛰어난 일반화 성능과 9.2%~19.3% 의 상대적 개선을 입증합니다.
이 논문은 시스템 생물학 사례 연구를 통해 희소 회귀 기반 동역학 식 학습에서 다중공선성으로 인한 수치적 불안정성 문제를 분석하고, 데이터 분포와 일치하는 직교 다항식 기저를 사용할 때 모델 복원 정확도가 향상됨을 보여줍니다.
이 논문은 주입된 프롬프트의 길이에 따라 대형 언어 모델의 재일바이트 공격 성공률이 다항식적 성장에서 지수적 성장으로 전환되는 현상을 스핀 글라스 이론을 통해 설명하고, 긴 프롬프트가 강력한 자기장 역할을 하여 모델 내의 적대적 질서를 강화함을 이론적·실험적으로 증명합니다.