cs.LG 편의 논문 | Gist.Science

Heavy-Tailed Principle Component Analysis

본 논문은 무한 분산을 가진 중꼬리 (heavy-tailed) 데이터에서도 유효한 로그 손실 함수를 기반으로 한 새로운 주성분 분석 (PCA) 프레임워크를 제안하여, 기존 PCA 의 한계를 극복하고 중꼬리 및 충격성 잡음 환경에서 우수한 성능을 입증합니다.

Mario Sayde, Christopher Khater, Jihad Fahs, Ibrahim Abou-Faycal2026-03-13🤖 cs.LG

MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors

이 논문은 임상에서 흔히 사용되는 가중 MRI 데이터로 사전 학습된 딥러닝 기반 잡음 제거 모델을 활용하여, 정량적 MRI 데이터의 부족 문제를 해결하고 압축 샘플링 아티팩트를 효과적으로 보정하는 새로운 재구성 프레임워크 'MRI2Qmap'을 제안합니다.

Mohammad Golbabaee, Matteo Cencini, Carolin Pirkl, Marion Menzel, Michela Tosetti, Bjoern Menze2026-03-13🔬 physics

On the Robustness of Langevin Dynamics to Score Function Error

이 논문은 스코어 함수의 L^p 오차가 매우 작더라도 고차원 공간에서 랑베빈 역학이 목표 분포와 TV 거리가 먼 분포를 생성할 수 있음을 보여줌으로써, 실제 데이터 기반 학습 시 확산 모델이 랑베빈 역학보다 우월함을 입증합니다.

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen Wu2026-03-13🤖 cs.LG

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

이 논문은 희소 보상 환경에서 GRPO 의 한계를 극복하고 점진적으로 교사의 신호를 제거하여 편향 없는 온-폴리시 그라디언트를 회복하는 'Thompson 샘플링 기반 게이트'와 'Synthetic Success Injection'을 활용한 Hindsight-Anchored Policy Optimization(HAPO) 을 제안합니다.

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

이 논문은 과거 에피소드에서 생성된 명시적 자기 성찰을 컨텍스트로 활용하여 에이전트 검색 전략을 학습하고 테스트 시간 탐색을 개선하는 메타 강화 학습 프레임워크인 MR-Search 를 제안하며, 다양한 벤치마크에서 기존 RL 기반 방법보다 뛰어난 일반화 성능과 9.2%~19.3% 의 상대적 개선을 입증합니다.

Teng Xiao, Yige Yuan, Hamish Ivison, Huaisheng Zhu, Faeze Brahman, Nathan Lambert, Pradeep Dasigi, Noah A. Smith, Hannaneh Hajishirzi2026-03-13🤖 cs.LG

Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study

이 논문은 시스템 생물학 사례 연구를 통해 희소 회귀 기반 동역학 식 학습에서 다중공선성으로 인한 수치적 불안정성 문제를 분석하고, 데이터 분포와 일치하는 직교 다항식 기저를 사용할 때 모델 복원 정확도가 향상됨을 보여줍니다.

Yuxiang Feng, Niall M Mangan, Manu Jayadharan2026-03-13🧬 q-bio

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

이 논문은 주입된 프롬프트의 길이에 따라 대형 언어 모델의 재일바이트 공격 성공률이 다항식적 성장에서 지수적 성장으로 전환되는 현상을 스핀 글라스 이론을 통해 설명하고, 긴 프롬프트가 강력한 자기장 역할을 하여 모델 내의 적대적 질서를 강화함을 이론적·실험적으로 증명합니다.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

On the Computational Hardness of Transformers

이 논문은 SETH(Strong Exponential Time Hypothesis) 와 행렬 곱셈 지수 $\omega$ 를 기반으로 한 새로운 하한 증명을 통해, 다중 헤드 다중 레이어 트랜스포머를 개별 어텐션 연산보다 더 효율적으로 계산할 수 없음을 보여줌으로써 트랜스포머의 계산적 복잡성에 대한 최초의 비자명한 하한을 확립했습니다.

Barna Saha, Yinzhan Xu, Christopher Ye, Hantao Yu2026-03-13🤖 cs.LG

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

이 논문은 실제 재무제표와 회계 원칙을 결합하여 규칙 기반 재무 추론 능력을 평가하는 새로운 벤치마크인 'FinRule-Bench'를 제안하고, 대형 언어 모델이 단일 규칙 검증에서는 잘 수행하지만 복잡한 규칙 식별 및 다중 위반 진단에서는 성능이 급격히 저하됨을 보여줍니다.

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

이 논문은 고정된 목적 함수의 최소화가 아닌 제약 하의 기능적 조직의 등장을 학습으로 보는 '텔레다이나믹 학습' 패러다임을 제시하고, 이를 스펜서-브라운의 형식 법칙과 정보 기하학에 기반한 '구별 엔진 (DE11)'으로 구현하여 표준 벤치마크에서 높은 정확도와 해석 가능한 논리 규칙을 동시에 달성함을 보여줍니다.

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

이 논문은 방글라어와 영어로 된 금융 사기 데이터를 분석하여, 트랜스포머 모델보다 TF-IDF 특징과 선형 SVM 을 결합한 고전적 기계학습이 더 높은 정확도와 F1 점수를 달성하면서도 언어적 다양성과 저자원 언어의 한계를 드러낸다는 것을 보여줍니다.

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan2026-03-13🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

이 논문은 예측된 라벨과 결측이 무작위 (MAR) 인 공간 의존성 데이터에서 교차 적합으로 인한 분산 추정의 왜곡을 해결하기 위해 잭나이프 기반의 공간 HAC 분산 보정을 도입한 이중 강건 추정기를 제안하여, 하향 통계적 추론의 유효성을 보장합니다.

Stephen Salerno, Zhenke Wu, Tyler McCormick2026-03-13📈 econ

abx_amr_simulator: A simulation environment for antibiotic prescribing policy optimization under antimicrobial resistance

이 논문은 항생제 내성 (AMR) 관리와 처방 정책 최적화를 위해 강화학습 에이전트 훈련에 활용 가능한 모듈형 시뮬레이션 패키지인 'abx_amr_simulator'를 소개하고 있습니다.

Joyce Lee, Seth Blumberg2026-03-13🧬 q-bio

Relaxed Efficient Acquisition of Context and Temporal Features

이 논문은 비용 제약 하에서 초기 컨텍스트 선택과 시간적 적응형 특징 획득을 통합적으로 최적화하여 예측 성능을 향상시키고 비용을 절감하는 새로운 프레임워크인 REACT 를 제안합니다.

Yunni Qu (The University of North Carolina at Chapel Hill), Dzung Dinh (The University of North Carolina at Chapel Hill), Grant King (University of Michigan), Whitney Ringwald (University of Minnisota Twin Cities), Bing Cai Kok (The University of North Carolina at Chapel Hill), Kathleen Gates (The University of North Carolina at Chapel Hill), Aiden Wright (University of Michigan), Junier Oliva (The University of North Carolina at Chapel Hill)2026-03-13🤖 cs.LG

← 이전 다음 →

cs.LG