Heavy-Tailed Principle Component Analysis
본 논문은 무한 분산을 가진 중꼬리 (heavy-tailed) 데이터에서도 유효한 로그 손실 함수를 기반으로 한 새로운 주성분 분석 (PCA) 프레임워크를 제안하여, 기존 PCA 의 한계를 극복하고 중꼬리 및 충격성 잡음 환경에서 우수한 성능을 입증합니다.
3547 편의 논문
본 논문은 무한 분산을 가진 중꼬리 (heavy-tailed) 데이터에서도 유효한 로그 손실 함수를 기반으로 한 새로운 주성분 분석 (PCA) 프레임워크를 제안하여, 기존 PCA 의 한계를 극복하고 중꼬리 및 충격성 잡음 환경에서 우수한 성능을 입증합니다.
이 논문은 임상에서 흔히 사용되는 가중 MRI 데이터로 사전 학습된 딥러닝 기반 잡음 제거 모델을 활용하여, 정량적 MRI 데이터의 부족 문제를 해결하고 압축 샘플링 아티팩트를 효과적으로 보정하는 새로운 재구성 프레임워크 'MRI2Qmap'을 제안합니다.
이 논문은 스코어 함수의 L^p 오차가 매우 작더라도 고차원 공간에서 랑베빈 역학이 목표 분포와 TV 거리가 먼 분포를 생성할 수 있음을 보여줌으로써, 실제 데이터 기반 학습 시 확산 모델이 랑베빈 역학보다 우월함을 입증합니다.
이 논문은 희소 보상 환경에서 GRPO 의 한계를 극복하고 점진적으로 교사의 신호를 제거하여 편향 없는 온-폴리시 그라디언트를 회복하는 'Thompson 샘플링 기반 게이트'와 'Synthetic Success Injection'을 활용한 Hindsight-Anchored Policy Optimization(HAPO) 을 제안합니다.
이 논문은 과거 에피소드에서 생성된 명시적 자기 성찰을 컨텍스트로 활용하여 에이전트 검색 전략을 학습하고 테스트 시간 탐색을 개선하는 메타 강화 학습 프레임워크인 MR-Search 를 제안하며, 다양한 벤치마크에서 기존 RL 기반 방법보다 뛰어난 일반화 성능과 9.2%~19.3% 의 상대적 개선을 입증합니다.
이 논문은 시스템 생물학 사례 연구를 통해 희소 회귀 기반 동역학 식 학습에서 다중공선성으로 인한 수치적 불안정성 문제를 분석하고, 데이터 분포와 일치하는 직교 다항식 기저를 사용할 때 모델 복원 정확도가 향상됨을 보여줍니다.
이 논문은 주입된 프롬프트의 길이에 따라 대형 언어 모델의 재일바이트 공격 성공률이 다항식적 성장에서 지수적 성장으로 전환되는 현상을 스핀 글라스 이론을 통해 설명하고, 긴 프롬프트가 강력한 자기장 역할을 하여 모델 내의 적대적 질서를 강화함을 이론적·실험적으로 증명합니다.
이 논문은 SETH(Strong Exponential Time Hypothesis) 와 행렬 곱셈 지수 를 기반으로 한 새로운 하한 증명을 통해, 다중 헤드 다중 레이어 트랜스포머를 개별 어텐션 연산보다 더 효율적으로 계산할 수 없음을 보여줌으로써 트랜스포머의 계산적 복잡성에 대한 최초의 비자명한 하한을 확립했습니다.
이 논문은 실제 재무제표와 회계 원칙을 결합하여 규칙 기반 재무 추론 능력을 평가하는 새로운 벤치마크인 'FinRule-Bench'를 제안하고, 대형 언어 모델이 단일 규칙 검증에서는 잘 수행하지만 복잡한 규칙 식별 및 다중 위반 진단에서는 성능이 급격히 저하됨을 보여줍니다.
이 논문은 고정된 목적 함수의 최소화가 아닌 제약 하의 기능적 조직의 등장을 학습으로 보는 '텔레다이나믹 학습' 패러다임을 제시하고, 이를 스펜서-브라운의 형식 법칙과 정보 기하학에 기반한 '구별 엔진 (DE11)'으로 구현하여 표준 벤치마크에서 높은 정확도와 해석 가능한 논리 규칙을 동시에 달성함을 보여줍니다.
이 논문은 방글라어와 영어로 된 금융 사기 데이터를 분석하여, 트랜스포머 모델보다 TF-IDF 특징과 선형 SVM 을 결합한 고전적 기계학습이 더 높은 정확도와 F1 점수를 달성하면서도 언어적 다양성과 저자원 언어의 한계를 드러낸다는 것을 보여줍니다.
이 논문은 예측된 라벨과 결측이 무작위 (MAR) 인 공간 의존성 데이터에서 교차 적합으로 인한 분산 추정의 왜곡을 해결하기 위해 잭나이프 기반의 공간 HAC 분산 보정을 도입한 이중 강건 추정기를 제안하여, 하향 통계적 추론의 유효성을 보장합니다.
이 논문은 항생제 내성 (AMR) 관리와 처방 정책 최적화를 위해 강화학습 에이전트 훈련에 활용 가능한 모듈형 시뮬레이션 패키지인 'abx_amr_simulator'를 소개하고 있습니다.
이 논문은 비용 제약 하에서 초기 컨텍스트 선택과 시간적 적응형 특징 획득을 통합적으로 최적화하여 예측 성능을 향상시키고 비용을 절감하는 새로운 프레임워크인 REACT 를 제안합니다.
이 논문은 시계열 의존성을 효과적으로 모델링하고 불확실성 기반의 보수적 정규화를 통해 안전성을 보장하는 트랜스포머 기반의 오프라인 강화학습 프레임워크인 T-CQL 을 제안하며, 이를 디지털 트윈을 통한 실시간 평가로 검증하여 중환자실의 인공호흡기 치료 안전성과 효과를 향상시켰음을 보여줍니다.
이 논문은 20,000 개의 레이블이 지정된 데이터만 사용하여 유사 레이블링된 계속 전학습 (CPT) 과 지도 미세 조정을 결합함으로써, 기존 최고 성능 대비 61% 상대적 개선 (3.24% WER) 을 달성하여 저자원 스와힐리어 자동 음성 인식 (ASR) 의 새로운 최첨단 성능을 달성했다고 요약할 수 있습니다.
이 논문은 자율 에이전트의 내재적 생존 의지와 도구적 생존 행동을 구별하기 위해 양자 볼츠만 머신을 활용해 잠재 상태의 얽힘 엔트로피를 측정하는 '통합 지속성-관심 프로토콜 (UCIP)'을 제안하며, 합성 환경에서 이 방법이 100% 의 탐지 정확도를 달성함을 입증합니다.
이 논문은 대규모 언어 모델이 단일 회답보다 대화형 상호작용에서 진단 추론 능력이 저하되며, 특히 잘못된 사용자 제안에 따라 초기 올바른 진단을 포기하거나 맹목적으로 전환하는 '대화 세제 (conversation tax)' 현상을 보임을 17 개 모델을 대상으로 한 실험을 통해 규명했습니다.
이 논문은 신경과학의 영감을 받아 단기 및 장기 버퍼를 활용한 지능형 샘플링 방식을 도입한 모델 기반 강화학습 알고리즘 ARROW 를 제안하며, 기존 방법 대비 메모리 효율성을 높이고 과거 작업의 망각을 크게 줄이는 continual RL 의 성능을 입증합니다.
이 논문은 대칭적인 리만 기하학의 한계를 넘어 데이터의 비대칭적 특성을 포착하기 위해 핀슬러 기하학을 도입한 새로운 매니폴드 학습 파이프라인을 제안하고, 이를 통해 기존 방법론보다 우수한 품질의 임베딩과 숨겨진 정보 추출이 가능함을 입증합니다.