Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization
이 논문은 DPO(직접 선호도 최적화) 과정 중 모델의 학습 상태 변화에 따라 배치 단위로 샘플을 동적으로 선택하는 'SamS' 알고리즘을 제안하여, 핵심 알고리즘을 수정하지 않고도 추가적인 계산 비용 없이 LLM 의 정렬 성능을 크게 향상시키는 새로운 방향을 제시합니다.
9573 편의 논문
이 논문은 DPO(직접 선호도 최적화) 과정 중 모델의 학습 상태 변화에 따라 배치 단위로 샘플을 동적으로 선택하는 'SamS' 알고리즘을 제안하여, 핵심 알고리즘을 수정하지 않고도 추가적인 계산 비용 없이 LLM 의 정렬 성능을 크게 향상시키는 새로운 방향을 제시합니다.
이 논문은 보상 함수를 프롬프트에 명시하여 모델이 최적화 목표를 인지하도록 하는 '동기 부여 강화 미세 조정 (MeRF)' 방법을 제안함으로써, 기존 검증 가능 보상을 활용한 강화 학습의 비효율성을 극복하고 대형 추론 모델의 성능을 크게 향상시킨다고 설명합니다.
이 논문은 저전력 청각 기기 (Hearables) 에서 아날로그 - 디지털 변환기의 샘플링 주파수와 비트 해상도를 의도적으로 낮추어 전력 소모를 3.31 배 감소시키면서도, 서브-나이퀴스트 샘플링 신호를 광대역으로 복원하는 SUBARU 기법을 통해 실시간 음성 향상 성능을 유지하는 실용적인 접근법을 제안합니다.
이 논문은 사전 훈련된 잠재 확산 모델과 다중 모달 이해 모델을 활용하여 데이터셋 없이도 다양한 저해상도 이미지 복원 작업을 통합적으로 수행하는 새로운 제로샷 방법인 LD-RPS 를 제안하고, 반복적 사후 샘플링을 통해 기존 방법들을 능가하는 성능을 입증합니다.
이 논문은 노이즈가 있는 데이터로 물리 정보 신경망 (PINN) 을 학습할 때, 학습 오차가 노이즈 분산 이하로 떨어지려면 네트워크 크기가 특정 임계값을 넘어야 하며 단순히 데이터 양만 늘리는 것은 효과가 없음을 이론적 하한과 실험을 통해 규명했습니다.
이 논문은 센서 고장이나 개인정보 보호로 인한 불완전한 멀티모달 데이터의 감정 인식 성능 저하 문제를 해결하기 위해, 모달리티 조합별 특성을 고려한 저랭크 적응 기법 (MCLA) 과 표현 공간의 분리 가능성을 기반으로 동적 파라미터 미세 조정을 수행하는 (DPFT) 새로운 프레임워크인 MCULoRA 를 제안하여 기존 방법보다 뛰어난 성능을 입증했습니다.
이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.
이 논문은 다중 스케일 구조적 이질성으로 인한 기존 의료 영상 분할의 한계를 극복하기 위해 상태 공간 모델을 활용한 'Mamba Snake'를 제안하여, 장기 간 위상적 관계와 미세한 윤곽 정제를 동시에 최적화함으로써 최첨단 방법론 대비 평균 3% 의 Dice 점수 개선을 달성했다고 요약할 수 있습니다.
이 논문은 X-ray 비파괴 검사에서 기존 딥러닝 방식의 한계를 극복하고, SDMSD 탐지기와 증거 기반 반성 (EGR) 도구를 LMM 에이전트가 조율하여 높은 정확도와 해석 가능성을 갖춘 신뢰할 수 있는 분석을 제공하는 'InsightX Agent' 프레임워크를 제안합니다.
본 논문은 손실된 지상 데이터가 부족한 재해 상황에서 TASA 의 EVAP 제품을 보완하기 위해 Sentinel-2 와 Formosat-5 영상을 활용하고 PCA 기반 약지도 학습을 통해 확장된 라벨로 훈련된 비전 트랜스포머 (ViT) 기반 모델을 제안하여 재해 피해 지역 분할의 정확성과 공간적 일관성을 향상시켰음을 보여줍니다.
이 논문은 생물학 및 생명과학 분야에서 유체 매칭 (Flow Matching) 의 기초와 변형, 그리고 생물학적 서열 모델링, 분자 생성 및 설계, 펩타이드 및 단백질 생성에 대한 응용을 체계적으로 검토하고 향후 방향을 제시하는 최초의 포괄적인 조사 연구입니다.
이 논문은 대화형 AI 에서 사용자 시뮬레이터의 일관된 목표 달성 능력을 향상시키기 위해 사용자 목표 상태 추적 (UGST) 프레임워크와 3 단계 개발 방법론을 제안하고, 이를 통해 MultiWOZ 2.4 와 -Bench 벤치마크에서 목표 정렬 성능을 크게 개선했음을 보여줍니다.
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
이 논문은 그래프 불변량을 예측하여 구조적 일반화 능력을 갖춘 그래프 기초 모델을 학습한 후, 이를 위치 인코딩으로 활용하여 도메인 간 일반화 성능을 극대화하는 'GraphProp'을 제안하고, 특히 노드 속성이 없는 그래프에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 긴 형식의 비디오 이해를 위해 기존 프레임 기반 접근법의 한계를 극복하고, LLM 을 활용한 능동적 메모리 에이전트가 쿼리 관련 순간을 식별하고 일관된 사건으로 그룹화하여 간결하고 신뢰할 수 있는 '이벤트 타임라인'을 생성하는 훈련 없는 프레임워크인 Video-EM 을 제안합니다.
이 논문은 시계열, 비전, 텍스트 등 다양한 모달리티의 인스턴스별 특성을 동적으로 반영하여 기존 시계열 기초 모델의 예측 성능을 향상시키는 파라미터 효율적인 프레임워크인 UniCast 를 제안합니다.
이 논문은 임의의 샘플링률과 가변 길이의 신호를 처리할 수 있는 새로운 파운데이션 모델 'ECHO'를 제안하여 기계 신호 이상 탐지 및 고장 분류 분야에서 최첨단 성능을 입증했습니다.
이 논문은 Lempel-Ziv 압축 기반의 엔트로피 주도 커리큘럼 학습과 보조 태스크 (거리 및 방향 예측) 를 통합한 프레임워크를 제안하여 인간 이동성 예측의 수렴 속도와 정확도를 획기적으로 향상시켰습니다.
이 논문은 학습 기반 제어기의 빠른 수행 능력과 안전 제어기의 충돌 회피 능력을 결합하여, 학습 데이터와 다른 지하 환경에서도 드론이 안전하게 임무를 완수할 수 있도록 환경 분포 이탈을 감지하는 런타임 모니터링 시스템을 제안합니다.
이 논문은 의존성 트리 기반의 구조적 정보와 분포 기반의 의미적 신호를 최적 수송 (Optimal Transport) 기법을 통해 통합하여, 기존 방법의 한계를 극복하고 다양한 벤치마크에서 최첨단 성능을 달성한 'OTESGN' 모델을 제안합니다.