Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning
이 논문은 시계열 기반 모델의 성능 향상을 위해 기존 방법의 계산적 한계를 극복하고 시간적 의존성을 보존하는 경량 데이터 가치 평가 기법인 LTSV를 제안하며, 인-컨텍스트 파인튜닝을 통해 효율적이고 강력한 데이터 기여도 측정을 가능하게 합니다.
4899 편의 논문
이 논문은 시계열 기반 모델의 성능 향상을 위해 기존 방법의 계산적 한계를 극복하고 시간적 의존성을 보존하는 경량 데이터 가치 평가 기법인 LTSV를 제안하며, 인-컨텍스트 파인튜닝을 통해 효율적이고 강력한 데이터 기여도 측정을 가능하게 합니다.
이 논문은 베어링 건강 상태 분류를 위해 미세 조정 없이 시계열 기반 모델의 인-컨텍스트 학습을 활용하여 다양한 운영 조건에서 효과적으로 작동하는 새로운 방법을 제안합니다.
이 논문은 추론과 학습을 분리하여 비동기 파이프라인을 구축하고, 오프-폴리시 편향 없이 온-폴리시 정확도를 유지하며 NPU 환경에서 기존 RL 프레임워크 대비 3~5 배의 학습 처리량을 달성하는 주기적 비동기 방식을 제안합니다.
본 논문은 EFISH 신호를 기반으로 전기장 분포를 재구성하는 기존 방법의 한계를 극복하고, 함수 간 매핑을 학습하는 새로운 '디코더-딥온넷 (DDON)' 모델이 더 높은 정확도, 일반화 능력 및 불완전한 입력 데이터에 대한 견고성을 제공함을 입증합니다.
이 논문은 교육용 RAG 시스템의 사실적 정확도를 높이기 위해 엔티티 링크링을 통합한 ELERAG 아키텍처를 제안하고, 도메인 특화 데이터셋에서 기존 베이스라인 및 크로스-인코더 기반 방법보다 우수한 성능을 입증했습니다.
본 논문은 계층적 구조 의미 모델링의 부족을 해결하기 위해 구조 인식 의미 증강, 정보 병목 메커니즘, 전문가 적응 라우팅 등을 도입하여 도메인 노이즈와 적대적 공격에 강인한 그래프 기반 모델 SAGFM 을 제안하고, 다양한 분류 작업에서 기존 최첨단 모델보다 뛰어난 성능과 견고성을 입증합니다.
이 논문은 강화학습의 학습 안정성과 효율성을 높이기 위해 샘플 난이도를 기반으로 힌트 비율을 동적으로 조정하고, 일관성 기반 그래디언트 조절과 롤아웃 난이도 사후확률을 활용한 이점 추정을 도입한 'ADHint'라는 새로운 방법을 제안합니다.
이 논문은 사전 정규화 (pre-norm) Transformer 에서 토큰의 크기 팽창으로 인한 실패를 해결하기 위해 임베딩 크기를 고정하고 방향성만 최적화하는 '방향성 텍스트 인버전 (DTI)'을 제안하여, 텍스트 충실도와 개념 간 매끄러운 보간을 동시에 달성합니다.
이 연구는 고밀도 표면 근전도 (HD sEMG) 를 이용한 다자유도 손가락 움직임 해독에서 공간 기술자 (MLD-BFM) 가 기존 시간 영역 특징보다 통계적으로 유의미한 성능 향상을 보이지는 않았으나, 차원 축소 방법보다 공간 해상도를 유지하는 것이 더 중요함을 확인했습니다.
이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.
본 논문은 머신러닝 기반의 파라미터 최적화 기법을 도입하여 비정질 물질의 파동변환 방사형 분포함수 (WT-RDF) 의 진폭 정확도 한계를 극복하고, 기존 머신러닝 모델보다 우수한 성능으로 Ge-Se 및 Ag-Ge-Se 계열의 원자 구조를 정밀하게 재구성하는 'WT-RDF+' 프레임워크를 제안합니다.
이 논문은 경사 하강법 시 활성화 업데이트의 이상적인 방향과 실제 간의 불일치를 규명하고, 이를 해결하기 위해 기존 정규화 기법을 재해석하거나 'PatchNorm'과 같은 새로운 함수를 제안하여 더 나은 성능을 입증합니다.
이 논문은 성능 추정 문제 (PEP) 를 활용하여 정확한 그래디언트 환경에서도 국소 업데이트를 도입한 DIGing 알고리즘이 분산 최적화를 가속화할 수 있음을 수학적으로 증명하고, 추가적인 업데이트 없이 두 번의 국소 업데이트만으로 최대 성능 향상을 얻을 수 있음을 보여줍니다.
이 논문은 학습된 단일 모델로 재학습 없이도 임의의 조건부 추론을 수행하고 불확실성을 정량화할 수 있도록, 확률적 반복 베이지안 업데이트 알고리즘을 기반으로 한 새로운 베이지안 생성 모델링 (BGM) 프레임워크를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 기반 웹 연구 에이전트를 활용하여 자동화되고 검증 가능한 다양한 미래 예측 질문 생성 및 해결 시스템을 구축하고, 이를 통해 AI 예측 모델의 성능 평가와 예측 정확도 향상을 입증했습니다.
이 논문은 영향 함수를 활용하여 훈련 데이터에 미세한 교란을 가해 모델의 행동을 의도적으로 조작하는 'Infusion' 프레임워크를 제안하고, 이를 통해 소량의 훈련 데이터만으로도 다양한 아키텍처에 걸쳐 모델 행동을 효과적으로 변화시킬 수 있음을 입증합니다.
이 논문은 고객 선호도 변화와 모델 오차로 인한 일반화 실패를 해결하기 위해, 관찰 데이터에서 최악의 경우 기대 수익을 최대화하는 통계적 효율성과 견고함을 동시에 보장하는 새로운 강건한 품목 최적화 프레임워크를 제안합니다.
이 논문은 청각적 참조 신호 없이도 기존 최첨단 모델보다 높은 상관관계와 낮은 평균 제곱 오차를 보이는 새로운 병목 트랜스포머 아키텍처를 통해 STOI 점수를 정확하게 예측하는 방법을 제안합니다.
이 논문은 확산 모델의 고해상도 추론 지연과 희소 감독의 한계를 해결하기 위해, 교사의 궤적 중간 단계를 모두 학습하는 밀집 앙상블 네트워크 (B-DENSE) 를 제안하여 이미지 생성 품질을 향상시킵니다.
이 논문은 민감한 개인 데이터를 처리하는 다중 모달 감정 분석 시스템에서 특정 모달리티의 삭제를 인증 가능하게 수행하면서도 예측 성능을 유지하는 'Missing-by-Design (MBD)' 프레임워크를 제안합니다.