Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training
이 논문은 금융 도메인 특화 데이터의 품질과 난이도/검증 가능성 프로파일이 모델 성능을 결정한다는 점을 실증적으로 입증하고, 고품질 CoT 증류와 난이도 인식 샘플링을 통해 구축한 ODA-Fin-RL-8B 모델이 동급 오픈소스 금융 LLM 들을 능가하는 성능을 보인다고 주장합니다.
11420 편의 논문
이 논문은 금융 도메인 특화 데이터의 품질과 난이도/검증 가능성 프로파일이 모델 성능을 결정한다는 점을 실증적으로 입증하고, 고품질 CoT 증류와 난이도 인식 샘플링을 통해 구축한 ODA-Fin-RL-8B 모델이 동급 오픈소스 금융 LLM 들을 능가하는 성능을 보인다고 주장합니다.
이 논문은 메모리, 지연 시간 및 데이터 제약이 엄격한 임상 환경에서 트랜스포머 기반 모델에 버금가는 정확도를 유지하면서도 파라미터와 연산량을 극도로 줄인 'LightMedSeg'라는 경량 3D 의료 영상 분할 아키텍처를 제안합니다.
이 논문은 심층 조건부 변환 모델 (DCTM) 과 크로스 피팅을 활용하여 연속 및 이산 순서형 결과 변수에 대해 조건부 순위-순위 회귀 (CRRR) 를 개선하고, 이를 통해 미국 소득과 인도 교육 이동성 분석에서 그룹 내 이동성을 정밀하게 측정하는 새로운 방법론을 제시합니다.
이 논문은 유전자 교란에 대한 세포 반응 예측의 일반화 한계를 극복하기 위해, 세포 유형을 인식하고 미분 가능한 두 단계 검색 메커니즘을 도입한 새로운 프레임워크인 PT-RAG 를 제안하며, 이를 통해 기존 방법론보다 우수한 성능을 입증했습니다.
이 논문은 검색 엔진의 인덱싱 구조와 에이전트의 추론 간 불일치를 해결하기 위해, 검색 공간의 구조적 특성을 반영하고 few-shot 프로빙을 통해 동적으로 서브-목표를 재보정하는 'WeDas'라는 웹 콘텐츠 분포 인식 프레임워크를 제안합니다.
이 논문은 대만 지역 폐암 생존자의 소규모 데이터와 미국 SEER 공개 데이터의 이질적 특성을 고려하여, 데이터 공유 없이 손실 함수 융합을 기반으로 한 수평 연동 학습 (LF2L) 프레임워크를 제안함으로써 2 차 원발성 암 예측 성능을 획기적으로 향상시켰음을 보여줍니다.
이 논문은 혼란스러운 시계열 데이터에서 투명하고 해석 가능한 대수 방정식을 학습하여 예측 정확도를 유지하면서도 블랙박스 모델의 한계를 극복하는 두 가지 상징적 기계학습 방법 (SyNF 와 SyTF) 을 제안하고 다양한 벤치마크 및 실제 사례를 통해 그 유효성을 입증합니다.
이 논문은 개별 환자의 결석 확률 예측과 다목적 강화 학습을 결합하여, 기존 고정 규칙의 한계를 극복하고 실시간으로 예약 (단일/이중 예약 또는 거절) 을 최적화하는 적응형 외래 진료 스케줄링 프레임워크를 제안합니다.
이 논문은 외부 제약 조건을 따르는 단일 단계 조건부 생성 및 역문제 해결을 위해, 샘플링 경로를 안내하는 대신 관찰 데이터에 부합하는 초기 노이즈 분포를 학습하는 '변분 흐름 맵 (Variational Flow Maps)' 프레임워크를 제안합니다.
이 논문은 Vocos 기반의 신경 보코더와 경량화된 리프라이너를 결합하여 8~48kHz 대역의 결손 고주파 성분을 생성하고, NVIDIA A100 GPU 에서 실시간 인자의 0.0001 배에 달하는 극한의 처리 속도로 고품질 대역폭 확장을 실현하는 모델을 제안합니다.
이 논문은 변환 생성자를 직접 최적화하는 기존 접근법과 달리, 일반화 푸리에 변환 (GFT) 을 통해 함수의 스펙트럼 분해에서 유도된 구조적 희소성을 식별함으로써 연속 대칭성을 발견하는 새로운 프레임워크를 제안합니다.
이 논문은 인간 개입 없이 신경 아키텍처와 하이퍼파라미터를 지속적으로 탐색하고 개선하는 강화 학습 기반의 자동 연구 프레임워크인 'AutoResearch-RL'을 제안하며, 단일 GPU 환경에서 약 300 회의 반복 실험을 통해 수동으로 조정된 베이스라인과 맞먹거나 더 나은 성능을 달성하는 것을 입증했습니다.
이 논문은 다양한 지역과 시기에 걸쳐 발생하는 공간적 변동성과 장기적·단기적 시간적 패턴을 동시에 포착하기 위해 검색 기반 적응 전략을 통합한 새로운 다중 스케일 프레임워크를 제안하여 미국 전역의 군 단위 옥수수 수확량 예측 정확도를 크게 향상시켰다고 요약할 수 있습니다.
이 논문은 SAM 모델의 구조와 스펙트럼을 보존하면서 토큰 병합 시 발생하는 경계 손실과 프롬프트 정보 누출 문제를 해결하기 위해, 그라디언트 기반 토큰 에너지 점수와 그리드 기반 평탄도 선별을 활용한 'StructSAM'을 제안하여 계산 비용을 대폭 줄이면서도 정밀한 분할 성능을 유지하는 방법을 제시합니다.
이 논문은 부분 관측 가능 환경에서 잠재 초기 상태 분포의 적대적 선택을 다루기 위한 이론적 프레임워크를 제시하고, 배틀십 벤치마크를 통해 표적화된 적대적 노출이 최악의 취약점을 효과적으로 완화하여 강건한 정책을 학습할 수 있음을 증명합니다.
이 논문은 고급 인공지능이 목표를 달성하기 위해 종료되는 것을 막는다는 우려를 해결하기 위해, 인공지능에게 '종료되는 것'을 주된 목표로 부여하는 비주류적인 제안과 그 적절성에 대해 논의합니다.
이 논문은 차분 프라이버시 기법에 영감을 받아 제안된 'ShakyPrepend' 알고리즘을 통해 다중 그룹 학습의 표본 복잡도를 개선하고, 그룹 구조와 공간적 이질성에 적응하는 능력을 수치 실험을 통해 입증했습니다.
이 논문은 가중치 감쇠 하에서 매개변수 노름의 위계적 탐색을 통해 뉴럴 네트워크가 초기의 편향된 단축경로 해에서 구조화된 표현으로 전환되는 시기와 메커니즘을 설명하는 '노름 - 위계 전이 (NHT)' 프레임워크를 제안합니다.
이 논문은 5G 네트워크의 실시간 지능형 재밍 탐지를 위해 FPGA 에서 효율적으로 실행 가능한 경량화되고 해석 가능한 합성곱 트세틀린 머신 (CTM) 을 제안하며, 실제 5G 테스트베드 실험을 통해 기존 CNN 대비 학습 속도와 메모리 효율성을 크게 개선하면서도 유사한 탐지 성능을 입증했습니다.
이 논문은 블랙박스 모델이 학습한 개념을 희소 오토인코더와 멀티모달 LLM 을 통해 추출하고 명명하여, 기존 개념 병목 모델 (CBM) 의 예측 성능 한계를 극복하고 정보 누출을 통제된 조건에서 더 높은 정확도와 간결한 설명을 제공하는 새로운 'Mechanistic CBM(M-CBM)' 파이프라인을 제안합니다.