Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition
이 논문은 x-벡터 클러스터링과 몬테카를로 드롭아웃을 활용한 베이지안 배치 능동 학습을 결합한 2 단계 파이프라인을 제안하여, 자동 음성 인식 모델의 학습 효율성을 극대화하고 라벨링 비용을 획기적으로 줄였음을 보여줍니다.
9137 편의 논문
이 논문은 x-벡터 클러스터링과 몬테카를로 드롭아웃을 활용한 베이지안 배치 능동 학습을 결합한 2 단계 파이프라인을 제안하여, 자동 음성 인식 모델의 학습 효율성을 극대화하고 라벨링 비용을 획기적으로 줄였음을 보여줍니다.
이 논문은 신경과학에서 영감을 받은 예측 부호화 네트워크 (PCN) 와 추론 학습 (IL) 에 대한 포괄적인 검토와 형식적 규정을 제공하며, 기존 역전파 방식의 한계를 넘어 생물학적 타당성과 효율성을 갖춘 차세대 머신러닝 프레임워크로서의 가능성을 제시합니다.
이 논문은 embodied mind 이론을 바탕으로 대형 언어 모델 (LLM) 이 자율적 행위자 (agent) 의 조건을 충족하지 못해 '대화형 자동화 장치'로 정의되어야 하지만, 인간과의 결합을 통해 기존 도구를 넘어선 새로운 형태의 '중간적 행위성 (midtended agency)'을 창출한다고 주장합니다.
이 논문은 파라미터 효율적 미세 조정 (PEFT) 의 일반화 성능을 향상시키기 위해 적응기에서 학습된 특징에 곱셈 노이즈를 가해 일관성 정규화를 수행하는 'PACE'를 제안하며, 이를 통해 그래디언트 노름을 감소시키고 사전 학습된 지식을 유지하여 다양한 시각 및 언어 작업에서 기존 방법들을 능가하는 성능을 입증합니다.
이 논문은 UAV 영상에서 배경 노이즈를 줄이고 행동 관련 객체 정보에 집중하여 미래 동작을 예측하는 'FALCON'이라는 자기지도 학습 전처리 방법을 제안함으로써, UAV 행동 인식의 정확도를 높이고 추론 속도를 크게 개선했다고 요약할 수 있습니다.
이 논문은 추가 데이터셋 없이 자기일관성 학습 전략과 경량 네트워크를 활용하여 불규칙하게 수집된 지진 데이터를 고품질로 재구성하는 효율적인 자기지도 학습 방법을 제안합니다.
이 논문은 생성 속도와 제어력을 개선하기 위해 모션 공간에서 표현을 생성하는 트랜스포머 기반의 확산 모델인 'Ditto'를 제안하여, 실시간 대화형 애플리케이션에 적합한 정교한 표정과 제어가 가능한 실시간 talking head 합성 프레임워크를 제시합니다.
이 논문은 커널 함수 없이 비선형 결정 경계를 모델링하는 커널 프리 2 차 표면 SVM(QSVM) 의 과적합 및 해석 어려움 문제를 해결하기 위해 정규화를 도입한 희소 QSVM 을 제안하고, 이를 효율적으로 풀기 위한 수렴성이 보장된 페널티 분해 알고리즘을 개발하여 다양한 벤치마크 및 신용 평가 데이터셋에서 우수한 성능을 입증했습니다.
이 논문은 대규모 멀티모달 언어 모델을 활용한 과학적 발견, 실험, 콘텐츠 생성 및 평가의 5 가지 핵심 영역에 대한 데이터셋, 방법론, 평가 전략, 한계 및 윤리적 문제를 포괄적으로 검토하여 AI 기반 과학 연구의 현재와 미래를 조명하는 종합적인 조사를 제공합니다.
이 논문은 분자 수준의 세부 사항을 재구성하는 coarse-to-fine 오토인코더와 확률적 분자 조각 가방 전략을 결합한 계층적 프레임워크 'FragFM'을 제안하여, 기존 원자 기반 방법보다 우수한 속성 제어와 확장성을 보장하고 천연물 생성을 평가하는 새로운 벤치마크인 NPGen 을 통해 분자 생성 모델의 성능을 입증했습니다.
이 논문은 비미분 가능한 구성 요소 간 상호작용과 시스템 수준의 선호도 정렬의 어려움을 해결하기 위해, 컴파운드 AI 시스템을 방향성 비순환 그래프 (DAG) 로 모델링하고 직접 선호도 최적화 (DPO) 를 확장한 새로운 프레임워크인 'SysDPO'를 제안하여 시스템 전체의 인간 선호도 정렬을 가능하게 합니다.
이 논문은 NISQ 시대의 회로 절단 및 양자 상태 전송을 기반으로 한 분할 양자 분류기의 적대적 견고성을 연구하며, 이러한 분할 방식에 대한 적대적 교란이 분류기의 중간 계층에 적대적 게이트를 구현하는 것과 밀접한 연관이 있음을 이론적 및 실험적 관점에서 규명합니다.
이 논문은 VQ-VAE 를 활용한 벡터 양자화를 통해 데이터 클러스터링을 수행하고 희귀하지만 가치 있는 샘플의 우선순위를 높이는 '맥락 인식 우선 샘플링 (CAPS)' 기법을 제안하여 자율주행 모방 학습의 데이터 효율성과 일반화 성능을 획기적으로 개선함을 보여줍니다.
이 논문은 토크나이저-디토크나이저 쌍의 편향을 통제하고 대규모 사전 학습을 통해 LLM 의 시간 계열 예측 본질적 능력을 평가한 결과, LLM 백본은 큰 잠재력을 보이지만 대규모 시간 계열 데이터로 특화되어 훈련된 모델만큼 일관되게 뛰어난 성능을 내지는 못함을 밝혔습니다.
이 논문은 오픈소스 얼굴 교체 모델과 '나디파이징' 소프트웨어로 구성된 '악의적 기술 생태계'가 성인 대상 AI 생성 비동의적 성폭력 이미지 (AIG-NCII) 제작을 용이하게 하고 있으며, NIST 의 현재 거버넌스 체계가 이를 효과적으로 규제하지 못한다는 점을 생존자 중심의 관점에서 비판적으로 분석합니다.
이 논문은 데이터 프라이버시를 보호하면서 분산된 환경에서 협력적 학습을 가능하게 하는 연방 학습 (Federated Learning) 의 기본 아키텍처, 핵심 기술적 과제, 최신 연구 동향 및 실제 응용 사례를 포괄적으로 검토하고 미래 연구 방향을 제시합니다.
본 논문은 볼츠만 방정식의 비선형 충돌 연산자를 푸리에 공간에서 효율적으로 근사하여 재학습 없이도 해상도 불변 학습과 제로샷 초해상도를 가능하게 하고, 전통적인 스펙트럴 솔버 대비 계산 비용을 획기적으로 줄이면서도 높은 정확도를 유지하는 'FourierSpecNet'이라는 하이브리드 딥러닝 프레임워크를 제안합니다.
이 논문은 LHCb 실험 환경을 모사하여 다중 작업 학습과 그래프 가지치기 계층을 통합한 이종 그래프 신경망 (HGNN) 을 제안함으로써, 높은 광도 환경에서의 입자 충돌 사건 재구성 성능과 확장성을 동시에 향상시켰음을 보여줍니다.
이 논문은 보상 모델링을 추론 작업으로 재정의하여 '추론 보상 모델 (ReasRM)'인 RM-R1 을 제안하고, 고품질 추론 체인의 증류와 검증 가능한 보상을 통한 강화학습을 통해 기존 대형 모델보다 뛰어난 성능과 해석 가능성을 달성했다고 요약할 수 있습니다.
이 논문은 무제한 영역의 선형 시스템 해법을 위해 Polyak 스텝사이즈 변형을 도입하여 엔트로피 미러 디센트의 수렴성을 증명하고, -노름 암시적 편향을 강화하며 지수 연산 없이 수렴이 보장되는 대안적 방법을 제안합니다.