Some Super-approximation Rates of ReLU Neural Networks for Korobov Functions
이 논문은 희소 격자 유한 요소와 비트 추출 기법을 활용하여 ReLU 신경망이 코로보프 함수를 근사할 때 차원의 저주에 거의 영향을 받지 않는 거의 최적의 초근사 오차 한계를 증명합니다.
9582 편의 논문
이 논문은 희소 격자 유한 요소와 비트 추출 기법을 활용하여 ReLU 신경망이 코로보프 함수를 근사할 때 차원의 저주에 거의 영향을 받지 않는 거의 최적의 초근사 오차 한계를 증명합니다.
이 논문은 무한 시간 평균장 게임에서 RKHS 기반의 최대 인과 엔트로피 역강화학습을 제안하여, 기존 선형 보상 모델의 한계를 극복하고 비선형 보상 구조를 효과적으로 학습하며 이론적 일관성과 실제 교통 시나리오에서의 우수성을 입증합니다.
이 논문은 고정된 가우시안 노이즈의 한계를 극복하고 다양한 노이즈 패턴을 처리하여 이미지 복원 성능을 향상시키기 위해, 임의의 노이즈를 기반으로 한 확산 모델의 설계 공간을 체계적으로 규명하는 새로운 프레임워크인 EDA 를 제안합니다.
이 논문은 양자 볼츠만 머신의 학습을 방해하는 barren plateau 문제를 극복하기 위해, 기댓값 - 최대화 (EM) 알고리즘을 양자 버전으로 확장하여 반양자 제한 볼츠만 머신 (sqRBM) 에 적용함으로써 경사 하강법보다 안정적이고 확장 가능한 학습 방법을 제시합니다.
이 논문은 GRPO 의 이론적 한계를 분석하고, 토큰 수준의 중요도 샘플링을 경로 수준의 보정으로 대체하여 수렴 속도와 성능을 모두 개선한 새로운 알고리즘 TIC-GRPO 를 제안하고 실험적으로 검증합니다.
이 논문은 불균형 데이터와 전문가 간 합의 등 신생아 발작 검출의 고유한 과제를 고려하여, 기존 평가 방식의 한계를 지적하고 균형 잡힌 지표, 민감도/특이도 등 필수 메트릭, 그리고 Fleiss Kappa 기반의 다수 전문가 터링 테스트를 포함한 엄격한 평가 프레임워크를 제안함으로써 임상 적용을 위한 AI 모델의 신뢰성 있는 검증을 촉구합니다.
이 논문은 API 를 통한 파인튜닝 시 발생할 수 있는 돌발적 정렬 불일치 (EMA) 를 방지하기 위해 네 가지 훈련 중 규제 기법을 체계적으로 평가한 결과, 정렬된 모델과 오정렬된 모델 간의 퍼플렉시티 차이로 데이터를 선별하여 일반 지시 튜닝 데이터를 교차 학습하는 방식이 가장 효과적임을 밝혔습니다.
이 논문은 소수의 선호도 데이터만 제거해도 Chatbot Arena 와 같은 주요 LLM 랭킹 시스템의 최상위 모델 순서가 뒤바뀔 수 있음을 보여주며, MT-bench 의 전문가 기반 평가가 더 강건하고 인간 평가와 LLM 평가 간 민감도 차이는 체계적으로 존재하지 않음을 밝힙니다.
이 논문은 양자화가 모델의 독성 감소에는 기여하지만, 특히 공격적인 압축 시 편견과 불공정성을 약간 증가시킬 수 있음을 다양한 벤치마크와 하위 그룹을 통해 분석하며, 효율성과 윤리적 고려 사항 간의 균형을 강조합니다.
이 논문은 교통 신호 제어, 자율주행 차량 조정, 물류 최적화 등 지능형 교통 시스템 (ITS) 의 핵심 과제 해결을 위한 다중 에이전트 강화 학습 (MARL) 의 방법론, 적용 사례, 시뮬레이션 플랫폼 및 현실 세계 배포를 가로막는 주요 과제들을 체계적으로 조사하고 있습니다.
이 논문은 그래프 리치 곡률을 기반으로 GNN 기반 SAT 솔버의 학습 어려움을 기하학적으로 설명하며, 난이도가 높은 SAT 인스턴스가 본질적으로 음의 곡률을 가지며 이로 인해 GNN 의 오버스쿼싱 현상이 발생하여 성능이 저하됨을 증명하고 곡률이 문제 복잡성과 일반화 오차를 예측하는 강력한 지표임을 실증적으로 확인합니다.
이 논문은 자동 음성 인식 (ASR) 에서 지식 전이를 위해 음향 및 언어 표현 간의 정렬을 검출 문제로 재해석하고, 불균형 최적 수송을 기반으로 한 새로운 정렬 모델을 제안하여 구조적 비대칭성과 불일치를 효과적으로 처리함으로써 ASR 성능을 향상시킨다는 것을 보여줍니다.
이 논문은 노이즈가 많고 이질적인 특성을 가진 소매 공급망 수요 예측 문제를 해결하기 위해, 각 부스팅 라운드에서 특징 중요도를 동적으로 조정하여 예측 정확도와 해석 가능성을 동시에 향상시킨 새로운 프레임워크인 'AttnBoost'를 제안하고 그 유효성을 입증합니다.
이 논문은 지속적 GLMY 호몰로지 이론을 활용하여 저수지 네트워크의 1 차 호몰로지 군을 분석하고 최소 대표 사이클을 수정하는 구조 최적화 방법을 제안함으로써 성능을 향상시키는 것을 목표로 합니다.
이 논문은 실제 데이터의 인과 구조를 알 수 없는 상황에서도 구조적 충실도와 기존 평가 지표를 종합적으로 분석할 수 있는 새로운 평가 지표인 '글로벌 유틸리티'를 제안하고, 29 개의 데이터셋과 13 개의 생성 모델을 대상으로 한 포괄적인 벤치마크 'TabStruct'를 구축하여 표제 데이터 생성 모델의 성능을 평가하는 프레임워크를 제시합니다.
이 논문은 40 개 이상의 언어로 된 1 만 3,000 시간 분량의 아동 중심 녹음 데이터를 기반으로 학습된 자기지도 학습 모델 'BabyHuBERT'를 제안하여, 기존 성인용 모델보다 다양한 언어 환경에서 아동과 성인의 음성을 구분하는 성능을 크게 향상시켰다고 요약할 수 있습니다.
이 논문은 Apple Vision Pro 를 통한 원격 조작으로 수집된 데이터를 기반으로 트랜스포머 기반 확산 모델을 활용해 외부 힘에 반응하여 임피던스 파라미터를 실시간으로 적응시키는 'Diffusion-Based Impedance Learning' 프레임워크를 제안하여, 복잡한 접촉 작업에서 정밀하고 안정적인 로봇 조작을 가능하게 합니다.
이 논문은 엔트로피 정규화의 한계를 극복하기 위해 무질서와 질서의 균형을 반영하는 '복잡도' 항을 도입한 새로운 강화학습 알고리즘 CR-PPO 를 제안하며, 이를 통해 하이퍼파라미터 튜닝에 대한 의존성을 줄이고 학습의 안정성을 크게 향상시켰음을 보여줍니다.
이 논문은 드럼 자동 전사를 판별적 작업이 아닌 생성적 작업으로 재정의하고, 음악 기반 모델의 특징을 활용하여 온셋과 속도를 동시에 최적화하는 확산 기반 프레임워크 'Noise-to-Notes(N2N)'를 제안함으로써 여러 벤치마크에서 새로운 최고 성능을 달성했다고 요약할 수 있습니다.
이 논문은 폐루프 자율주행 환경에서 안전하고 반응적인 궤적 계획을 위해 전진 및 역과정의 이론적 일관성을 보장하는 '브릿지드라이브 (BridgeDrive)'라는 새로운 앵커 기반 확산 브리지 정책을 제안하고, Bench2Drive 벤치마크에서 기존 최첨단 방법론보다 성공률을 크게 향상시킨 결과를 제시합니다.