MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems
이 논문은 물리 모델의 매개변수 분포를 마르코프 연쇄 몬테 카를로 (MCMC) 를 통해 신경망 훈련에 입력함으로써, 기존 방법의 비효율성과 비물리적 파라미터 문제를 해결하고 계산 비용을 크게 줄이면서 동적 시스템의 불확실성 정량화를 가능하게 하는 새로운 대리 모델 접근법을 제안합니다.
2316 편의 논문
이 논문은 물리 모델의 매개변수 분포를 마르코프 연쇄 몬테 카를로 (MCMC) 를 통해 신경망 훈련에 입력함으로써, 기존 방법의 비효율성과 비물리적 파라미터 문제를 해결하고 계산 비용을 크게 줄이면서 동적 시스템의 불확실성 정량화를 가능하게 하는 새로운 대리 모델 접근법을 제안합니다.
이 논문은 시뮬레이션 데이터와 평균 제곱 오차 손실 함수를 사용하여 단일 요약 네트워크로 매개변수 추정 역문제를 해결하는 'ForwardFlow'라는 심층 학습 기반의 빈도주의 통계적 추론 프레임워크를 제안하며, 유한 표본 정확성, 데이터 오염에 대한 강건성, 알고리즘 근사라는 세 가지 이상적 특성을 입증합니다.
이 논문은 가우시안 과정 회귀와 베이지안 최적화를 통합된 6 단계 서브로프 프레임워크로 결합하여, 미분 정보와 적응형 기법을 활용함으로써 포텐셜 에너지 표면상의 정류점 탐색 (최소점, 단일 및 양끝점 안장점) 의 효율성과 정확도를 획기적으로 향상시키는 방법을 제시합니다.
이 논문은 물리적 시스템의 고차원 비선형 동역학을 장기 예측, 매개변수 일반화 및 스펙트럼 분석이 가능한 방식으로 모델링하기 위해, 공간 모드와 시간 진화를 분리하는 인과적 신경장 파라미터화를 기반으로 한 '분해된 신경 암시적 DMD' 방법을 제안합니다.
이 논문은 마우스와 인간 대뇌 피질의 GABAergic 억제성 interneuron 데이터를 활용하여 전기생리학적 기록을 전사체학 정체성에 매핑하는 프레임워크를 재현하고, 주어진 시퀀스 모델을 통해 인간 데이터에서 마우스 데이터의 전이 학습이 분류 성능 향상에 기여함을 입증했습니다.
이 논문은 24 차원에서 최적의 구 포장 성질을 가진 리치 격자 (Leech lattice) 를 기반으로 인덱싱, 각도 탐색, 병렬 역양자화 커널을 가능하게 하는 '리치 격자 벡터 양자화 (LLVQ)' 알고리즘을 제안하여, 기존 방법들보다 우수한 성능으로 대규모 언어 모델 (LLM) 을 효율적으로 압축하는 새로운 접근법을 제시합니다.
이 논문은 텍스트-음악 생성 모델을 비디오 이벤트 곡선으로만 미세 조정하고 추론 시 비디오 이벤트 곡선으로 대체하는 V2M-Zero 를 제안하여, 짝지어진 데이터 없이도 비디오와 음악 간의 시간적 정렬을 달성함을 보여줍니다.
이 논문은 전통적인 열화상 기법의 한계를 극복하고 경성 물리 법칙을 준수하는 미분 가능 물리 솔버를 활용하여 3D 열 확산 장을 연속 신경장으로 파라미터화함으로써, 비파괴 검사를 위한 정량적 3D 재료 특성 재구성 및 결함 위치 파악의 정확도를 획기적으로 향상시킨 'NeFTY' 프레임워크를 제안합니다.
이 논문은 기존 코드베이스에 추가 수정 없이 통합 가능하며, 아키텍처 제약을 두지 않으면서도 역전파 시 중간 활성화 메모리 사용을 2 배 이상 절감하고 확률적 경사 하강법과 유사한 수렴성을 보장하는 새로운 합성곱 레이어인 XConv 를 제안합니다.
이 논문은 2018 년부터 2026 년 초까지의 탈중앙화 연방학습 (DFL) 연구들을 체계적으로 검토하고, 기존 중앙집중식 FL 의 한계를 극복하는 두 가지 아키텍처를 분류하며, 핵심 병목 현상에 기반한 통합 분류 체계를 제시하고 향후 연구 방향을 제안합니다.
이 논문은 다차원 랜덤 부분합 문제의 최근 발전을 활용하여 구조적 가지치기 (structured pruning) 를 위한 강한 로또 티켓 가설을 수학적으로 증명하고, 무작위 초기화된 합성곱 신경망이 훈련 없이도 효율적인 구조적 서브네트워크를 포함함을 보여줍니다.
이 논문은 실제 그래프의 동질성과 이질성을 동시에 고려하여 이론적으로 증명된 필터링 기법을 제안하고, 이를 통해 기존 최첨단 방법들보다 우수한 그래프 클러스터링 성능을 입증합니다.
이 논문은 좌표와 흐름 맵의 결합적 발견을 통해 딥러닝 기반의 정밀 시간 단계 접근법을 제시함으로써, 다양한 시공간 스케일을 가진 다중 스케일 시스템의 시뮬레이션 비용을 줄이면서도 최첨단 예측 정확도를 달성하는 프레임워크를 제안합니다.
이 논문은 온라인 토론에서 특정 그룹을 대상으로 하는 내용을 식별할 때 발생하는 편향을 줄이고 예측 성능을 향상시키기 위해 공정성을 고려한 다중 그룹 대상 탐지 방법을 제안하고 그 효과를 입증합니다.
이 논문은 자율주행 차량의 계산 부하와 호환성 문제를 해결하기 위해 단일 에이전트 학습보다 확장성이 뛰어나고 다양한 트래픽 유형에서 지연 시간을 크게 단축하는 분산형 멀티 에이전트 Q-러닝 기반 HD 맵 업데이트 솔루션을 제안하고 평가합니다.
이 논문은 대규모 데이터셋에서 이상치와 heavy-tail 분포를 효과적으로 모델링하기 위해 희소 유도점 방법을 Student-t 프로세스로 확장한 'Sparse Variational Student-t Processes(SVTP)' 프레임워크와 두 가지 새로운 추론 알고리즘을 제안하며, 이를 통해 기존 희소 가우시안 프로세스 대비 뛰어난 예측 정확도와 수렴 속도를 달성함을 보여줍니다.
이 논문은 기존에 존재하지 않았던 딥러닝 기반의 초그래프 생성 방법론인 HYGENE 를 제안하며, 확산 모델을 활용해 이분 그래프 표현을 기반으로 국소적 확장을 통해 복잡하고 다양한 초그래프 구조를 효과적으로 생성하는 것을 목표로 합니다.
이 논문은 양자화와 희소화 연산에서 발생하는 불연속성 문제를 해결하기 위해 양자화를 첨가 노이즈로 모델링하고, 이를 보정하는 정교한 기울기 경로를 제공하는 통합 프레임워크를 제안하여 임의의 정밀도와 희소성 수준에서 안정적으로 신경망을 학습시키는 방법을 제시합니다.
이 논문은 강화학습의 하이퍼파라미터 최적화 연구에 필요한 다양한 접근법 간의 비교와 저사양 환경에서의 평가를 가능하게 하기 위해 효율적이고 유연한 벤치마크인 'ARLBench'와 대규모 데이터셋을 제안합니다.
이 논문은 기존 데이터 축소 기법에 특징 또는 주의 주석과 같은 '우월 정보(Privileged Information)'를 추가로 합성하여 모델 학습을 보조함으로써, ImageNet-1K 등 다양한 데이터셋에서 기존 방법들의 성능을 획기적으로 향상시킨 'DRUPI' 방법을 제안합니다.