Efficient and Flexible Multirate Temporal Adaptivity
이 논문은 다중 시간 척도 문제를 해결하기 위해 다중 레이트 무한소 (MRI) 적분법과 함께 작동하는 새로운 적응형 시간 단계 제어기를 제안하고, 2 차부터 5 차까지의 MERK 방법용 임베딩을 개발하여 정확도를 높이고 계산 비용을 줄임으로써 기존 방법보다 뛰어난 성능과 유연성을 입증했습니다.
8 편의 논문
이 논문은 다중 시간 척도 문제를 해결하기 위해 다중 레이트 무한소 (MRI) 적분법과 함께 작동하는 새로운 적응형 시간 단계 제어기를 제안하고, 2 차부터 5 차까지의 MERK 방법용 임베딩을 개발하여 정확도를 높이고 계산 비용을 줄임으로써 기존 방법보다 뛰어난 성능과 유연성을 입증했습니다.
이 논문은 대규모 희소 텐서 계산을 위해 관계형 시스템의 희소성 처리 능력과 고성능 수치 커널을 결합하여, 기존 에인슈타인 합계 표기법을 자동으로 'EinSum'으로 변환하는 방법을 제시합니다.
이 논문은 MFEM 라이브러리의 핵심 커널에 FP64 텐서 코어와 커널 퓨전 최적화를 적용하여 Grace Hopper 및 Grace Blackwell 아키텍처에서 최대 2 배의 성능 향상과 83% 의 에너지 효율 개선을 달성하고, 알프스 시스템의 10,000 개 GPU 에서 엑사스케일 성능을 입증함으로써 대규모 유한 요소 시뮬레이션 가속화의 새로운 기준을 제시했습니다.
이 논문은 호스트-디바이스 통신 지연을 제거하고 비동기 잠금 해제 작업 도용 풀을 도입하여 골드바흐의 추측을 검증하는 완전 GPU 거주 아키텍처를 제안함으로써, 단일 RTX 5090 에서 $10^{12}$까지의 검증을 36.5 초 만에 수행하는 등 기존 방식 대비 45.6 배의 속도 향상을 달성했다고 요약할 수 있습니다.
이 기술 노트는 JAX 및 Optimistix 라이브러리를 기반으로 BFGS, DFP, Broyden 방법과 그 자기 스케일링 변형들을 구현한 오픈소스 코드를 소개하고, JAX 커뮤니티 내에서의 활용을 촉진하기 위해 구현 세부사항을 문서화합니다.
이 논문은 3×3 행렬의 고유값을 계산할 때 반복 고유값에서 발생하는 수치적 불안정성을 해결하기 위해 네 가지 불변량을 활용한 안정된 폐쇄형 공식을 제시하고, 그 정확성과 LAPACK 라이브러리 대비 약 10 배의 성능 향상을 입증합니다.
이 논문은 다변수 유리함수체의 부분체에 대한 생성자 집합을 단순화하는 알고리즘을 제안하고, 희소 보간을 통한 부분 그뢰브너 기저 계산 등 새로운 기법을 적용하여 기존 방법보다 효율성과 결과 품질을 향상시켰으며 구조적 매개변수 식별성 등 다양한 응용 사례를 통해 그 유용성을 입증했습니다.
이 논문은 수백만 개의 노드와 수십억 개의 간선을 가진 대규모 다층 혼합 모드 네트워크를 처리할 때 기존 라이브러리의 한계를 극복하고, 2000:1 이상의 압축률로 메모리 효율성을 극대화하는 오픈소스 네트워크 저장 및 쿼리 엔진 'Threadle'을 소개합니다.