Efficient and Flexible Multirate Temporal Adaptivity

이 논문은 다중 시간 척도 문제를 해결하기 위해 다중 레이트 무한소 (MRI) 적분법과 함께 작동하는 새로운 적응형 시간 단계 제어기를 제안하고, 2 차부터 5 차까지의 MERK 방법용 임베딩을 개발하여 정확도를 높이고 계산 비용을 줄임으로써 기존 방법보다 뛰어난 성능과 유연성을 입증했습니다.

Daniel R. Reynolds, Sylvia Amihere, Dashon Mitchell, Vu Thai LuanWed, 11 Ma🔢 math

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

이 논문은 MFEM 라이브러리의 핵심 커널에 FP64 텐서 코어와 커널 퓨전 최적화를 적용하여 Grace Hopper 및 Grace Blackwell 아키텍처에서 최대 2 배의 성능 향상과 83% 의 에너지 효율 개선을 달성하고, 알프스 시스템의 10,000 개 GPU 에서 엑사스케일 성능을 입증함으로써 대규모 유한 요소 시뮬레이션 가속화의 새로운 기준을 제시했습니다.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

이 논문은 호스트-디바이스 통신 지연을 제거하고 비동기 잠금 해제 작업 도용 풀을 도입하여 골드바흐의 추측을 검증하는 완전 GPU 거주 아키텍처를 제안함으로써, 단일 RTX 5090 에서 $10^{12}$까지의 검증을 36.5 초 만에 수행하는 등 기존 방식 대비 45.6 배의 속도 향상을 달성했다고 요약할 수 있습니다.

Isaac Llorente-SaguerTue, 10 Ma🔢 math