cs.MS 편의 논문 | Gist.Science

Efficient and Flexible Multirate Temporal Adaptivity

이 논문은 다중 시간 척도 문제를 해결하기 위해 다중 레이트 무한소 (MRI) 적분법과 함께 작동하는 새로운 적응형 시간 단계 제어기를 제안하고, 2 차부터 5 차까지의 MERK 방법용 임베딩을 개발하여 정확도를 높이고 계산 비용을 줄임으로써 기존 방법보다 뛰어난 성능과 유연성을 입증했습니다.

Daniel R. Reynolds, Sylvia Amihere, Dashon Mitchell, Vu Thai LuanWed, 11 Ma🔢 math

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

이 논문은 대규모 희소 텐서 계산을 위해 관계형 시스템의 희소성 처리 능력과 고성능 수치 커널을 결합하여, 기존 에인슈타인 합계 표기법을 자동으로 'EinSum'으로 변환하는 방법을 제시합니다.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

이 논문은 MFEM 라이브러리의 핵심 커널에 FP64 텐서 코어와 커널 퓨전 최적화를 적용하여 Grace Hopper 및 Grace Blackwell 아키텍처에서 최대 2 배의 성능 향상과 83% 의 에너지 효율 개선을 달성하고, 알프스 시스템의 10,000 개 GPU 에서 엑사스케일 성능을 입증함으로써 대규모 유한 요소 시뮬레이션 가속화의 새로운 기준을 제시했습니다.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

이 논문은 호스트-디바이스 통신 지연을 제거하고 비동기 잠금 해제 작업 도용 풀을 도입하여 골드바흐의 추측을 검증하는 완전 GPU 거주 아키텍처를 제안함으로써, 단일 RTX 5090 에서 $10^{12}$까지의 검증을 36.5 초 만에 수행하는 등 기존 방식 대비 45.6 배의 속도 향상을 달성했다고 요약할 수 있습니다.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

이 기술 노트는 JAX 및 Optimistix 라이브러리를 기반으로 BFGS, DFP, Broyden 방법과 그 자기 스케일링 변형들을 구현한 오픈소스 코드를 소개하고, JAX 커뮤니티 내에서의 활용을 촉진하기 위해 구현 세부사항을 문서화합니다.

Ivan Bioli, Mikel Mendibe AbarrategiThu, 12 Ma🤖 cs.LG

Numerically stable evaluation of closed-form expressions for eigenvalues of $3 \times 3$ matrices

이 논문은 3×3 행렬의 고유값을 계산할 때 반복 고유값에서 발생하는 수치적 불안정성을 해결하기 위해 네 가지 불변량을 활용한 안정된 폐쇄형 공식을 제시하고, 그 정확성과 LAPACK 라이브러리 대비 약 10 배의 성능 향상을 입증합니다.

Michal Habera, Andreas Zilian2026-03-06🔢 math

Simple generators of rational function fields

이 논문은 다변수 유리함수체의 부분체에 대한 생성자 집합을 단순화하는 알고리즘을 제안하고, 희소 보간을 통한 부분 그뢰브너 기저 계산 등 새로운 기법을 적용하여 기존 방법보다 효율성과 결과 품질을 향상시켰으며 구조적 매개변수 식별성 등 다양한 응용 사례를 통해 그 유용성을 입증했습니다.

Alexander Demin, Gleb Pogudin2026-03-06🔢 math

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

이 논문은 수백만 개의 노드와 수십억 개의 간선을 가진 대규모 다층 혼합 모드 네트워크를 처리할 때 기존 라이브러리의 한계를 극복하고, 2000:1 이상의 압축률로 메모리 효율성을 극대화하는 오픈소스 네트워크 저장 및 쿼리 엔진 'Threadle'을 소개합니다.

Carl Nordlund, Yukun Jiao2026-03-06💻 cs