On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

이 논문은 행렬 연산자 노름의 관점에서 신경망 옵티마이저의 폭 확장성을 분석하고, 층별 합성 가능한 평균 정규화 노름을 도입하여 폭에 무관한 학습률 전이를 가능하게 하는 새로운 옵티마이저 MOGA 를 제안하며, 대규모 사전 학습에서 Muon 과 경쟁력 있으면서도 더 빠른 성능을 입증합니다.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Bilevel Optimization and Heuristic Algorithms for Integrating Latent Demand into the Design of Large-Scale Transit Systems

이 논문은 잠재 수요를 고려한 대규모 대중교통 시스템 설계를 위해 이분산 최적화 모델 (TN-DA) 을 제안하고, 이를 효율적으로 해결하기 위한 휴리스틱 알고리즘을 개발하여 실제 사례를 통해 높은 품질의 해를 빠르게 도출할 수 있음을 입증했습니다.

Hongzhao Guan, Beste Basciftci, Pascal Van HentenryckTue, 10 Ma🔢 math

Erratum and original of Port-Hamiltonian structure of interacting particle systems and its mean-field limit

이 논문은 정렬 및 잠재력 기반 힘에 의해 구동되는 상호작용 입자 시스템의 최소 포트-해밀토니안 구조를 유도하고 평균장 극한에서의 보존 법칙 및 라살 안정성 원리를 분석하며, 기존 연구의 오차를 수정하고 수렴성 증명과 반례를 제시함으로써 시스템의 균일 안정성에 대한 새로운 관점을 제공합니다.

Jannik Daun, Daniel Jannik Happ, Birgit Jacob, Claudia TotzeckTue, 10 Ma🔢 math

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

이 논문은 최적 수송 이론에서 유도된 정규화와 볼록 통합 문제를 통해 국소 리프시츠 연속성을 보장하면서도 훈련 데이터를 정확하게 적합할 수 있는 새로운 2 단계 적대적 방어 모델 OTAD 를 제안하여 기존 방법들의 한계를 극복하고 다양한 데이터셋에서 우수한 성능을 입증했습니다.

Kuo Gai, Sicong Wang, Shihua ZhangTue, 10 Ma🤖 cs.LG

Robustness to Model Approximation, Model Learning From Data, and Sample Complexity in Wasserstein Regular MDPs

이 논문은 Wasserstein 거리를 기반으로 한 이산 시간 확률적 최적 제어의 근사 모델에 대한 강건성을 분석하여, 실제 모델과 근사 모델 간의 전이 커널 차이를 통해 최적 정책의 성능 손실을 정량화하고 이를 경험적 모델 학습 및 샘플 복잡도 분석에 적용하는 방법을 제시합니다.

Yichen Zhou, Yanglei Song, Serdar YükselTue, 10 Ma🔢 math

A fresh look into variational analysis of C2\mathcal C^2-partly smooth functions

이 논문은 C2\mathcal C^2-부분 매끄러운 함수에 대한 새로운 변분 분석 관점을 제시하여 엄격한 이중 에피-미분가능성과의 관계를 규명하고, 이를 통해 해당 함수의 이차 서브도함수를 계산하며 일반화된 방정식의 안정성 분석 및 확률적 프로그래밍의 표본 평균 근사법 점근 분석에 적용합니다.

Nguyen T. V. Hang, Ebrahim SarabiTue, 10 Ma🔢 math