Continuous-time multi-armed bandits under random intervention times

이 논문은 무작위 개입 시간 하의 연속 시간 다중 암 밴딧 문제를 다루며, 특히 레비 과정으로 진화하는 암들에 대해 기트킨스 지수를 명시적으로 유도하고 지수 분포 개입 시간과 특정 레비 과정 또는 확산 과정의 경우 척도 함수 등을 통해 지수를 구체화한 이론적 결과와 수치 실험을 제시합니다.

Kei Noba, José Luis Pérez, Kazutoshi Yamazaki + 1 more2026-03-05🔢 math

Principled Learning-to-Communicate with Quasi-Classical Information Structures

이 논문은 정보 구조 (IS) 관점에서 분산 부분 관측 마르코프 결정 과정 (Dec-POMDP) 하의 학습 기반 의사소통 (LTC) 문제를 형식화하고, 준고전적 (quasi-classical) 조건 하에서 계산적으로 다루기 쉬운 문제 클래스를 정의하며 이를 위한 증명 가능한 계획 및 학습 알고리즘을 제시합니다.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

Frequency Security-Aware Production Scheduling of Utility-Scale Off-Grid Renewable P2H Systems Coordinating Heterogeneous Electrolyzers

이 논문은 이질적인 전해조와 다양한 자원을 통합하여 주파수 안정성을 고려한 오프그리드 대규모 재생에너지 수소 생산 시스템의 최적 생산 스케줄링 프레임워크를 제안함으로써, 수소 생산량과 주파수 규제 성능을 동시에 향상시키는 방법을 제시합니다.

Jie Zhu, Yiwei Qiu, Yangjun Zeng + 4 more2026-03-05🔢 math

Tractable infinite-dimensional model for long-term environmental impact assessment of long-memory processes

이 논문은 장기 기억 과정을 가진 환경 영향 평가 (특히 저서성 조류 개체수) 를 위해 불확실성 하에서 해석적 해가 가능한 무한 차원 확장 해밀턴 - 자코비 - 벨만 시스템을 제안하고, 이를 양자화 기법으로 수치적으로 해결하여 장기적 환경 현상 평가의 실용적 프레임워크를 제시합니다.

Hidekazu Yoshioka, Kunihiko Hamagami2026-03-05🔢 math

A successive difference-of-convex method for a class of two-stage nonconvex nonsmooth stochastic conic program via SVI

이 논문은 2 단계 비볼록 비연속 확률 원뿔 계획 문제를 해결하기 위해 KKT 조건을 기반으로 한 비단조 2 단계 확률 변분 부등식으로 변환하고, Moreau 포락선과 점진적 페널티법을 활용한 successive difference-of-convax (SDC) 알고리즘을 제안하며, 이를 마코위츠 평균 - 분산 모델 확장에 적용하여 수치적 유효성을 입증합니다.

Chao Zhang, Di Wang2026-03-05🔢 math

Implicit-Explicit Trust Region Method for Computing Second-Order Stationary Points of A Class of Landau Models

이 논문은 Landau-Brazovskii 모델과 같은 Landau 유형의 자유 에너지 범함수에 대해 2 차 정류점 (국소 최소값) 을 계산하기 위해 푸리에 의사스펙트럴 방법과 Hessian 구조를 활용한 적응형 암시적 - 명시적 신뢰영역 기법을 제안하고, 이를 통해 기존 1 차 방법보다 saddle point 를 효율적으로 탈출하여 FDDD 상의 안정 영역을 성공적으로 규명했음을 보여줍니다.

Chenglong Bao, Kai Deng, Kai Jiang + 1 more2026-03-05🔢 math

Identification of Nonlinear Acyclic Networks in Continuous Time from Nonzero Initial Conditions and Full Excitations

이 논문은 비선형 비순환 네트워크의 동역학이 엣지에 존재하고 모든 노드가 자극받는 연속 시간 환경에서, 모든 싱크 노드를 측정하고 고차 미분 및 비영 초기 조건을 활용하여 트리 및 일반 방향 비순환 그래프 (DAG) 의 구조와 엣지 함수를 식별하는 방법을 제안합니다.

Ramachandran Anantharaman, Renato Vizuete, Julien M. Hendrickx + 1 more2026-03-05🔢 math

Wasserstein Gradient Flows of semi-discret energies: evolution of urban areas anduniform quantization

이 논문은 도시 계획 및 균일 양자화와 관련된 반이산 에너지의 Wasserstein 기울기 흐름을 JKO 스킴을 통해 분석하여, 특이한 이송 항을 가진 포물형 편미분방정식과 ODE 로 구성된 극한 시스템의 수렴성을 증명하고, 라그랑주 셀의 무게중심으로의 원자 수렴성 등 정성적 특성을 연구하며 선형 확산에서의 동적 결정화 현상을 수치 시뮬레이션을 통해 규명합니다.

Joao Miguel Machado2026-03-05🔢 math

Optimal strategies in Markov decision processes with finitely additive evaluations

이 논문은 무한 시간 Markov 결정 과정에서 확산 차분 (diffuse charge) 을 통한 보상 집계 방식이 시간 가치 원칙을 만족하지 않을 경우, 유한 상태 및 행동 공간을 가진 MDP 에서 순수 전략과 확률적 전략을 포함한 최적 전략이 존재하지 않을 수 있음을 반례를 통해 증명합니다.

János Flesch, Arkadi Predtetchinski, William D Sudderth + 1 more2026-03-05🔢 math