Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning
이 논문은 물리 법칙을 준수하는 라그랑주 신경망 (LNN) 을 강화학습의 Dyna 프레임워크에 통합하여, 기존 블랙박스 모델보다 더 정확하고 견고한 모델 기반 강화학습을 가능하게 함을 제안하고 있습니다.
322 편의 논문
이 논문은 물리 법칙을 준수하는 라그랑주 신경망 (LNN) 을 강화학습의 Dyna 프레임워크에 통합하여, 기존 블랙박스 모델보다 더 정확하고 견고한 모델 기반 강화학습을 가능하게 함을 제안하고 있습니다.
이 논문은 대규모 언어 모델 (LLM) 기반의 생성형 에이전트가 전력 배분 및 경매 환경에서 인간의 의사결정을 모델링하기 위해 기존 수학적 모델의 경직성을 완화할 수 있음을 보여주는 초기 증거를 제시합니다.
이 논문은 비선형 시스템의 입력을 필수, 중복, 숙련도 입력으로 분류하고, 숙련도 입력을 비활성화하더라도 공통 동적 연장을 통해 축소된 작업에 대한 피드백 선형화를 유지하며 과도 현상 없이 작업을 유연하게 조정할 수 있는 통합 제어 프레임워크를 제안합니다.
이 논문은 경제 모델 예측 제어의 점근적 안정성을 보장하기 위해 기존 엄격한 소산성 조건을 대체하거나 보완할 수 있는 두 개의 저장 함수를 사용하는 새로운 '이중 저장 엄격한 소산성' 개념을 제안하고, 이를 최적 제어의 가치 함수와 직접적으로 연결하여 안정성 증명 및 검증의 용이성을 높이는 방법을 제시합니다.
이 논문은 정상 주기적 레이트 모노토닉 실시간 시스템에서 응답 시간의 중심극한을 역가우시안 혼합 분포로 근사하고, 이를 재매개변수화 및 적응형 기대값 최대화 알고리즘을 통해 추정함으로써 시스템의 실패율을 효과적으로 예측하는 방법을 제안하고 있습니다.
이 논문은 다중 UAV 운송 시스템의 정밀성과 강인성을 극대화하기 위해 H2 제어 기반의 새로운 강인성 지표를 도입하고, 페이로드 주변의 차량 배치와 제어기를 동시에 최적화하는 새로운 접근 방식을 제안하며 실험을 통해 검증했습니다.
이 논문은 불안정한 통신 링크를 가진 방향성 그래프에서 단일 비트 피드백 채널을 활용하여 모든 노드가 정확한 최대값을 유한 시간 내에 계산하고 자율적으로 수렴을 판단할 수 있는 새로운 분산 알고리즘인 DMaC 를 제안하고 그 수렴성을 증명합니다.
이 논문은 사전 훈련된 대규모 언어 모델 (LLM) 을 활용한 진화 알고리즘을 통해 파이썬과 같은 표준 프로그래밍 언어로 표현된 해석 가능한 제어 정책을 자동 생성하여, 블랙박스 신경망 기반 제어의 투명성 문제를 해결하고 인간이 쉽게 수정 및 적용할 수 있도록 하는 새로운 방법을 제안합니다.
이 논문은 잡음 분포에 대한 가정이 없는 에너지 제한 불확실 선형 시불변 시스템을 위해, 반정부규 프로그래밍을 활용하여 파라미터 추정 정확도를 보장하는 강인한 표적 탐색 전략을 제안합니다.
이 논문은 전력 시스템의 연쇄 고장을 예측하고 완화하기 위해 계산 복잡도를 줄이고 견고성을 높이는 모듈러 감시 제어 기법을 제안하며, MATLAB 시뮬레이션을 통해 IEEE 표준 시스템에서 그 유효성을 입증했습니다.
이 논문은 비선형 제어 시스템의 상태 확률 밀도를 제어하기 위해, 잡음 확산 과정을 통해 상태 공간을 탐색한 후 이를 목표 분포로 되돌리는 결정론적 역과정 (Denoising) 을 기반으로 한 피드백 제어 및 계획 프레임워크를 제안하고, 이를 통해 비선형 제어 문제를 밀도 제어의 완화 문제로 간주하여 해결하는 방법을 제시합니다.
이 논문은 내재적 실시간 최적화 문제를 해결하기 위해 이차 비용 함수를 직접 처리하고 문제 재형성 없이 희소성을 유지할 수 있는 맞춤형 2 차 원뿔 프로그래밍 (SOCP) 솔버와 이를 위한 코드 생성 도구를 제안하며, 임베디드 플랫폼에서의 벤치마크를 통해 기존 솔버보다 우수한 성능을 입증합니다.
이 논문은 전역 제어 필드를 가진 아날로그 양자 시뮬레이터가 보편적 양자 연산이 가능함을 이론적으로 증명하고, '직접 양자 최적 제어' 기법을 통해 실제 실험에서 3 체 상호작용 및 위상 동역학을 구현하여 양자 정보 처리의 새로운 가능성을 제시합니다.
이 논문은 희소성 장려 정규화를 통해 제어 성능과 작동 빈도를 균형 있게 조절하는 이벤트 기반 제어 프레임워크를 제안하며, 전진 시뮬레이션 (rollout) 알고리즘을 사용하여 계산 가능한 근사 해를 도출하고 주기적 제어 대비 성능 보장 및 폐루프 시스템 안정성을 이론적으로 증명합니다.
이 논문은 회전 대칭 제약 조건에 기반한 분산 형성 제어 전략을 제안하여 최소 연결성 ( 개의 에지) 으로만 다중 에이전트 시스템이 원하는 평면 대칭 구성을 달성하고, 가상 궤적을 따라 이동, 회전, 확대/축소가 가능한 기동 문제를 해결할 수 있음을 보여줍니다.
이 논문은 저전압 배전 시스템의 실시간 제어를 위해 가정 단위에서 예측 기반 유연성 집계 방법과 프라이버시 보호 중앙 최적화를 결합하여, 오프라인 분산 계산을 통해 유연성 차트를 생성하고 효율적인 시스템 관리를 가능하게 하는 새로운 방법을 제안하고 검증합니다.
이 논문은 통신 네트워크의 시간 지연 및 패킷 손실과 같은 스위칭 네트워크 동역학에 강인하며 지수 수렴 속도가 보장된 이산 시간 최적화 알고리즘의 분석과 합성을 선형 행렬 부등식과 Zames-Falb 필터를 활용하여 수행하고 그 유효성을 입증합니다.
이 논문은 시스템 이론적 관점에서 일반화 나시 균형 (GNE) 의 특성을 분석하여 엄격한 소산성 (dissipativity) 이 턴파이크 현상을 생성하고 그 역명제가 성립함을 증명하며, 이를 통해 게임 이론적 모델 예측 제어 (MPC) 의 재귀적 실현 가능성과 폐루프 안정성 분석의 기초를 마련합니다.
이 논문은 분산형 에너지 자원의 복잡한 선호도를 반영하면서도 프로슈머의 인지적 부담을 줄이기 위해, 기계 학습을 활용한 조합 시계 교환 방식을 도입하여 지역 에너지 시장의 선호도 수집을 간소화하고 효율적인 가격 수렴을 달성하는 새로운 시장 메커니즘을 제안합니다.
이 논문은 안전 보장을 유지하면서 선호도, 순위, 시연 데이터를 학습하기 위해 가중 신호 시계 논리 (WSTL) 기반의 최적화 기법을 제안하고, 이를 로봇 항법 및 포뮬러 1 데이터 실험을 통해 검증했습니다.