Deep reinforcement learning with spatial and temporal awareness for active boundary control of buoyancy-driven convection
본 논문은 합성곱 신경망, 순환 메모리, 오프-폴리시(off-policy) 학습, 그리고 행동 매끄러움 제약 조건을 통합함으로써 기존 방법들의 퇴화된 구동 문제를 극복하는 심층 강화 학습 프레임워크를 제안하며, 전체 영역 데이터 증강 없이도 레이일리-베나르 대류에서의 유의미한 열 전달 감소와 이중 확산 대류에서의 적응형 혼합 향상을 성공적으로 달성한다.