Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

이 논문은 제어 장벽 함수와 미분 가능 최적화를 기반으로 한 데이터 중심 접근법을 통해 다중 에이전트 상호작용에서 안전성을 보장하기 위해 에이전트가 얼마나 자신의 행동을 조정하는지 (책임 할당) 를 학습하고 해석 가능한 정량적 통찰을 제공하는 방법을 제시합니다.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

이 논문은 라벨이 없는 고장 데이터를 기반으로 잠재 고장 모드를 식별하고 정보성 센서를 선택하여 심우주 서식지의 잔여 수명을 예측하는 새로운 비지도 예지 프레임워크를 제안하고, 이를 시뮬레이션 및 NASA C-MAPSS 벤치마크를 통해 기존 방법보다 향상된 정확도로 검증했습니다.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Dampening parameter distributional shifts under robust control and gain scheduling

이 논문은 비선형 시스템에서 제어 적용으로 인한 모델 파라미터 분포의 변화를 완화하기 위해 학습 데이터와 일관된 폐루프 시스템을 설계하고, 이를 통해 발생하는 분포 이동을 억제하는 방법을 제안하며, 이를 효율적인 반양정 계획법 (SDP) 으로 해결하고 이득 스케줄링 문제에 적용하여 검증합니다.

Mohammad Ramadan, Mihai AnitescuWed, 11 Ma⚡ eess

Verifying Nonlinear Neural Feedback Systems using Polyhedral Enclosures

이 논문은 비선형 신경 피드백 시스템의 안전성을 보장하기 위해 비선형 전이 함수 구조를 활용한 정밀한 다면체 포락선을 계산하고 이를 혼합 정수 선형 계획법 (MILP) 으로 인코딩하여 기존 방법보다 한 자릿수 이상 향상된 성능으로 도달 집합을 추론하는 새로운 알고리즘을 제안합니다.

I. Samuel Akinwande, Chelsea Sidrane, Mykel J. Kochenderfer, Clark BarrettWed, 11 Ma⚡ eess

CONQURE: A Co-Execution Environment for Quantum and Classical Resources

이 논문은 양자 가속기를 위한 오픈소스 소프트웨어 인프라가 부족하다는 문제를 해결하기 위해, 오픈MP 양자 커널을 양자 처리 장치 (QPU) 에 원활하게 오프로딩하고 결과를 고전 컴퓨팅 환경으로 되돌려주며 양자 자원을 효율적으로 스케줄링하는 통합 실행 환경 'CONQURE'를 제안하고 그 유효성을 검증합니다.

Atulya Mahesh, Swastik Mittal, Frank MuellerWed, 11 Ma⚛️ quant-ph

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

이 논문은 비선형 시변 시스템의 제어에서 심층 강화학습 (DRL) 의 성능을 극대화하고 시간 변화에 대한 강인성을 확보하기 위해, DRL 과 경계 극값 탐색 (ES) 을 결합한 하이브리드 제어기 개발과 그 유효성을 수치 시뮬레이션 및 로스 알라모스 중성자 과학 센터의 입자가속기 빔 수송 시스템 자동 튜닝 사례를 통해 입증했습니다.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander ScheinkerWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

이 논문은 이질적인 다중 에이전트 환경에서 에이전트 간 유사도 (affinity) 에 기반한 편향 및 중요도 보정 메커니즘을 통해 독립 학습 대비 샘플 복잡도를 줄이면서도 개인화와 협업의 이점을 자동으로 조절하는 'AffPCL' 프레임워크를 제안하고, 이질성이 높은 상황에서도 선형 속도 향상을 달성할 수 있음을 이론적으로 증명합니다.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

IMAS2^2: Joint Agent Selection and Information-Theoretic Coordinated Perception In Dec-POMDPs

이 논문은 분산 부분 관측 마르코프 결정 과정 (Dec-POMDP) 환경에서 상호 정보량을 기반으로 한 정보 이론적 목적 함수의 단조 서브모듈러 성질을 활용하여, 감지 에이전트 선정과 협력적 감지 정책 생성을 동시에 최적화하는 IMAS2^2 알고리즘을 제안하고 (11/e)(1-1/e) 성능 보장을 증명합니다.

Chongyang Shi, Wesley A. Suttle, Michael Dorothy, Jie FuWed, 11 Ma⚡ eess

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

이 논문은 확산 정책 (Diffusion Policies) 의 학습 분포를 유지하면서 실시간으로 안전성을 보장하기 위해 경로 일관성 기반의 안전 필터링 (PACS) 을 제안하며, 이를 통해 기존 안전 기법 대비 작업 성공률을 크게 향상시키고 동적 환경에서 공식적인 안전 보장을 달성함을 보여줍니다.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Do Spatial Descriptors Improve Multi-DoF Finger Movement Decoding from HD sEMG?

이 연구는 고밀도 표면 근전도 (HD sEMG) 를 이용한 다자유도 손가락 움직임 해독에서 공간 기술자 (MLD-BFM) 가 기존 시간 영역 특징보다 통계적으로 유의미한 성능 향상을 보이지는 않았으나, 차원 축소 방법보다 공간 해상도를 유지하는 것이 더 중요함을 확인했습니다.

Ricardo Gonçalves Molinari, Leonardo Abdala EliasWed, 11 Ma🤖 cs.LG

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI