Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization
본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 차 유한 차분을 기반으로 한 FSA- 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.
7510 편의 논문
본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 차 유한 차분을 기반으로 한 FSA- 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.
이 논문은 대규모 실험을 통해 LLM 기반 에이전트의 행동 추론에서 동기 (motivations) 는 거의 완벽하게 추론 가능하지만 신념 체계 (belief systems) 는 구조적 한계로 인해 정확도가 50% 미만으로 제한되는 근본적인 비대칭성이 존재함을 규명했습니다.
이 논문은 공개된 이미지와 주거 정보를 기반으로 생성형 AI 를 활용한 모듈식 다중 모달 파이프라인을 제시하여, 비용과 프라이버시 문제 없이 현실적인 건물 에너지 데이터 합성 및 접근성 있는 연구를 가능하게 합니다.
이 논문은 희소 데이터에서도 재학습 없이 3D 광음향 단층촬영 (PACT) 의 원시 센서 데이터로부터 직접 고품질 3D 영상을 생성하는 물리 인식 신경 연산자 'PANO'를 제안하여, 기존 알고리즘보다 우수한 성능과 실시간 추론을 가능하게 함으로써 임상 적용을 위한 새로운 길을 제시합니다.
이 논문은 딥러닝과 동적 입력 컨덕턴스 (DIC) 프레임워크를 결합하여 스파이크 타이밍만으로 이온 채널 전도도의 다양한 조합으로 구성된 퇴화 신경 집단 (degenerate populations) 을 밀리초 단위로 빠르고 정확하게 재구성하는 새로운 방법을 제시합니다.
이 논문은 제한된 컴퓨팅 자원과 엄격한 프라이버시 제약 하에서도 실시간으로 작업 지시를 제공하고 안전성을 보장하기 위해 5 개의 역할 특화 에이전트와 적응형 단계 융합 (ASF) 기술을 활용한 새로운 멀티에이전트 산업 조율 어시스턴트 'MICA'를 제안하고 그 유효성을 검증합니다.
이 논문은 대규모 시각-언어 모델 (LVLM) 이 비일관적인 맥락에서 객체 인식에 실패하는 문제를 해결하기 위해 'ORIC' 프레임워크와 벤치마크를 제안하고, 이를 통해 모델의 신뢰성을 향상시키는 방법을 제시합니다.
이 논문은 부분 관측 환경에서 최대 안전 집합을 근사하고 엄격한 안전 보장을 제공하는 관측 조건부 잔류 신경 제어 장벽 함수 (ORN-CBF) 를 제안하며, 하밀토니안-야코비 접근법과 하이퍼네트워크 아키텍처를 활용하여 시뮬레이션 및 실제 로봇 실험에서 기존 방법보다 우수한 안전성과 일반화 성능을 입증했습니다.
이 논문은 유한 상태 공간에서 의사 스펙트럼 갭에 대한 경험적 상한을 도출하여, 기존 이론적 상수 의존성을 제거한 마르코프 체인을 위한 최초의 완전 경험적 PAC-Bayes 경계를 제시합니다.
이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.
이 논문은 엣지-희소 이분 지식 그래프의 링크 예측 성능을 향상시키기 위해 기존 엣지만을 재샘플링하거나 의미적 KNN 을 활용한 데이터 증강 프레임워크인 AEGIS 를 제안하고, 다양한 희소성 환경에서 이 방법이 기존 베이스라인 대비 성능과 보정력을 개선함을 입증합니다.
이 논문은 텍스트 및 이미지와 같은 모달리티 정보를 활용하여 도메인 간 일반화 능력을 갖춘 범용 생성형 멀티모달 시계열 예측 모델 'Aurora'를 제안하고, 다양한 벤치마크에서 최첨단 성능을 입증합니다.
이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.
이 논문은 웨어러블 센서 기반의 인간 활동 인식에서 새로운 사용자의 데이터로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 자기지도 학습 트랜스포머와 지식 증류 기반 CNN 을 결합한 CLAD-Net 을 제안하고, 제한된 라벨 데이터 환경에서도 기존 방법들보다 뛰어난 성능과 낮은 망각률을 보임을 입증합니다.
이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.
이 논문은 임의의 치환 대칭군에 적용 가능한 새로운 프레임워크인 함수 공유 KAN(FS-KAN) 을 제안하여, 기존 파라미터 공유 네트워크의 표현력 이론을 확장하면서도 데이터 효율성과 해석 가능성을 크게 향상시켰음을 보여줍니다.
이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.
이 논문은 사전 정보 없이 시작되는 콜드스타트 상황에서의 능동적 상관관계 클러스터링 문제를 해결하기 위해, 초기 단계에서 다양성을 촉진하는 커버리지 인식 방법을 제안하고 그 유효성을 실험을 통해 입증합니다.
이 논문은 동적 경매 환경에서 소액 광고 캠페인의 예산 조절을 위해 히스테리시스와 비례 피드백을 결합한 제어 이론 기반의 안정적이고 적응적인 pacing 알고리즘을 제안하며, 이를 통해 기존 방법 대비 pacing 오차를 13%, -변동성을 54% 감소시키는 효과를 입증했습니다.
이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.