CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
2490 편의 논문
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
이 논문은 그래프 불변량을 예측하여 구조적 일반화 능력을 갖춘 그래프 기초 모델을 학습한 후, 이를 위치 인코딩으로 활용하여 도메인 간 일반화 성능을 극대화하는 'GraphProp'을 제안하고, 특히 노드 속성이 없는 그래프에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 긴 형식의 비디오 이해를 위해 기존 프레임 기반 접근법의 한계를 극복하고, LLM 을 활용한 능동적 메모리 에이전트가 쿼리 관련 순간을 식별하고 일관된 사건으로 그룹화하여 간결하고 신뢰할 수 있는 '이벤트 타임라인'을 생성하는 훈련 없는 프레임워크인 Video-EM 을 제안합니다.
이 논문은 시계열, 비전, 텍스트 등 다양한 모달리티의 인스턴스별 특성을 동적으로 반영하여 기존 시계열 기초 모델의 예측 성능을 향상시키는 파라미터 효율적인 프레임워크인 UniCast 를 제안합니다.
이 논문은 임의의 샘플링률과 가변 길이의 신호를 처리할 수 있는 새로운 파운데이션 모델 'ECHO'를 제안하여 기계 신호 이상 탐지 및 고장 분류 분야에서 최첨단 성능을 입증했습니다.
이 논문은 Lempel-Ziv 압축 기반의 엔트로피 주도 커리큘럼 학습과 보조 태스크 (거리 및 방향 예측) 를 통합한 프레임워크를 제안하여 인간 이동성 예측의 수렴 속도와 정확도를 획기적으로 향상시켰습니다.
이 논문은 학습 기반 제어기의 빠른 수행 능력과 안전 제어기의 충돌 회피 능력을 결합하여, 학습 데이터와 다른 지하 환경에서도 드론이 안전하게 임무를 완수할 수 있도록 환경 분포 이탈을 감지하는 런타임 모니터링 시스템을 제안합니다.
이 논문은 의존성 트리 기반의 구조적 정보와 분포 기반의 의미적 신호를 최적 수송 (Optimal Transport) 기법을 통해 통합하여, 기존 방법의 한계를 극복하고 다양한 벤치마크에서 최첨단 성능을 달성한 'OTESGN' 모델을 제안합니다.
이 논문은 YOLO 객체 감지 모델과 커스텀 차선 추정 알고리즘을 활용하여 외부 관측 기법으로 분산 및 음주 운전 등 비연결 차량의 위험 운전 행위를 실시간으로 분류하는 새로운 프레임워크를 제안하고 그 유효성을 검증합니다.
이 논문은 공개된 이미지와 주거 정보를 기반으로 생성형 AI 를 활용한 모듈식 다중 모달 파이프라인을 제시하여, 비용과 프라이버시 문제 없이 현실적인 건물 에너지 데이터 합성 및 접근성 있는 연구를 가능하게 합니다.
이 논문은 제한된 컴퓨팅 자원과 엄격한 프라이버시 제약 하에서도 실시간으로 작업 지시를 제공하고 안전성을 보장하기 위해 5 개의 역할 특화 에이전트와 적응형 단계 융합 (ASF) 기술을 활용한 새로운 멀티에이전트 산업 조율 어시스턴트 'MICA'를 제안하고 그 유효성을 검증합니다.
이 논문은 시각 - 모션 정책의 분포 변화에 대한 민감도를 줄이고 장기적 작업의 구성적 일반화 능력을 향상시키기 위해, 장면 그래프 기반 표현과 확산 기반 모방 학습을 결합한 새로운 기술 학습 프레임워크를 제안하고 이를 비전 - 언어 모델 기반 계획자와 통합하여 시뮬레이션 및 실제 환경에서 기존 방법보다 뛰어난 성공률을 입증했습니다.
이 논문은 단일 이미지로부터 고충실도 표면과 SDF 장을 수 초 내에 효율적으로 재구성하는 경량 프레임워크인 FINS 를 제안하여 기존 방법들의 한계를 극복하고 로봇 표면 추종 작업 등 다양한 응용 분야에 그 유효성을 입증합니다.
이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.
이 논문은 베이지안 설득 이론을 기반으로 대규모 언어 모델의 설득 능력을 평가하고 강화학습을 통해 전략적 설득을 훈련하는 프레임워크를 제시하며, 이를 통해 모델들이 인간 수준의 정교한 설득 전략을 습득하고 설득 효과를 크게 향상시킬 수 있음을 입증합니다.
이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.
이 논문은 다양한 LLM 과 벤치마크의 성능 상관관계를 넘어, 실제 데이터의 토큰 퍼플렉시티를 기반으로 벤치마크 간의 중첩과 용량 요구 사항을 정밀하게 분석하는 '벤치마크 시그니처'를 제안하여 벤치마크 유효성과 LLM 능력의 지리적 구조에 대한 새로운 통찰을 제공합니다.
이 논문은 LLM 기반의 다중 에이전트 협업 시스템이 장기 계획의 적응성과 효율성 사이의 균형을 달성하기 위해 하위 목표 의도에 명시적으로 바인딩된 '액션 체인'을 기반으로 한 새로운 프레임워크인 ELHPlan 을 제안하며, 기존 최첨단 방법 대비 토큰 소비를 30~40% 로 줄이면서 동등한 작업 성공률을 달성함을 보여줍니다.
이 논문은 사전 정보 없이 시작되는 콜드스타트 상황에서의 능동적 상관관계 클러스터링 문제를 해결하기 위해, 초기 단계에서 다양성을 촉진하는 커버리지 인식 방법을 제안하고 그 유효성을 실험을 통해 입증합니다.
이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.