CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
7557 편의 논문
이 논문은 Gaussian Process 커널 조합과 구조적 인과 모델을 결합하여 현실적인 인과적 특성을 가진 합성 시계열 데이터를 생성함으로써, 실제 대규모 데이터에 의존하지 않고도 효율적으로 시계열 기초 모델을 사전 학습할 수 있는 'CauKer' 알고리즘을 제안합니다.
이 논문은 그래프 불변량을 예측하여 구조적 일반화 능력을 갖춘 그래프 기초 모델을 학습한 후, 이를 위치 인코딩으로 활용하여 도메인 간 일반화 성능을 극대화하는 'GraphProp'을 제안하고, 특히 노드 속성이 없는 그래프에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 순환 신경망의 게이트 메커니즘이 상태 공간의 시간 척도와 매개변수 공간의 역학을 결합하여 고정된 학습률에서도 방향과 지연에 의존하는 유효 학습률을 생성하고, 이를 통해 최적화 과정을 데이터 기반의 전처리기로 작용하게 하여 훈련 안정성을 확보한다는 것을 보여줍니다.
이 논문은 임의의 샘플링률과 가변 길이의 신호를 처리할 수 있는 새로운 파운데이션 모델 'ECHO'를 제안하여 기계 신호 이상 탐지 및 고장 분류 분야에서 최첨단 성능을 입증했습니다.
이 논문은 다중 에이전트 간의 국소 내쉬 균형 상호작용 데이터를 기반으로 혼합 정수 선형 프로그래밍을 통해 제약 조건을 학습하고, 이를 통해 안전하고 견고한 운동 계획을 수립하는 역동적 게임 기반 알고리즘을 제안합니다.
이 논문은 조건부 잠재 확산 모델 (CbLDM) 을 제안하여 원자 쌍 분포 함수 (PDF) 로부터 단금속 나노입자의 나노구조를 물리적으로 타당하게 복원하는 새로운 접근법을 제시합니다.
이 논문은 Lempel-Ziv 압축 기반의 엔트로피 주도 커리큘럼 학습과 보조 태스크 (거리 및 방향 예측) 를 통합한 프레임워크를 제안하여 인간 이동성 예측의 수렴 속도와 정확도를 획기적으로 향상시켰습니다.
이 논문은 보험료 산정을 위한 합성 데이터 생성 기법으로 심층 생성 모델 (VAE, CTGAN) 과 비교하여 다변량 연쇄 방정식 (MICE) 기반 방법이 변수 분포와 다변량 관계를 잘 보존하면서도 구현이 용이하고 GLM 모델 성능 향상에 효과적임을 입증했습니다.
본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 차 유한 차분을 기반으로 한 FSA- 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.
이 논문은 대규모 실험을 통해 LLM 기반 에이전트의 행동 추론에서 동기 (motivations) 는 거의 완벽하게 추론 가능하지만 신념 체계 (belief systems) 는 구조적 한계로 인해 정확도가 50% 미만으로 제한되는 근본적인 비대칭성이 존재함을 규명했습니다.
이 논문은 공개된 이미지와 주거 정보를 기반으로 생성형 AI 를 활용한 모듈식 다중 모달 파이프라인을 제시하여, 비용과 프라이버시 문제 없이 현실적인 건물 에너지 데이터 합성 및 접근성 있는 연구를 가능하게 합니다.
이 논문은 희소 데이터에서도 재학습 없이 3D 광음향 단층촬영 (PACT) 의 원시 센서 데이터로부터 직접 고품질 3D 영상을 생성하는 물리 인식 신경 연산자 'PANO'를 제안하여, 기존 알고리즘보다 우수한 성능과 실시간 추론을 가능하게 함으로써 임상 적용을 위한 새로운 길을 제시합니다.
이 논문은 딥러닝과 동적 입력 컨덕턴스 (DIC) 프레임워크를 결합하여 스파이크 타이밍만으로 이온 채널 전도도의 다양한 조합으로 구성된 퇴화 신경 집단 (degenerate populations) 을 밀리초 단위로 빠르고 정확하게 재구성하는 새로운 방법을 제시합니다.
이 논문은 제한된 컴퓨팅 자원과 엄격한 프라이버시 제약 하에서도 실시간으로 작업 지시를 제공하고 안전성을 보장하기 위해 5 개의 역할 특화 에이전트와 적응형 단계 융합 (ASF) 기술을 활용한 새로운 멀티에이전트 산업 조율 어시스턴트 'MICA'를 제안하고 그 유효성을 검증합니다.
이 논문은 대규모 시각-언어 모델 (LVLM) 이 비일관적인 맥락에서 객체 인식에 실패하는 문제를 해결하기 위해 'ORIC' 프레임워크와 벤치마크를 제안하고, 이를 통해 모델의 신뢰성을 향상시키는 방법을 제시합니다.
이 논문은 부분 관측 환경에서 최대 안전 집합을 근사하고 엄격한 안전 보장을 제공하는 관측 조건부 잔류 신경 제어 장벽 함수 (ORN-CBF) 를 제안하며, 하밀토니안-야코비 접근법과 하이퍼네트워크 아키텍처를 활용하여 시뮬레이션 및 실제 로봇 실험에서 기존 방법보다 우수한 안전성과 일반화 성능을 입증했습니다.
이 논문은 유한 상태 공간에서 의사 스펙트럼 갭에 대한 경험적 상한을 도출하여, 기존 이론적 상수 의존성을 제거한 마르코프 체인을 위한 최초의 완전 경험적 PAC-Bayes 경계를 제시합니다.
이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.
이 논문은 엣지-희소 이분 지식 그래프의 링크 예측 성능을 향상시키기 위해 기존 엣지만을 재샘플링하거나 의미적 KNN 을 활용한 데이터 증강 프레임워크인 AEGIS 를 제안하고, 다양한 희소성 환경에서 이 방법이 기존 베이스라인 대비 성능과 보정력을 개선함을 입증합니다.
이 논문은 텍스트 및 이미지와 같은 모달리티 정보를 활용하여 도메인 간 일반화 능력을 갖춘 범용 생성형 멀티모달 시계열 예측 모델 'Aurora'를 제안하고, 다양한 벤치마크에서 최첨단 성능을 입증합니다.