Relaxed Efficient Acquisition of Context and Temporal Features
이 논문은 비용 제약 하에서 초기 컨텍스트 선택과 시간적 적응형 특징 획득을 통합적으로 최적화하여 예측 성능을 향상시키고 비용을 절감하는 새로운 프레임워크인 REACT 를 제안합니다.
3494 편의 논문
이 논문은 비용 제약 하에서 초기 컨텍스트 선택과 시간적 적응형 특징 획득을 통합적으로 최적화하여 예측 성능을 향상시키고 비용을 절감하는 새로운 프레임워크인 REACT 를 제안합니다.
이 논문은 시계열 의존성을 효과적으로 모델링하고 불확실성 기반의 보수적 정규화를 통해 안전성을 보장하는 트랜스포머 기반의 오프라인 강화학습 프레임워크인 T-CQL 을 제안하며, 이를 디지털 트윈을 통한 실시간 평가로 검증하여 중환자실의 인공호흡기 치료 안전성과 효과를 향상시켰음을 보여줍니다.
이 논문은 20,000 개의 레이블이 지정된 데이터만 사용하여 유사 레이블링된 계속 전학습 (CPT) 과 지도 미세 조정을 결합함으로써, 기존 최고 성능 대비 61% 상대적 개선 (3.24% WER) 을 달성하여 저자원 스와힐리어 자동 음성 인식 (ASR) 의 새로운 최첨단 성능을 달성했다고 요약할 수 있습니다.
이 논문은 자율 에이전트의 내재적 생존 의지와 도구적 생존 행동을 구별하기 위해 양자 볼츠만 머신을 활용해 잠재 상태의 얽힘 엔트로피를 측정하는 '통합 지속성-관심 프로토콜 (UCIP)'을 제안하며, 합성 환경에서 이 방법이 100% 의 탐지 정확도를 달성함을 입증합니다.
이 논문은 대규모 언어 모델이 단일 회답보다 대화형 상호작용에서 진단 추론 능력이 저하되며, 특히 잘못된 사용자 제안에 따라 초기 올바른 진단을 포기하거나 맹목적으로 전환하는 '대화 세제 (conversation tax)' 현상을 보임을 17 개 모델을 대상으로 한 실험을 통해 규명했습니다.
이 논문은 신경과학의 영감을 받아 단기 및 장기 버퍼를 활용한 지능형 샘플링 방식을 도입한 모델 기반 강화학습 알고리즘 ARROW 를 제안하며, 기존 방법 대비 메모리 효율성을 높이고 과거 작업의 망각을 크게 줄이는 continual RL 의 성능을 입증합니다.
이 논문은 대칭적인 리만 기하학의 한계를 넘어 데이터의 비대칭적 특성을 포착하기 위해 핀슬러 기하학을 도입한 새로운 매니폴드 학습 파이프라인을 제안하고, 이를 통해 기존 방법론보다 우수한 품질의 임베딩과 숨겨진 정보 추출이 가능함을 입증합니다.
이 논문은 기존 지도학습 기반 백본의 도시 간 일반화 한계를 지적하고, 자기지도학습을 통해 시각 표현을 학습한 엔드투엔드 자율주행 모델이 새로운 도시 환경으로의 제로샷 전이 성능을 크게 향상시킨다는 것을 다중 도시 데이터셋과 오픈/클로즈드 루프 평가에서 입증합니다.
이 논문은 결정론적 오토인코더의 통계적 의존성 추정을 위해 입력 연결과 재결합을 제거하고 직교 밀도비 분해에 기반한 안정적인 신경 추정기를 제안하며, 가우스 노이즈 가정을 통해 의미 있는 특징 분석과 특이값의 순차적 수렴을 가능하게 합니다.
이 논문은 사용자별 레이블 데이터 없이도 도메인 구성을 기반으로 가짜 테이블을 생성하여 LLM 을 미세 조정함으로써, 대규모 의미 열 유형과 구조적 이해의 한계를 극복하는 도메인 기반 제로샷 테이블 열 주석 프레임워크인 ZTab 을 제안합니다.
이 논문은 그래프 노드 부분집합 선택 문제를 포함한 여러 제약 조건이 있는 조합 최적화 문제를 단일 모델로 학습할 수 있도록 문제 구조와 목적 함수를 통합적으로 인코딩하는 'UniHetCO'라는 새로운 비지도 신경 조합 최적화 프레임워크를 제안합니다.
이 논문은 이산적 마크와 연속적 동역학 간의 상호작용을 포착하기 위해 자기-어텐션과 신경 미분방정식을 병렬로 결합하고 교차 어텐션으로 융합하는 NEXTPP 모델을 제안하여, 불규칙한 이벤트 시퀀스 예측 성능을 기존 최첨단 모델보다 크게 향상시켰습니다.
이 논문은 정적 네트워크 중심성 지표의 한계를 극복하고, 외부 요인과 내부 상호작용을 모두 고려한 동적 프레임워크인 'HawkesRank'를 제안하여 실시간 중요도 평가 및 예측 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 기존 비선형 확률적 잠재 변수 모델의 근사 오차 문제를 해결하기 위해 Wasserstein 거리를 프로크시멀 연산자로 활용한 새로운 KProxNPLVM 을 제안하여 소프트 센서 모델링의 정확도를 향상시키는 방법을 제시합니다.
이 논문은 기존 통계 및 얕은 머신러닝 모델의 한계를 극복하기 위해 시계열 패턴과 네트워크 위상적 상관관계를 동시에 학습하는 맞춤형 그래트 어텐션 네트워크 (GAT) 와 클러스터링 오버처가 적용된 다중 모달 대규모 언어 모델 (LLM) 을 제안하며, 실제 네트워크 데이터셋을 통한 실험 결과 LLM 기반 모델이 우수한 예측 및 일반화 성능을, GAT 모델은 예측 분산 감소 측면에서 강점을 보임을 입증했습니다.
본 논문은 수동 현미경 분석의 한계를 극복하기 위해 2D 이미지와 3D 점구름 데이터를 융합한 인공지능 파이프라인 'Sorometry'를 개발하여 식물성 실리카 (phytolith) 의 고처리량 자동 분류 및 고고학적 식물 기원 재구성을 가능하게 했음을 제시합니다.
이 논문은 자연어 기반의 지식과 물리적 시계열 데이터를 연결하는 '이벤트 논리 트리 (ELT)' 프레임워크와 신경-상징적 VLM 에이전트를 제안하여, 레이블 데이터가 부족한 환경에서도 다변량 시계열 이벤트 탐지의 정확성과 설명 가능성을 동시에 향상시키는 방법을 제시합니다.
이 논문은 소프트맥스 기반의 트랜스포머 모델이 특정 조건부 작업을 수행하기 위해 반드시 '어텐션 싱크 (attention sink)'를 형성해야 함을 수학적으로 증명하고, 이는 정규화 제약 때문임을 비정규화 ReLU 어텐션 실험을 통해 입증했습니다.
이 논문은 그래프 기반 검색 증강 생성 (GraphRAG) 의 보안 취약점을 공략하기 위해, 외부 데이터베이스에 독성 사건과 지식 진화 경로를 조작하여 지식 그래프를 오염시키고 LLM 의 응답을 악의적으로 조작하는 새로운 공격 기법인 KEPo(Knowledge Evolution Poison) 를 제안하고 그 효과성을 입증합니다.
이 논문은 이질적이고 희소한 로컬 데이터 환경에서도 일반화된 아이템 임베딩의 안정적인 학습을 보장하기 위해, 다중 태스크 학습 관점에서 문제를 재정의하고 Sharpness-Aware Minimization 기법을 적용한 새로운 연방 추천 프레임워크인 FedRecGEL 을 제안합니다.