Geometry-Aware Probabilistic Circuits via Voronoi Tessellations
이 논문은 확률적 회로 (PC) 의 데이터 매니폴드 국소 기하학적 구조를 포착하기 위해 보로노이 테셀레이션을 도입하되, 이로 인한 계산 복잡성 문제를 해결하기 위해 근사 추론 프레임워크와 정확한 추론이 가능한 구조적 조건을 제안하고 미분 가능한 완화 기법을 통해 학습을 가능하게 합니다.
2315 편의 논문
이 논문은 확률적 회로 (PC) 의 데이터 매니폴드 국소 기하학적 구조를 포착하기 위해 보로노이 테셀레이션을 도입하되, 이로 인한 계산 복잡성 문제를 해결하기 위해 근사 추론 프레임워크와 정확한 추론이 가능한 구조적 조건을 제안하고 미분 가능한 완화 기법을 통해 학습을 가능하게 합니다.
이 논문은 다양한 센서 설정에 걸쳐 일반화 가능한 언어 정렬 표현을 학습하기 위해 대조적 정렬과 센서 조건부 캡션링을 통합하고, 사전 학습된 언어 모델을 활용하여 재학습 없이도 가변적인 시간 해상도와 입력 길이를 지원하는 오픈 소스 프레임워크인 SLIP을 제안합니다.
이 논문은 전역적 저차원 가정이 실세계 네트워크의 국소적 구조를 왜곡하는 문제를 해결하기 위해 가중치 스펙트럼 분해를 기반으로 한 '국소 인접 스펙트럼 임베딩 (LASE)'을 제안하고, 이를 통해 국소적 저차원 구조를 효과적으로 포착하며 UMAP-LASE 를 통해 고충실도 전역 시각화를 가능하게 함을 보여줍니다.
이 논문은 표현 학습 모델의 안정성을 통계적 및 구조적 식별 가능성으로 구분하여 정의하고, 비선형 디코더를 가진 모델의 중간 표현에 대한 근사 식별 가능성 이론을 정립한 뒤 독립성분분석 (ICA) 을 적용함으로써 데이터의 잠재 요인을 효과적으로 분리하고 하류 작업의 일반화 성능을 향상시키는 실용적인 방법을 제시합니다.
이 논문은 함수 공간 간의 비선형 연산자 근사를 위한 DeepONet 아키텍처를 국소 볼록 공간으로 확장하고, 연속 선형 함수를 활용한 위상적 DeepONet 을 구성하여 고전적인 Chen-Chen 정리를 일반화하는 것을 증명합니다.
이 논문은 데이터 재사용으로 인한 상관관계를 고려한 새로운 평균 안정성 분석 기법을 개발하여, 다중 패스 전처리 SGD 의 일반화 성능을 유효 차원과 연결하고 부적절한 전처리 행렬이 최적화 및 일반화 모두에서 비최적의 성능을 초래할 수 있음을 증명합니다.
이 논문은 NLI 기반 크로스-인코더, 임베딩 모델, 리랭커, 그리고 지시 튜닝 LLM 등 다양한 아키텍처의 제로샷 텍스트 분류 능력을 공정하게 평가하기 위해 22 개의 데이터셋으로 구성된 벤치마크 'BTZSC'를 제안하고, 현대 리랭커가 새로운 최첨단 성능을 달성했으며 임베딩 모델이 정확도와 지연 시간 간 최적의 균형을 보인다는 결과를 제시합니다.
이 논문은 수천 명의 클라이언트를 효율적으로 지원하기 위해 개의 개별 모델 대신 개의 공유 서버 모델을 최적화하는 'Few-for-Many' 프레임워크를 제안하고, 이를 통해 자동적으로 모델 다양성을 발견하며 기존 최첨단 방법보다 뛰어난 개인화 성능을 달성하는 'FedFew' 알고리즘을 제시합니다.
이 논문은 중앙 집중식 제약을 극복하고 도메인 간 자율성을 보장하는 탈중앙화 오케스트레이션 아키텍처를 제안하며, 이를 통해 비잔틴 위협 하에서도 안전한 다중 도메인 분산 연합 학습 (DFL) 을 가능하게 하는 FU-HST 기법을 제시하고 있습니다.
이 논문은 파라미터 및 예측 불확실성을 동시에 고려하는 비선형 확률적 동적 시스템 모델링을 위해 MLP, MPNN, AE 기반의 특징 추출 모듈과 LSTM 을 결합한 세 가지 메타모델링 프레임워크를 제안하고, 이를 Bouc-Wen 시스템 및 37 층 강철 모멘트 저항 골조 사례를 통해 검증하여 낮은 예측 오차와 신뢰도 있는 불확실성 정량화 능력을 입증했습니다.
이 논문은 사이버-물리 시스템 (CPS) 의 복잡한 모델링 과정을 자동화하고 모듈성 및 사용성을 강화하기 위해 다양한 학습 전략과 평가 지표를 통합한 데이터 기반 프레임워크 'Flowcean'을 제안합니다.
이 논문은 리만 최적화 기반의 공간 분해 알고리즘을 통해 단위 행렬 곱 상태 (Unitary MPS) 의 효율성과 표현력을 극대화하여 고차원 확률 분포 모델링 성능을 향상시키는 새로운 생성 모델링 프레임워크를 제안합니다.
이 논문은 확장성, 상황 인식, 그리고 스트레스에 따른 적응적 의사결정을 위해 그래프 신경망과 다중 에이전트 강화 학습을 결합한 AGMARL-DKS 를 제안하여 기존 쿠버네티스 스케줄러의 한계를 극복하고 워크로드 배치 및 핵심 업무 처리 시 내결함성, 자원 활용도, 비용 효율성을 크게 향상시켰음을 보여줍니다.
이 논문은 사전 데이터 적합 네트워크 (PFN) 기반의 인과 추론이 사전분포로 인한 편향으로 인해 빈도주의적 일관성을 결여할 수 있음을 지적하고, 마팅갈 사후분포를 활용한 일단계 사후 보정 (OSPC) 기법을 도입하여 PFN 의 불확실성 정량화가 점근적으로 빈도주의 추정량과 일치하도록 보정하는 방법을 제안합니다.
이 논문은 문장 내 주의 지원이 안정적으로 유지된다는 관찰을 바탕으로, 기존 체크포인트를 재학습 없이 적용하여 긴 문맥과 추론 작업에서 1.6 배에서 14.4 배까지 추론 처리량을 향상시키면서도 품질을 유지하는 'Slow-Fast Inference'라는 새로운 추론 가속 프레임워크를 제안합니다.
이 논문은 사전 학습된 비전 - 언어 모델의 지속적 학습에서 발생하는 catastrophic forgetting 문제를 해결하기 위해, 새로운 작업에 대한 적응 과정에서 기존 시맨틱 - 기하학적 구조를 보존하는 'SeGP-CL'이라는 새로운 방법을 제안하고 다양한 벤치마크에서 최첨단 성능을 입증합니다.
이 논문은 은닉층이 없는 화학 반응 네트워크가 은닉층이 필요한 스파이킹 신경망보다 분류 작업을 더 정확하게 효율적으로 학습할 수 있음을 수학적으로 증명하고 실험을 통해 검증함으로써, 화학적 컴퓨터의 기계 학습 가능성과 생물학적 세포의 학습 효율성을 설명합니다.
이 논문은 전사 인자 (TF) 결합 부위 예측을 단일 TF 가 아닌 다중 레이블 분류 문제로 접근하여 시계열 합성곱 네트워크 (TCN) 를 활용함으로써 TF 간 상호작용과 협력적 조절 메커니즘을 포착하고 생물학적으로 유의미한 결합 패턴을 규명하는 새로운 프레임워크를 제시합니다.
이 논문은 소스 도메인과 타겟 도메인의 상태 및 행동 공간 불일치와 부정적 전이 문제를 해결하기 위해 교차 도메인 벨만 일관성과 하이브리드 크리틱을 결합한 'QAvatar' 알고리즘을 제안하고, 이를 통해 다양한 강화학습 벤치마크에서 효율적인 지식 전이가 가능함을 입증합니다.
이 논문은 피드백 메모리와 이중 LLM 전략을 활용하여 단일 소비자용 GPU 에서만 실행 가능한 자원 효율적인 반복형 신경망 구조 탐색 (NAS) 파이프라인을 제안하며, 대규모 클라우드 인프라 없이도 이미지 분류 성능을 크게 향상시킵니다.