Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases
이 논문은 관계형 데이터베이스의 불균형 문제를 해결하기 위해 이웃 메시지 조절을 위한 관계별 게이트 제어기와 관계 일관성을 유지하는 과표본화 합성기를 도입한 'Rel-MOSS'를 제안하고, 다양한 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증합니다.
11604 편의 논문
이 논문은 관계형 데이터베이스의 불균형 문제를 해결하기 위해 이웃 메시지 조절을 위한 관계별 게이트 제어기와 관계 일관성을 유지하는 과표본화 합성기를 도입한 'Rel-MOSS'를 제안하고, 다양한 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증합니다.
이 논문은 소스 및 타겟 도메인 간의 동적 특성에 대한 사이드 정보를 통합하여 제약 조건을 가진 추정을 통해 추정 중심의 불확실성 집합을 구축함으로써, 환경 변화 하에서 과도한 보수성을 완화하고 표본 효율성을 향상시킨 강건한 전이 학습 프레임워크를 제안합니다.
이 논문은 의료 데이터 거버넌스를 위해 SQL 기반 메트릭 정의의 잠재적 프라이버시 위험을 사전에 평가하고 설명 가능한 위험 점수를 부여하여 통계적 유출을 방지하는 AI 기반 프레임워크를 제안합니다.
이 논문은 태풍, 팬데믹, 올림픽과 같은 대규모 사회적 사건을 반영한 이동성 데이터셋을 최초로 구축하고, Fuzzy-Trace 이론을 기반으로 습관적 패턴과 사건 제약 사이의 경쟁적 논리를 추출하여 정렬하는 자기 정렬 LLM 프레임워크 'ELLMob'을 제안함으로써 기존 방법론의 한계를 극복하고 사건에 대응하는 인간 이동성 생성의 정확도를 획기적으로 향상시켰습니다.
이 논문은 강화 학습을 활용하여 복잡한 매듭 다이어그램을 단순화하는 파이프라인을 개발하고, 이를 통해 매우 어려운 매듭과 매듭의 unknotting number 상한을 3 으로 재확인한 연구 결과를 제시합니다.
이 논문은 물리 법칙을 아키텍처에 직접 통합하여 제한된 컴퓨팅 자원을 가진 항공기에서 실시간 난기류 강도를 정확하게 추정할 수 있는 경량 모델인 PSTNet 을 제안하고, 이를 통해 기존 방법 대비 성능을 향상시켰음을 입증합니다.
이 논문은 고차원 제약 조건 하에서 차원의 저주를 극복하고 기존 전역 베이지안 최적화보다 다항식적으로 우수한 수렴 속도를 보장하는 새로운 프레임워크인 '국소 제약 베이지안 최적화 (LCBO)'를 제안하고, 100 차원 이상의 벤치마크에서 최첨단 기법들을 능가하는 성능을 입증합니다.
이 논문은 희소 활성화와 공유 전문가를 결합한 요소별 라우팅 기반의 비선형 전문가 혼합 (MoE) 아키텍처를 제안하여 분자 간 상호작용 모델링의 정확도를 획기적으로 향상시키고, 주기율표 경향에 부합하는 화학적으로 해석 가능한 전문가 전문화를 입증했습니다.
이 논문은 법률, 금융, 산업, 의료, 자연과학 등 5 개 전문 분야의 400 개 전문가 큐레이션 과제를 포함하여 기존 벤치마크의 한계를 넘어 언어 에이전트의 실제 전문성, 추론 과정, 그리고 경제적 중요성이 있는 시나리오에서의 신뢰성을 종합적으로 평가하기 위한 새로운 벤치마크인 '$OneMillion-Bench'를 소개합니다.
이 논문은 시각적 근거를 강제하는 구조화된 검증 체인과 반사실적 일관성 보상을 통해 강화학습으로 훈련된 3B 파라미터 규모의 다중모달 판정 모델 'MJ1'이 훨씬 더 큰 모델들을 능가하는 성능을 달성했음을 보여줍니다.
SmartThinker 는 GRPO 기반의 점진적 CoT 길이 보정 기법을 통해 복잡한 문제의 난이도와 응답 분포에 따라 최적의 추론 길이를 동적으로 조정함으로써, 대형 언어 모델의 과도한 추론을 줄이면서도 정확도를 향상시킵니다.
이 논문은 최대 내적 검색 (MIPS) 문제를 학습 기반 접근법인 'Amortized MIPS'로 해결하여, 쿼리 분포에 맞춰 신경망을 훈련함으로써 검색 비용을 상쇄하고 데이터베이스를 압축할 수 있음을 제안합니다.
이 논문은 LoRA 모듈의 독립적 평균화로 인한 노이즈와 구조적 표현력 저하 문제를 해결하기 위해, 수학적으로 정확한 집계 후 SVD 를 적용하여 학습 모멘텀을 보존하는 새로운 연방 미세조정 프레임워크인 'FedMomentum'을 제안하고, 이를 통해 수렴 속도와 최종 정확도를 기존 최첨단 방법보다 향상시켰음을 보여줍니다.
이 논문은 모델 크기와 데이터 혼합 간의 비선형 상호작용을 고려한 'CAMEL'이라는 용량 인식 혼합 법칙을 제안하여, 대규모 언어 모델의 데이터 혼합 최적화 비용을 50% 절감하고 하류 작업 성능을 최대 3% 향상시키는 효율적인 파이프라인을 제시합니다.
이 논문은 시계열 예측에서 외생 변수와 내생 변수 간의 시공간 상관관계를 노이즈에 강건하게 모델링하기 위해 변이형 생성기, 그래프 구조 정렬기, 그래프 정제기로 구성된 GCGNet 을 제안하고, 12 개의 실제 데이터셋에서 기존 최첨단 방법들을 능가하는 성능을 입증합니다.
이 논문은 대규모 언어 모델의 선호도 정렬을 위해 해석 가능성과 데이터 효율성을 동시에 개선하기 위해, 선호 쌍의 다차원 대비 분석을 통해 고품질 평가 기준을 생성하고 이를 기반으로 편향을 완화하며 최첨단 성능을 달성하는 'CDRRM' 프레임워크를 제안합니다.
이 논문은 연동 학습 환경에서 고랭크 LoRA 적응 시 발생하는 집계 오차와 그라디언트 붕괴 문제를 해결하기 위해, 클라이언트 수와 랭크 간의 상호작용을 이론적으로 분석하여 최적의 스케일링 인자를 도입한 'Stabilized Federated LoRA (SFed-LoRA)' 프레임워크를 제안합니다.
이 논문은 이질적인 RNA 시퀀싱 데이터셋 간의 전이 학습을 위해 적대적 도메인 적응을 기반으로 한 딥러닝 프레임워크를 제안하여, 데이터가 부족한 상황에서도 암 및 조직 유형 분류의 정확도를 향상시킨다는 점을 보여줍니다.
이 논문은 확률적 요소를 제거하고 결정론적 부드러운 대상을 직접 최적화하여 훈련 - 테스트 불일치를 줄이고 수렴 속도를 높이며 대규모 언어 모델의 구조적 가지치기 성능을 향상시킨 '결정론적 미분 가능 가지치기 (DDP)' 방법을 제안합니다.
이 논문은 GRU 인코더와 변분 양자 회로 (VQC) 를 결합한 하이브리드 양자 - 고전 신경망 아키텍처를 제안하여 생리학적 시계열 데이터의 다변량 다시간 구간 예측 성능과 잡음 내성을 향상시켰음을 보여줍니다.