Learning Page Order in Shuffled WOO Releases
이 논문은 네덜란드 정보공개 문서를 대상으로 페이지 순서 복원 연구를 수행하여, 시퀀스 2 시퀀스 트랜스포머가 긴 문서에서 일반화 실패를 보인 반면, 모델 특화 전략이 긴 문서의 순서 재배열 성능을 크게 향상시켰음을 밝혔습니다.
8576 편의 논문
이 논문은 네덜란드 정보공개 문서를 대상으로 페이지 순서 복원 연구를 수행하여, 시퀀스 2 시퀀스 트랜스포머가 긴 문서에서 일반화 실패를 보인 반면, 모델 특화 전략이 긴 문서의 순서 재배열 성능을 크게 향상시켰음을 밝혔습니다.
이 논문은 기존 응답 기반 방법의 한계를 보완하기 위해 문맥 임베딩과 토픽 모델링을 활용한 응답 없는 심리 척도 간소화 프레임워크를 제안하며, 이를 통해 척도 길이를 평균 60.5% 단축하면서도 원래의 심리측정적 특성과 구조를 효과적으로 유지할 수 있음을 실증했습니다.
이 논문은 뉴턴-슈어츠 반복을 통한 직교화를 수행하는 Muon 옵티마이저의 크기 불안정성 문제를 해결하기 위해, 전역 RMS 보정과 에너지 기반 신뢰 영역 클리핑을 결합한 TrasMuon 을 제안하며, 이는 웜업 단계 없이도 기존 베이스라인보다 빠른 수렴과 향상된 안정성을 입증합니다.
이 논문은 LLM 기반 추천 시스템의 평가 신뢰성을 위협하는 '벤치마크 데이터 유출' 현상을 규명하고, 유출 데이터의 도메인 관련성에 따라 모델 성능이 왜곡되거나 저하될 수 있음을 실험을 통해 입증했습니다.
이 논문은 학습 중 순간 속도 제약 (IVC) 을 통해 표현력을 보장하면서도 단일 단계로 행동을 생성할 수 있는 새로운 생성 정책인 평균 속도 정책 (MVP) 을 제안하여, 로봇 조작 작업에서 기존 흐름 기반 정책 대비 뛰어난 성공률과 빠른 추론 속도를 달성했습니다.
이 논문은 제약된 물리 파라미터와 이산적 잠재 구조를 모두 처리할 수 있도록 엔드포인트 유도 아핀 기하학적 구속과 변분 모델링을 도입하여 시뮬레이션 기반 추론 (SBI) 의 범위를 확장하고 정확도를 향상시킨 'Pawsterior'라는 새로운 변분 흐름 매칭 프레임워크를 제안합니다.
이 논문은 코드가 강화학습보다 학습 가능한 정보 구조를 가지고 있어 예측 가능한 확장이 가능한 반면, 대부분의 강화학습 문제는 피드백의 질적 차이로 인해 단순한 모델 크기 확장에 한계가 있음을 지적하며, 표현 가능성·계산 가능성·학습 가능성의 세 가지 속성 간 관계를 규명하는 5 단계 학습 가능성 계층 구조를 제안합니다.
이 논문은 수시간 분량의 오디오를 구조화된 사건 레코드로 변환하여 SQL 데이터베이스에 저장하고, 이를 기반으로 자연어 질문을 해결하는 하이브리드 RAG 프레임워크인 LongAudio-RAG 를 제안하며, 엣지-클라우드 환경에서의 실용성과 기존 방법 대비 향상된 정확도를 입증합니다.
이 논문은 예측 코딩 (PC) 알고리즘의 오류 전파 지연과 소실 문제를 해결하기 위해 출력층에서 모든 은닉층으로 직접 피드백 연결을 도입한 '직접 콜렌 - 폴랙 예측 코딩 (DKP-PC)'을 제안하여, 이론적 오류 전파 복잡도를 O(L) 에서 O(1) 로 줄이고 성능과 효율성을 동시에 개선함을 보여줍니다.
이 논문은 이질적인 데이터 소스들 중에서도 상관관계와 품질이 유사한 '좋은' 소스들의 하위 집합을 선별하여 학습하는 것만으로도 공유 특징 추출기의 통계적 최적성을 달성할 수 있음을 이론적 분석과 실험을 통해 입증합니다.
이 논문은 쌍곡선 공간의 계층적 기하학과 하이퍼그래프 융합 메커니즘을 결합한 'Emotion Collider(EC-Net)'를 제안하여, 노이즈나 일부 모달리티가 결여된 상황에서도 강인하고 일관된 감정 표현을 학습하고 분류 정확도를 향상시킨다는 것을 보여줍니다.
이 논문은 학습 중 의도적으로 특정 모달리티 정보를 붕괴시켜 다중 모달 시스템이 입력 채널의 손실이나 손상에도 견고한 표현을 학습하도록 하는 'ModalImmune' 프레임워크를 제안하고, 다양한 벤치마크에서 모달리티 제거 및 손상 상황에 대한 복원력과 안정성을 입증합니다.
이 논문은 성체 초파리의 완전한 뇌 연결체 (connectome) 구조를 그대로 활용하여 감각 입력에서 운동 출력으로의 정보 흐름을 구현한 'FlyGM'을 개발함으로써, 별도의 구조 조정이 없어도 다양한 이동 작업을 안정적으로 제어하고 기존 모델보다 우수한 샘플 효율성과 성능을 입증했다고 요약할 수 있습니다.
이 논문은 분포 독립적 기준이 부재한 상황에서 분할 합동 예측 (split conformal prediction) 의 운영적 성과 (기여 빈도, 유보, 오류 노출 등) 를 보장하기 위해 소표본 베타 보정 (SSBC) 과 검증 및 감사 (Calibrate-and-Audit) 프레임워크를 제안하며, 이를 통해 운영 목표 간의 트레이드오프를 시각화하고 유한 시간 창에서의 불확실성을 정량화하는 방법을 제시합니다.
이 논문은 회전 및 이동이 포함된 MNIST 데이터셋을 통해 잠재 공간에서 등변 연산자를 학습하는 아키텍처가 기존 및 등변 신경망의 한계를 극복하고 분포 외 객체 인식에 성공할 수 있음을 보이지만, 더 복잡한 데이터셋으로 확장하는 데는 여전히 과제가 있음을 논의합니다.
이 논문은 CityLearn 환경을 활용하여 도시 에너지 관리에 대한 다중 에이전트 강화학습 (MARL) 알고리즘을 다양한 핵심 성과 지표 (KPI) 로 평가하고, 분산 훈련이 중앙 집중식 훈련보다 우수하며 시간적 의존성 학습이 배터리 수명 등 지속 가능성 지표 향상에 기여함을 입증했습니다.
이 논문은 분산형 거래소의 집중 유동성 공급 문제를 최적 제어 문제로 정식화하고, Ornstein-Uhlenbeck 과정의 평균 회귀 속도를 활용한 딥 강화 학습 기법인 RAmmStein 을 제안하여, 불필요한 재조정 비용을 줄이면서도 자본 효율성을 극대화하는 지능형 유동성 관리 전략을 입증했습니다.
이 논문은 다양한 분자 회귀 작업에서 네 가지 GNN 아키텍처를 체계적으로 벤치마크하고, GNN 임베딩과 분자 지문 임베딩이 높은 독립성을 보임 (CKA ≤ 0.46) 을 확인하여 이를 융합한 계층적 프레임워크가 기존 모델보다 RMSE 를 7% 이상 개선함을 입증했습니다.
이 논문은 35 개 언어와 코드를 기반으로 현대적 아키텍처를 적용하고 Matryoshka 표현 학습을 통해 효율성을 높인 MrBERT 라는 다국어 인코더 모델 계열을 소개하며, 카탈로니아어 및 스페인어 특화 작업과 의료·법률 같은 전문 분야에서 최첨단 성능을 달성했다고 요약할 수 있습니다.
이 논문은 EEG 신호와 이미지 간의 모달리티 격차를 해소하고 대규모 확산 모델의 계산 과부하를 극복하기 위해, 대비 학습과 '다음 스케일 예측' 전략을 기반으로 한 경량 자동회귀 프레임워크 AVDE 를 제안하여 기존 최첨단 방법보다 우수한 성능과 효율성을 입증했습니다.