On the Theoretical Limitations of Embedding-Based Retrieval
이 논문은 임베딩 차원에 의해 토크-k 문서 집합의 표현이 이론적으로 제한된다는 사실을 증명하고, 단순한 작업에서도 최첨단 모델이 이를 극복하지 못함을 보여주어 단일 벡터 패러다임의 근본적 한계를 지적합니다.
152 편의 논문
이 논문은 임베딩 차원에 의해 토크-k 문서 집합의 표현이 이론적으로 제한된다는 사실을 증명하고, 단순한 작업에서도 최첨단 모델이 이를 극복하지 못함을 보여주어 단일 벡터 패러다임의 근본적 한계를 지적합니다.
이 논문은 장기적이고 복잡한 모바일 자동화 작업에서 기존 에이전트의 한계를 해결하기 위해, 고수준 계획과 저수준 실행에 각각 특화된 지식 검색 (RAG) 메커니즘을 통합한 계층적 멀티 에이전트 프레임워크인 'Mobile-Agent-RAG'와 이를 평가하는 새로운 벤치마크를 제안합니다.
이 논문은 문서 내 정보의 위치 편향을 체계적으로 진단하기 위해 10 개 언어와 31 개 도메인의 310 개 데이터셋을 포함한 표준 벤치마크 'PosIR'을 제안하고, 이를 통해 최신 임베딩 기반 검색 모델에서 위치 편향이 광범위하게 존재하며 문서 길이에 따라 심화됨을 규명했습니다.
이 논문은 희소 보상과 과정 보상 방법의 한계를 극복하기 위해, 공통 접두사를 공유하는 잘라낸 단계별 샘플링과 밀집된 LLM 기반 심층 평가를 결합하여 추론과 검색 결정에 대한 더 정확한 학습 신호를 제공하는 'SLATE' 프레임워크를 제안하고, 이를 통해 다양한 QA 벤치마크에서 기존 방법보다 우수한 성능을 입증했습니다.
이 논문은 국제 제재 데이터에서 파생된 대규모 엔티티 매칭 벤치마크인 'OpenSanctions Pairs'를 공개하고, 기존 규칙 기반 시스템보다 우수한 성능을 보이는 LLM 기반 매칭의 효과와 한계를 실증적으로 분석하여 향후 엔티티 해결 작업의 초점을 매칭 자체보다는 블로킹 및 클러스터링 등 파이프라인 다른 단계로 전환할 것을 제안합니다.
이 논문은 지식 그래프 기반의 다단계 질문 응답 (QA) 에서 삼중항 (triple) 변환 시 발생하는 맥락 손실 문제를 해결하기 위해, 엔터티 중심 요약과 통합 인덱싱 기법 (MDER) 과 질의 분해 및 추론 메커니즘 (DR) 을 결합한 새로운 RAG 프레임워크를 제안하고, 이를 통해 기존 베이스라인 대비 최대 66% 의 성능 향상을 입증했습니다.
이 논문은 사용자의 기억 제약과 시간 예산을 고려한 순차적 의사결정 모델로 정보 냄새 이론을 확장하여, 링크를 즉시 선택하거나 실수 후 되돌아가는 탐색 오류와 복원 행동을 성공적으로 설명함을 보여줍니다.
이 논문은 유튜브 추천 시스템에 대한 감사 (audit) 연구에서 로그인 계정 사용 등 다양한 방법론적 선택이 결과의 정확도에 미치는 영향을 분석하여, 비용과 계산 자원을 줄이면서도 신뢰할 수 있는 결론을 도출할 수 있는 최적의 감사 구성 방안을 제시합니다.
본 논문은 온톨로지 매칭의 복잡하고 퓨샷 (few-shot) 작업에서 기존 최첨단 시스템보다 뛰어난 성능을 보이는 새로운 에이전트 기반 프레임워크인 'Agent-OM'을 제안하고 그 유효성을 입증합니다.
이 논문은 텍스트 속성 그래프의 풍부한 엣지 정보를 활용하고, 그래프 증강을 통한 대비 학습을 강화하며, 대규모 언어 모델 (LLM) 에서 파생된 컨텍스트 기반 임베딩을 통합한 LEXA 모델을 제안하여 기존 법률 사례 검색 방법론보다 우수한 성능을 달성함을 보여줍니다.
이 논문은 유사성과 다양성을 동시에 만족하는 벡터 검색 문제 (VRSD) 가 NP-완전임을 증명하고, 매개변수 없는 휴리스틱 알고리즘을 제안하여 기존 MMR 및 k-DPP 기법보다 우수한 성능을 입증합니다.
이 논문은 텍스트, 이미지, 맥락 신호를 통합하고 LLM 과 SLM 의 시너지를 활용하여 다중 에이전트 및 다중 페르소나 기반의 증거 중심 프레임워크인 AMPEND-LS 를 제안함으로써 기존 방법들의 한계를 극복하고 정확성과 설명 가능성을 향상시킨 다중 모달 가짜 뉴스 탐지 연구를 소개합니다.
이 논문은 중규모 그래프에서도 계산적으로 실행 가능하도록 엣지 임베딩의 그라미안 행렬 표현과 조건부 확률 분포 재구성을 통해 확장성을 확보한 'CopulaGNN' 기반의 새로운 링크 부호 예측 모델을 제안하고, 이론적 선형 수렴 증명과 실험을 통해 기존 모델 대비 빠른 수렴 속도와 경쟁력 있는 성능을 입증합니다.
이 논문은 2014 년부터 2023 년까지의 웹 오브 사이언스 데이터를 활용하여 조류 인플루엔자 연구의 출판 동향, 주요 기관 및 국가, 학술지 영향력, 문서 유형 등을 scientometric 분석하여 전 세계 연구 지형을 규명하고 국제적 협력의 중요성을 강조합니다.
이 논문은 코사인 유사도 기반의 대비 학습에서 임베딩 크기를 노이즈로 간주하는 기존 관념을 넘어, 쿼리와 문서의 크기를 독립적으로 제어하는 프레임워크를 통해 검색 및 RAG 성능을 획기적으로 개선하고 일반화 능력을 향상시키는 방법론과 실용적 지침을 제시합니다.
이 논문은 알리바바 전자상거래 플랫폼의 실시간 산업 검색을 위해 절대 ID 인식 임베딩과 비교·보정 리스트와식 리랭커를 도입하여 정밀도와 효율성을 동시에 극대화한 Pailitao-VL 시스템을 제안하고 그 우수성을 입증했습니다.
이 논문은 기존 순차 추천 모델의 효율성과 협업 신호를 유지하면서 자연어 프롬프트로 사용자의 즉각적인 의도를 반영할 수 있도록 협업 및 시맨틱 신호를 정렬하고, 모순된 그래디언트를 분리하며, 3 단계 학습 전략을 도입한 모델-중립적 프레임워크인 'DPR(Decoupled Promptable Sequential Recommendation)'을 제안합니다.
이 논문은 실험 프로토타입과 프로덕션 시스템 간의 격차를 해소하기 위해 데이터, 임베딩, 검색 로직을 분리한 모듈식 인프라 'SearchGym'을 제안하고, 하이브리드 검색 오케스트레이션의 최적 순서와 재현성을 보장하는 구성 가능한 설정 시스템을 통해 LitSearch 벤치마크에서 70% 의 Top-100 검색률을 달성함을 보여줍니다.
이 논문은 14 가지 에이전트 설정과 3 개 주요 제공업체의 실행 흔적을 포함한 500 개의 금융 질의로 구성된 'FinRetrieval' 벤치마크를 소개하며, 웹 검색보다 구조화된 데이터 API 를 통한 도구 접근성이 성능에 결정적인 영향을 미친다는 것을 보여줍니다.
본 논문은 16,000 건 이상의 TripAdvisor 리뷰를 분석한 대규모 언어 모델 (LLM) 기반 프레임워크가 기존 지표가 포착하지 못한 항공사 서비스의 미세한 문제와 만족도 하락 원인을 규명하여, 항공 및 관광 산업에 실행 가능한 전략적 통찰을 제공하는 유효한 진단 도구임을 입증합니다.