MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations
이 논문은 CERN 의 CMS 와 같은 대규모 과학 협업에서 민감한 데이터를 온프레미스로 보호하면서 내비게이션과 지식 공유를 개선하기 위해 Selenium 과 OCR 기반 자동 파이프라인, 2 단계 벡터 데이터베이스 아키텍처를 활용한 온프레미스 RAG 기반 AI 어시스턴트 'MITRA'를 제안합니다.
141 편의 논문
이 논문은 CERN 의 CMS 와 같은 대규모 과학 협업에서 민감한 데이터를 온프레미스로 보호하면서 내비게이션과 지식 공유를 개선하기 위해 Selenium 과 OCR 기반 자동 파이프라인, 2 단계 벡터 데이터베이스 아키텍처를 활용한 온프레미스 RAG 기반 AI 어시스턴트 'MITRA'를 제안합니다.
이 논문은 기존 추천 에이전트의 수동적 정보 획득 한계를 극복하고, 정보 부족을 분석하고 도구를 능동적으로 활용하여 추론 경로를 동적으로 계획하는 'RecThinker'라는 자율적 에이전트 프레임워크를 제안하며, 이를 통해 다양한 벤치마크에서 우수한 성능을 입증했습니다.
TREC 2025 RAG 트랙은 2024 년 트랙의 기반 위에 복잡한 추론이 필요한 긴 서술형 쿼리를 도입하고, MS MARCO V2.1 코퍼스를 활용하여 투명성과 사실 기반성을 보장하는 신뢰할 수 있는 검색 증강 생성 시스템의 혁신을 촉진하기 위해 150 건 이상의 참가자 제출물을 평가했습니다.
이 논문은 전구적 임베딩의 한계를 극복하고 해석 가능한 정밀한 대응 관계를 제공하기 위해, 관절 기반 모션 이미지를 사전 학습된 비전 트랜스포머와 호환되도록 설계하고 토큰 단위 후기 상호작용을 통해 텍스트 - 모션 검색의 정확성과 해석 가능성을 동시에 향상시킨 새로운 방법을 제안합니다.
이 논문은 후기 상호작용 검색 모델의 인덱스 저장 오버헤드를 줄이기 위해 임베딩 공간에서 보로노이 셀 추정을 기반으로 토큰 가지치기를 체계적으로 수행하는 프레임워크를 제안하고, 이를 통해 검색 품질을 유지하면서 인덱스 크기를 효과적으로 축소할 수 있음을 입증합니다.
이 논문은 기존 심리측정학 기반의 컴퓨터 적응형 검사 (CAT) 를 머신러닝 관점에서 재조명하여 측정 모델, 문항 선정, 문항지 구성, 검사 통제 등 핵심 요소를 최적화하는 방안을 제시하고, 향후 보다 포괄적이고 학제적인 접근을 촉구하는 종합적 조사를 제공합니다.
이 논문은 방글라데시 농민들을 위해 OCR 기반 문서 처리, 벡터 데이터베이스, 그리고 Gemma 3-4B 모델을 활용한 RAG 프레임워크를 통합하여 음성 기반의 실시간 농업 상담 서비스를 제공하는 'KrishokBondhu' 시스템을 제안하고, 기존 벤치마크 대비 높은 정확도와 맥락 풍부함을 입증했습니다.
이 논문은 사용자와 아이템의 변화에 따른 추천 시스템의 지속적 학습 문제를 해결하기 위해, 최신 고정된 어댑터 상태를 기준점으로 하여 적응과 보존을 유연하게 조절하는 'PESO'라는 새로운 LoRA 기반 방법을 제안하고 그 우수성을 입증합니다.
이 논문은 arXiv 등 920 만 개의 수학적 정리를 대상으로 자연어 설명을 활용한 대규모 의미 기반 정리 검색 시스템을 구축하고, 전문가가 작성한 평가 세트를 통해 기존 방법보다 뛰어난 검색 성능을 입증했습니다.
이 논문은 하이브리드 RAG 시스템에서 벡터 검색 결과가 그래프 확장을 통해 민감한 데이터 영역으로 이동하는 '검색 피벗 공격'의 위험을 규명하고, 그래프 확장 경계에서 권한 검증을 수행함으로써 추가적인 오버헤드 없이 이러한 데이터 유출을 효과적으로 차단할 수 있음을 입증합니다.
이 논문은 대규모 앱 스토어 검색 시스템에서 행동 기반 데이터의 부족을 해결하기 위해 미세 조정된 LLM 을 활용해 텍스트 관련성 라벨을 대량 생성하고, 이를 순위 결정 모델에 통합함으로써 오프라인 성능과 전 세계 A/B 테스트에서 전환율을 유의미하게 향상시켰음을 보여줍니다.
이 논문은 추천 시스템의 편향을 완화하고 보정 정확도를 향상시키기 위해 신경망 아키텍처에 통합된 미분 가능한 '등적층 (Isotonic Layer)'을 제안하며, 이를 통해 특징 공간의 단조성을 보장하고 컨텍스트별 왜곡을 적응적으로 보정하는 것을 목표로 합니다.
이 논문은 지식 공간 이론을 위치 기반 추천에 적용하여 방문 순서의 전제 조건을 격자 이론으로 형식화하고, 이를 바탕으로 구조적 유효성 보장을 제공하는 '탐색 공간 추천 시스템 (ESRS)'을 제안합니다.
이 논문은 온라인 장바구니 추천의 고유한 도전을 해결하기 위해 짧은 기간의 장바구니 의존성과 장기적인 사용자 선호도를 모두 학습하여 차원을 축소하면서도 추천 품질을 유지하는 새로운 트랜스포머 아키텍처인 T-REX 를 제안하고, 기존 모델보다 향상된 성능을 입증했습니다.
이 논문은 현대 AI 애플리케이션의 다양한 요구사항을 충족하기 위해 투영 기법을 그래프 인덱스에 통합하여 기존 방법보다 5 배 빠른 검색 속도와 우수한 성능을 제공하는 새로운 근사 최근접 이웃 검색 프레임워크인 '투영 증강 그래프 (PAG)'를 제안합니다.
이 논문은 2D 이미지와 3D 형상을 정렬된 인코더로 매핑하여 뷰 합성 없이 제로샷 및 지도 학습 기반 이미지 기반 형상 검색 (IBSR) 을 수행하고, 하드 대비 학습 손실 (HCL) 을 도입하여 기존 방법론보다 우수한 성능을 달성하는 새로운 접근법을 제안합니다.
이 논문은 농업 및 작물 수확량 등 다양한 과학 분야에 적용 가능한 대규모 언어 모델 (LLM) 기반의 자동화 프레임워크를 제안하여, 수동 데이터 수집의 비효율성을 해결하고 전문가가 큐레이션한 데이터베이스와 90% 일치하는 고품질 개방형 과학 데이터베이스를 확장 가능하게 구축하는 방법을 제시합니다.
이 논문은 도메인 내 사용자의 이질성을 명시적으로 포착하고 타겟 도메인 조건에 맞춰 소스 도메인 신호를 선택적으로 전이함으로써 기존 방법론보다 우수한 성능을 보이는 교차 도메인 추천을 위한 'Multi-TAP' 프레임워크를 제안합니다.
이 논문은 생성 품질과 저지연 추론 간의 균형을 맞추고 사용자 - 아이템 상호작용을 심화시키기 위해, 반자기회귀 생성과 온라인 지식 증류를 결합한 새로운 개인화 재순위킹 프레임워크인 PSAD 를 제안하고 대규모 데이터셋에서 기존 최첨단 모델보다 뛰어난 성능과 효율성을 입증합니다.
이 논문은 복잡한 자연어 쿼리를 처리하고 밀집된 데이터베이스에서 정보를 검색하기 위해 세분화된 타입 쿼리 분해와 글로벌 연결성 인식을 결합한 DCTR 메커니즘을 제안하고, 산업계 벤치마크를 통해 그 강건성을 입증합니다.