Mobile-Agent-RAG: Driving Smart Multi-Agent Coordination with Contextual Knowledge Empowerment for Long-Horizon Mobile Automation

이 논문은 장기적이고 복잡한 모바일 자동화 작업에서 기존 에이전트의 한계를 해결하기 위해, 고수준 계획과 저수준 실행에 각각 특화된 지식 검색 (RAG) 메커니즘을 통합한 계층적 멀티 에이전트 프레임워크인 'Mobile-Agent-RAG'와 이를 평가하는 새로운 벤치마크를 제안합니다.

Yuxiang Zhou, Jichang Li, Yanhao Zhang, Haonan Lu, Guanbin LiFri, 13 Ma🤖 cs.AI

PosIR: Position-Aware Heterogeneous Information Retrieval Benchmark

이 논문은 문서 내 정보의 위치 편향을 체계적으로 진단하기 위해 10 개 언어와 31 개 도메인의 310 개 데이터셋을 포함한 표준 벤치마크 'PosIR'을 제안하고, 이를 통해 최신 임베딩 기반 검색 모델에서 위치 편향이 광범위하게 존재하며 문서 길이에 따라 심화됨을 규명했습니다.

Ziyang Zeng, Dun Zhang, Yu Yan, Xu Sun, Cuiqiaoshu Pan, Yudong Zhou, Yuqing YangFri, 13 Ma💬 cs.CL

Truncated Step-Level Sampling with Process Rewards for Retrieval-Augmented Reasoning

이 논문은 희소 보상과 과정 보상 방법의 한계를 극복하기 위해, 공통 접두사를 공유하는 잘라낸 단계별 샘플링과 밀집된 LLM 기반 심층 평가를 결합하여 추론과 검색 결정에 대한 더 정확한 학습 신호를 제공하는 'SLATE' 프레임워크를 제안하고, 이를 통해 다양한 QA 벤치마크에서 기존 방법보다 우수한 성능을 입증했습니다.

Chris Samarinas, Haw-Shiuan Chang, Hamed ZamaniFri, 13 Ma💬 cs.CL

OpenSanctions Pairs: Large-Scale Entity Matching with LLMs

이 논문은 국제 제재 데이터에서 파생된 대규모 엔티티 매칭 벤치마크인 'OpenSanctions Pairs'를 공개하고, 기존 규칙 기반 시스템보다 우수한 성능을 보이는 LLM 기반 매칭의 효과와 한계를 실증적으로 분석하여 향후 엔티티 해결 작업의 초점을 매칭 자체보다는 블로킹 및 클러스터링 등 파이프라인 다른 단계로 전환할 것을 제안합니다.

Chandler Smith, Magnus Sesodia, Friedrich Lindenberg, Christian Schroeder de WittFri, 13 Ma💬 cs.CL

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

이 논문은 지식 그래프 기반의 다단계 질문 응답 (QA) 에서 삼중항 (triple) 변환 시 발생하는 맥락 손실 문제를 해결하기 위해, 엔터티 중심 요약과 통합 인덱싱 기법 (MDER) 과 질의 분해 및 추론 메커니즘 (DR) 을 결합한 새로운 RAG 프레임워크를 제안하고, 이를 통해 기존 베이스라인 대비 최대 66% 의 성능 향상을 입증했습니다.

Riccardo Campi, Nicolò Oreste Pinciroli Vago, Mathyas Giudici, Marco Brambilla, Piero FraternaliFri, 13 Ma💬 cs.CL

How Auditing Methodologies Can Impact Our Understanding of YouTube's Recommendation Systems

이 논문은 유튜브 추천 시스템에 대한 감사 (audit) 연구에서 로그인 계정 사용 등 다양한 방법론적 선택이 결과의 정확도에 미치는 영향을 분석하여, 비용과 계산 자원을 줄이면서도 신뢰할 수 있는 결론을 도출할 수 있는 최적의 감사 구성 방안을 제시합니다.

Sarmad Chandio, Daniyal Pirwani Dar, Rishab Nithyanand2026-03-10💻 cs

LEXA: Legal Case Retrieval via Graph Contrastive Learning with Contextualised LLM Embeddings

이 논문은 텍스트 속성 그래프의 풍부한 엣지 정보를 활용하고, 그래프 증강을 통한 대비 학습을 강화하며, 대규모 언어 모델 (LLM) 에서 파생된 컨텍스트 기반 임베딩을 통합한 LEXA 모델을 제안하여 기존 법률 사례 검색 방법론보다 우수한 성능을 달성함을 보여줍니다.

Yanran Tang, Ruihong Qiu, Yilun Liu + 2 more2026-03-06💻 cs

Agentic Multi-Persona Framework for Evidence-Aware Fake News Detection

이 논문은 텍스트, 이미지, 맥락 신호를 통합하고 LLM 과 SLM 의 시너지를 활용하여 다중 에이전트 및 다중 페르소나 기반의 증거 중심 프레임워크인 AMPEND-LS 를 제안함으로써 기존 방법들의 한계를 극복하고 정확성과 설명 가능성을 향상시킨 다중 모달 가짜 뉴스 탐지 연구를 소개합니다.

Roopa Bukke, Soumya Pandey, Suraj Kumar + 2 more2026-03-06💻 cs

A Scalable Inter-edge Correlation Modeling in CopulaGNN for Link Sign Prediction

이 논문은 중규모 그래프에서도 계산적으로 실행 가능하도록 엣지 임베딩의 그라미안 행렬 표현과 조건부 확률 분포 재구성을 통해 확장성을 확보한 'CopulaGNN' 기반의 새로운 링크 부호 예측 모델을 제안하고, 이론적 선형 수렴 증명과 실험을 통해 기존 모델 대비 빠른 수렴 속도와 경쟁력 있는 성능을 입증합니다.

Jinkyu Sung, Myunggeum Jee, Joonseok Lee2026-03-06💻 cs

Mapping a Decade of Avian Influenza Research (2014-2023): A Scientometric Analysis from Web of Science

이 논문은 2014 년부터 2023 년까지의 웹 오브 사이언스 데이터를 활용하여 조류 인플루엔자 연구의 출판 동향, 주요 기관 및 국가, 학술지 영향력, 문서 유형 등을 scientometric 분석하여 전 세계 연구 지형을 규명하고 국제적 협력의 중요성을 강조합니다.

Muneer Ahmad, Undie Felicia Nkatv, Amrita Sharma + 3 more2026-03-06💻 cs

Give Users the Wheel: Towards Promptable Recommendation Paradigm

이 논문은 기존 순차 추천 모델의 효율성과 협업 신호를 유지하면서 자연어 프롬프트로 사용자의 즉각적인 의도를 반영할 수 있도록 협업 및 시맨틱 신호를 정렬하고, 모순된 그래디언트를 분리하며, 3 단계 학습 전략을 도입한 모델-중립적 프레임워크인 'DPR(Decoupled Promptable Sequential Recommendation)'을 제안합니다.

Fuyuan Lyu, Chenglin Luo, Qiyuan Zhang + 6 more2026-03-06💻 cs

SearchGym: A Modular Infrastructure for Cross-Platform Benchmarking and Hybrid Search Orchestration

이 논문은 실험 프로토타입과 프로덕션 시스템 간의 격차를 해소하기 위해 데이터, 임베딩, 검색 로직을 분리한 모듈식 인프라 'SearchGym'을 제안하고, 하이브리드 검색 오케스트레이션의 최적 순서와 재현성을 보장하는 구성 가능한 설정 시스템을 통해 LitSearch 벤치마크에서 70% 의 Top-100 검색률을 달성함을 보여줍니다.

Jerome Tze-Hou Hsu2026-03-06💻 cs

Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

본 논문은 16,000 건 이상의 TripAdvisor 리뷰를 분석한 대규모 언어 모델 (LLM) 기반 프레임워크가 기존 지표가 포착하지 못한 항공사 서비스의 미세한 문제와 만족도 하락 원인을 규명하여, 항공 및 관광 산업에 실행 가능한 전략적 통찰을 제공하는 유효한 진단 도구임을 입증합니다.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs