cs.IR 편의 논문 | Gist.Science

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

이 논문은 실제 환경에서 발생하는 이벤트 누락 문제를 해결하기 위해, 다양한 트리거 임계값을 모방하는 강인성 지향 교란 전략과 모달리티별 특징을 분리한 후 선택적으로 융합하는 RED 네트워크를 제안하여 모션 디블러링의 정확도와 강인성을 동시에 향상시킵니다.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

이 논문은 검색 정확도와 환경 보존 사이의 균형을 최적화하기 위해 시맨틱 유도 확산 튜닝, 랭게빈 동역학, 적응형 조기 종료 프로토콜 등을 결합하여 탄소 효율적인 검색을 가능하게 하는 'GaiaFlow' 프레임워크를 제안합니다.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

이 논문은 대규모 데이터 환경에서 기존 Text-to-SQL 평가 지표의 한계를 지적하고, 실행 효율성, 비용, 데이터 규모 영향을 종합적으로 반영하는 새로운 'Text-to-Big SQL' 평가 지표와 LLM 에이전트에 대한 통찰을 제시합니다.

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Unified Learning-to-Rank for Multi-Channel Retrieval in Large-Scale E-Commerce Search

이 논문은 대규모 전자상거래 검색에서 여러 채널의 결과를 고정된 가중치 방식이 아닌 쿼리 의존적 학습 랭킹 모델로 통합하여 사용자 전환율을 2.85% 향상시키고 50ms 미만의 지연 시간으로 타겟닷컴에 배포한 방법을 제안합니다.

Aditya Gaydhani, Guangyue Xu, Dhanush Kamath, Ankit Singh, Alex LiMon, 09 Ma💻 cs

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

이 논문은 RAG 와 LLM 기술을 활용하여 가짜 뉴스 탐지 성능을 높이고, 사용자 참여와 투명한 설명을 제공하는 브라우저 확장 프로그램 'Aletheia'를 제안하며, 실험과 사용자 연구를 통해 그 효과성을 입증했습니다.

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

VDCook:DIY video data cook your MLLMs

이 논문은 자연어 쿼리와 가변적 파라미터를 통해 실시간 영상 검색과 생성을 자동화하고, MCP 기반의 지속적 데이터 유입으로 동적 진화하는 오픈 생태계를 구축하여 MLLM 훈련용 전문 영상 데이터셋 제작의 장벽을 낮추는 'VDCook' 플랫폼을 제안합니다.

Chengwei WuMon, 09 Ma🤖 cs.AI

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

이 논문은 복잡한 문서 질문 답변 (DocQA) 작업에서 정보 과부하와 추론 한계를 해결하기 위해 쿼리 복잡도에 따른 경로 할당과 시각적 단어를 텍스트로 변환하는 경량 VLM 과 논리 추론을 담당하는 LLM 을 결합한 'AutoThinkRAG'프레임워크를 제안하여, 추론 비용을 절감하면서도 최첨단 성능을 달성했다고 요약할 수 있습니다.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

이 논문은 의료 도메인의 복잡한 용어와 데이터 부족 문제를 해결하기 위해 사례 기반 추론 (CBR) 을 도입하여 질문-SQL 쌍을 추상화된 템플릿으로 표현하고 2 단계 검색 과정을 통해 기존 RAG 방식보다 높은 효율성과 견고함을 보이는 'CBR-to-SQL'프레임워크를 제안합니다.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

이 논문은 틱톡의 알고리즘 감사를 통해 디지털서비스법 (DSA) 이 광고의 정의를 좁게 해석함으로써 인플루언서 마케팅 등 비공식 상업 콘텐츠에 대한 미성년자 맞춤형 광고 금지 규정이 무력화되고 있음을 실증적으로 규명하고, 미성년자 보호를 위해 광고의 정의를 확장할 것을 주장합니다.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

이 논문은 120 명의 미국 독자를 대상으로 한 5 주간의 실증 연구를 통해, 뉴스의 국내 및 국제적 다양성을 확장하기 위해 제안된 이중 보정 알고리즘적 넛지가 노출과 소비 다양성을 성공적으로 증가시켰으며, LLM 기반 프레젠테이션 넛지의 효과는 다양했으나 개인화된 관련성 강조가 클릭에 더 유리함을 입증했습니다.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

Sensitivity-Aware Retrieval-Augmented Intent Clarification

이 논문은 민감한 정보가 포함된 도메인에서 검색 증강 의도 명확화 시스템의 보안과 유용성 간의 균형을 맞추기 위해 공격 모델을 정의하고, 검색 단계에서의 민감도 인식 방어 기법을 설계하며, 보호 수준과 시스템 유용성 간의 트레이드오프를 측정하는 평가 방법을 제안하는 연구 과제를 다룹니다.

Maik LarooijMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

이 논문은 제품 정확도, 설득력, 결과 및 과정 보상을 통합적으로 고려하기 위해 스마트샵벤치, 계층적 보상 모델링, 동적 대비 정책 최적화를 제안하여 실제 쇼핑 시나리오에서 안정적이고 효율적인 대화형 쇼핑 에이전트 '챗샵버디'를 개발했습니다.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

이 논문은 다양한 K 값의 벡터 검색 쿼리에 대해 높은 정확도와 성능을 유지하면서도 전처리 비용을 크게 절감하는 새로운 학습 기반 검색 방법인 OMEGA 를 제안합니다.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

이 논문은 시각 토큰의 과도한 계산 비용과 보상 과대평가 문제를 해결하기 위해 시각 신호를 텍스트로 변환하고 정제된 CoT 지도 학습을 도입한 효율적인 GRPO 기반 추론 프레임워크인 MLLMRec-R1 을 제안하여 멀티모달 순차 추천 성능을 획기적으로 향상시켰습니다.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

이 논문은 강화학습을 통해 최적화된 집합 수준의 목표를 학습 데이터로 변환한 후 경량 확산 모델을 훈련하여, 기존 강화학습 기반 검색의 높은 추론 비용 문제를 해결하면서도 다양성과 일관성 등 고차원 속성을 갖춘 효율적인 팬아웃 검색을 가능하게 하는 'R4T' 프레임워크를 제안합니다.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

이 논문은 RAG 시스템이 직면한 청크 간 관계 무시, 비단조적 유틸리티, 그리고 쿼리별 적응성 부재 문제를 해결하기 위해 몬테카를로 트리 탐색 (MCTS) 기반 최적 조합 탐색, 예산 소진 대신 유틸리티 기반 종료 조건, 그리고 쿼리 도메인별 최적 설정을 예측하는 에이전트를 도입한 'CARROT' 프레임워크를 제안하고, 이를 통해 기존 모델 대비 최대 30% 의 성능 향상을 입증했습니다.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

이 논문은 동일한 학습 레시피로 훈련된 17M 에서 1B 파라미터 규모의 최첨단 오픈 소스 인코더 및 디코더 모델 쌍인 'Ettin'을 소개하며, 각 아키텍처가 고유한 작업 (인코더는 분류/검색, 디코더는 생성) 에 최적화되어 있고 상호 전환 학습보다 전용 모델이 더 우수함을 입증합니다.

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van DurmeFri, 13 Ma💬 cs.CL

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

이 논문은 정적 콘텐츠와 실시간 동적 정보의 간극을 해소하기 위해 의식적 검색, DAG 기반 작업 계획, 경량화된 에이전트 실행기를 통합한 TURA 프레임워크를 제안하여 대규모 AI 검색 시스템에 실시간 응답을 가능하게 합니다.

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei YinFri, 13 Ma💬 cs.CL

On the Theoretical Limitations of Embedding-Based Retrieval

이 논문은 임베딩 차원에 의해 결정되는 이론적 한계로 인해 단순한 쿼리에서도 최상위 k 문서 집합을 표현하는 데 근본적인 제약이 존재하며, 기존 단일 벡터 패러다임의 한계를 입증하고 새로운 기술 개발의 필요성을 제기합니다.

Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk LeeFri, 13 Ma💬 cs.CL

PosIR: Position-Aware Heterogeneous Information Retrieval Benchmark

이 논문은 문서 내 정보의 위치 편향을 체계적으로 진단하기 위해 10 개 언어와 31 개 도메인의 310 개 데이터셋을 포함한 표준 벤치마크 'PosIR'을 제안하고, 이를 통해 최신 임베딩 기반 검색 모델에서 위치 편향이 광범위하게 존재하며 문서 길이에 따라 심화됨을 규명했습니다.

Ziyang Zeng, Dun Zhang, Yu Yan, Xu Sun, Cuiqiaoshu Pan, Yudong Zhou, Yuqing YangFri, 13 Ma💬 cs.CL

← 이전 다음 →