RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

이 논문은 실제 환경에서 발생하는 이벤트 누락 문제를 해결하기 위해, 다양한 트리거 임계값을 모방하는 강인성 지향 교란 전략과 모달리티별 특징을 분리한 후 선택적으로 융합하는 RED 네트워크를 제안하여 모션 디블러링의 정확도와 강인성을 동시에 향상시킵니다.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao JiangMon, 09 Ma💻 cs

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

이 논문은 검색 정확도와 환경 보존 사이의 균형을 최적화하기 위해 시맨틱 유도 확산 튜닝, 랭게빈 동역학, 적응형 조기 종료 프로토콜 등을 결합하여 탄소 효율적인 검색을 가능하게 하는 'GaiaFlow' 프레임워크를 제안합니다.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

이 논문은 복잡한 문서 질문 답변 (DocQA) 작업에서 정보 과부하와 추론 한계를 해결하기 위해 쿼리 복잡도에 따른 경로 할당과 시각적 단어를 텍스트로 변환하는 경량 VLM 과 논리 추론을 담당하는 LLM 을 결합한 'AutoThinkRAG'프레임워크를 제안하여, 추론 비용을 절감하면서도 최첨단 성능을 달성했다고 요약할 수 있습니다.

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

이 논문은 의료 도메인의 복잡한 용어와 데이터 부족 문제를 해결하기 위해 사례 기반 추론 (CBR) 을 도입하여 질문-SQL 쌍을 추상화된 템플릿으로 표현하고 2 단계 검색 과정을 통해 기존 RAG 방식보다 높은 효율성과 견고함을 보이는 'CBR-to-SQL'프레임워크를 제안합니다.

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

이 논문은 틱톡의 알고리즘 감사를 통해 디지털서비스법 (DSA) 이 광고의 정의를 좁게 해석함으로써 인플루언서 마케팅 등 비공식 상업 콘텐츠에 대한 미성년자 맞춤형 광고 금지 규정이 무력화되고 있음을 실증적으로 규명하고, 미성년자 보호를 위해 광고의 정의를 확장할 것을 주장합니다.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

이 논문은 120 명의 미국 독자를 대상으로 한 5 주간의 실증 연구를 통해, 뉴스의 국내 및 국제적 다양성을 확장하기 위해 제안된 이중 보정 알고리즘적 넛지가 노출과 소비 다양성을 성공적으로 증가시켰으며, LLM 기반 프레젠테이션 넛지의 효과는 다양했으나 개인화된 관련성 강조가 클릭에 더 유리함을 입증했습니다.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

ChatShopBuddy: Towards Reliable Conversational Shopping Agents via Reinforcement Learning

이 논문은 제품 정확도, 설득력, 결과 및 과정 보상을 통합적으로 고려하기 위해 스마트샵벤치, 계층적 보상 모델링, 동적 대비 정책 최적화를 제안하여 실제 쇼핑 시나리오에서 안정적이고 효율적인 대화형 쇼핑 에이전트 '챗샵버디'를 개발했습니다.

Yiruo Cheng, Kelong Mao, Tianhao Li, Jiejun Tan, Ji-Rong Wen, Zhicheng DouMon, 09 Ma💻 cs

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

이 논문은 시각 토큰의 과도한 계산 비용과 보상 과대평가 문제를 해결하기 위해 시각 신호를 텍스트로 변환하고 정제된 CoT 지도 학습을 도입한 효율적인 GRPO 기반 추론 프레임워크인 MLLMRec-R1 을 제안하여 멀티모달 순차 추천 성능을 획기적으로 향상시켰습니다.

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

이 논문은 강화학습을 통해 최적화된 집합 수준의 목표를 학습 데이터로 변환한 후 경량 확산 모델을 훈련하여, 기존 강화학습 기반 검색의 높은 추론 비용 문제를 해결하면서도 다양성과 일관성 등 고차원 속성을 갖춘 효율적인 팬아웃 검색을 가능하게 하는 'R4T' 프레임워크를 제안합니다.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig BoutilierMon, 09 Ma🤖 cs.LG

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

이 논문은 RAG 시스템이 직면한 청크 간 관계 무시, 비단조적 유틸리티, 그리고 쿼리별 적응성 부재 문제를 해결하기 위해 몬테카를로 트리 탐색 (MCTS) 기반 최적 조합 탐색, 예산 소진 대신 유틸리티 기반 종료 조건, 그리고 쿼리 도메인별 최적 설정을 예측하는 에이전트를 도입한 'CARROT' 프레임워크를 제안하고, 이를 통해 기존 모델 대비 최대 30% 의 성능 향상을 입증했습니다.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

이 논문은 동일한 학습 레시피로 훈련된 17M 에서 1B 파라미터 규모의 최첨단 오픈 소스 인코더 및 디코더 모델 쌍인 'Ettin'을 소개하며, 각 아키텍처가 고유한 작업 (인코더는 분류/검색, 디코더는 생성) 에 최적화되어 있고 상호 전환 학습보다 전용 모델이 더 우수함을 입증합니다.

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van DurmeFri, 13 Ma💬 cs.CL

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

이 논문은 정적 콘텐츠와 실시간 동적 정보의 간극을 해소하기 위해 의식적 검색, DAG 기반 작업 계획, 경량화된 에이전트 실행기를 통합한 TURA 프레임워크를 제안하여 대규모 AI 검색 시스템에 실시간 응답을 가능하게 합니다.

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei YinFri, 13 Ma💬 cs.CL

PosIR: Position-Aware Heterogeneous Information Retrieval Benchmark

이 논문은 문서 내 정보의 위치 편향을 체계적으로 진단하기 위해 10 개 언어와 31 개 도메인의 310 개 데이터셋을 포함한 표준 벤치마크 'PosIR'을 제안하고, 이를 통해 최신 임베딩 기반 검색 모델에서 위치 편향이 광범위하게 존재하며 문서 길이에 따라 심화됨을 규명했습니다.

Ziyang Zeng, Dun Zhang, Yu Yan, Xu Sun, Cuiqiaoshu Pan, Yudong Zhou, Yuqing YangFri, 13 Ma💬 cs.CL