GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow 是一个创新的语义引导扩散微调框架,它通过结合检索引导的朗之万动力学、硬件无关性能建模、自适应早退机制及精度感知量化推理,在保持检索精度的同时显著降低了大规模神经搜索系统的碳足迹,实现了效果与能效的卓越平衡。

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon FongMon, 09 Ma🤖 cs.LG

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

本文介绍了名为 Aletheia 的新型浏览器扩展,它利用检索增强生成(RAG)和大语言模型(LLM)技术,不仅通过实验证明在虚假新闻检测性能上优于现有基线,还通过包含讨论中心和事实核查推送的交互功能,在 250 名参与者的用户研究中验证了其高可用性与感知有效性,从而提供了一种透明且以用户为中心的解决方案来应对虚假新闻传播问题。

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction

AutoThinkRAG 通过引入查询复杂度路由器和将视觉解析与逻辑推理功能解耦的小规模 VLM 与大语言模型协同架构,有效解决了多模态文档问答中的长上下文与信息过载难题,在显著降低推理成本的同时实现了新的最先进性能。

Jiashu Yang, Chi Zhang, Abudukelimu Wuerkaixi, Xuxin Cheng, Cao Liu, Ke Zeng, Xu Jia, Xunliang CaiMon, 09 Ma💻 cs

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

该论文提出了名为 CBR-to-SQL 的框架,通过借鉴基于案例的推理(CBR)思想,将问答对抽象为可复用的案例模板并采用两阶段检索机制,有效解决了医疗领域文本转 SQL 任务中传统检索增强生成(RAG)方法面临的术语噪声、可扩展性差及数据稀缺等挑战,在 MIMICSQL 数据集上实现了优于现有方法的逻辑形式准确率与鲁棒性。

Hung Nguyen, Hans Moen, Pekka MarttinenMon, 09 Ma🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

该论文通过算法审计揭示,《数字服务法》因对“广告”定义过窄,导致 TikTok 虽在形式上遵守禁止向未成年人投放基于画像广告的规定,却未能有效规制未标注的网红营销等实质商业内容,致使未成年人仍遭受严重的个性化商业诱导,因此呼吁扩大监管定义以填补这一漏洞。

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

该研究通过在 POPROX 平台上对 120 名美国用户进行为期 5 周的实地实验,验证了结合“主题 - 地域双重校准”算法与基于大语言模型的个性化呈现“助推”策略能有效提升新闻推荐的多样性,并促使读者逐渐养成兼顾国内与国际新闻的阅读习惯。

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

MLLMRec-R1: Incentivizing Reasoning Capability in Large Language Models for Multimodal Sequential Recommendation

本文提出了 MLLMRec-R1 框架,通过离线将视觉信号文本化以降低计算成本、构建高质量的多模态思维链监督以及采用混合粒度数据增强策略,有效解决了现有基于 GRPO 的方法在 multimodal 序列推荐中面临的训练成本高昂和奖励膨胀问题,显著提升了多模态大模型的推理与推荐性能。

Yu Wang, Yonghui Yang, Le Wu, Jiancan Wu, Hefei Xu, Hui LinMon, 09 Ma💻 cs

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

本文提出了 TURA(工具增强的统一检索代理),这是一种结合检索增强生成(RAG)与智能体工具调用的三阶段框架,通过意图感知检索、基于 DAG 的任务规划及轻量级执行器,有效解决了传统 RAG 在处理实时动态数据(如库存和票务)方面的局限,实现了面向大规模工业级 AI 搜索产品的静态内容与动态信息源的统一检索。

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei YinFri, 13 Ma💬 cs.CL