cs.IR articles | Gist.Science

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Ce papier présente MITRA, un assistant IA basé sur la génération augmentée par récupération (RAG) et hébergé localement pour garantir la confidentialité, conçu afin d'aider les chercheurs des collaborations physiques à naviguer efficacement dans la vaste documentation interne en utilisant un pipeline automatisé d'extraction de texte et une architecture de base de données vectorielle à deux niveaux.

Abhishikth Mallampalli, Sridhara DasuWed, 11 Ma🤖 cs.AI

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

Le papier présente RecThinker, un cadre agentique novateur qui améliore les systèmes de recommandation en passant d'une acquisition passive d'informations à une investigation autonome via un paradigme « Analyser-Planifier-Agir », l'utilisation dynamique d'outils pour combler les lacunes informationnelles et un pipeline d'entraînement combinant affinage supervisé et apprentissage par renforcement.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng DouWed, 11 Ma💻 cs

Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track

La deuxième édition de la piste RAG de TREC 2025 fait progresser la recherche sur les systèmes intégrant recherche et génération en introduisant des requêtes narratives complexes et une évaluation rigoureuse pour favoriser le développement de systèmes fiables et bien étayés.

Shivani Upadhyay, Nandan Thakur, Ronak Pradeep, Nick Craswell, Daniel Campos, Jimmy LinWed, 11 Ma💻 cs

Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

Cet article propose une méthode de récupération de mouvement textuel interprétable qui utilise une représentation d'images de mouvements basée sur les angles articulaires et une interaction tardive token-patch pour surpasser les approches existantes en préservant les correspondances locales fines.

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu XiaoWed, 11 Ma💻 cs

A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models

Ce papier propose une méthode de réduction de tokens fondée sur la géométrie de l'espace des vecteurs et l'estimation des cellules de Voronoi pour diminuer l'encombrement des index des modèles de récupération à interaction tardive tout en préservant leur qualité.

Yash Kankanampati, Yuxuan Zong, Nadi Tomeh, Benjamin Piwowarksi, Joseph Le RouxWed, 11 Ma💻 cs

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Cet article propose une revue de la littérature sur les tests adaptatifs informatisés sous l'angle de l'apprentissage automatique, en examinant comment ces techniques peuvent optimiser les modèles de mesure, la sélection des questions et le contrôle des tests pour créer des systèmes d'évaluation plus robustes, équitables et efficaces.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Ce papier présente KrishokBondhu, un centre d'appels vocal basé sur l'IA générative augmentée par la récupération (RAG) conçu pour fournir des conseils agricoles experts en bengali aux agriculteurs du Bangladesh, démontrant lors d'une étude pilote une amélioration significative de la qualité et de la richesse contextuelle des réponses par rapport aux benchmarks existants.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Ce papier propose PESO, une méthode d'adaptation continue utilisant un régularisateur proximal pour optimiser l'apprentissage des adaptateurs LoRA dans les systèmes de recommandation génératifs en équilibrant l'adaptation aux comportements récents et la préservation des connaissances utiles, surpassant ainsi les méthodes existantes.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang TongTue, 10 Ma🤖 cs.LG

Semantic Search over 9 Million Mathematical Theorems

Cet article présente un système de recherche sémantique à grande échelle capable d'extraire des théorèmes spécifiques parmi 9,2 millions d'énoncés mathématiques issus d'arXiv et d'autres sources, démontrant une efficacité supérieure aux méthodes existantes pour répondre aux requêtes de mathématiciens professionnels.

Luke Alexander, Eric Leonen, Sophie Szeto, Artemii Remizov, Ignacio Tejeda, Jarod Alper, Giovanni Inchiostro, Vasily IlinTue, 10 Ma🔢 math

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

Cette étude révèle que les pipelines RAG hybrides combinant recherche vectorielle et graphes de connaissances introduisent un risque de fuite de données par « pivot » entre locataires, qu'il est possible d'éliminer efficacement en réappliquant les contrôles d'autorisation spécifiquement à la frontière d'expansion du graphe.

Scott ThorntonTue, 10 Ma🤖 cs.LG

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Ce papier présente une méthode augmentant la pertinence de la recherche sur l'App Store en générant des millions d'étiquettes de pertinence textuelle via un modèle de langage spécialisé, ce qui améliore significativement les métriques hors ligne et le taux de conversion lors d'un test A/B mondial, en particulier pour les requêtes peu fréquentes.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat SundaranathaTue, 10 Ma🤖 cs.LG

Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing

Ce papier présente l'Isotonic Layer, un cadre différentiable universel qui intègre un ajustement linéaire par morceaux dans les architectures neuronales pour garantir une cohérence monotone, corriger les biais contextuels et améliorer la calibration des systèmes de recommandation à grande échelle.

Hailing Cheng, Yafang Yang, Hemeng Tao, Fengyu ZhangTue, 10 Ma🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

Cet article présente la Théorie de l'Espace d'Exploration (EST), un cadre formel fondé sur la théorie des espaces de connaissances qui modélise les dépendances prérequis entre lieux d'intérêt via des treillis distributifs, permettant ainsi de concevoir un système de recommandation géolocalisée garantissant mathématiquement la validité structurelle de chaque étape d'exploration.

Madjid SadallahTue, 10 Ma🤖 cs.LG

T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

Ce papier présente T-REX, une architecture de transformateur innovante conçue pour Amazon qui améliore les recommandations de paniers d'épicerie en générant des séquences de catégories personnalisées grâce à un masquage causal et des stratégies d'échantillonnage adaptées aux achats répétitifs.

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy ZubatiyTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Ce papier présente PAG, un nouveau cadre de recherche de voisins les plus proches approximatifs qui intègre des techniques de projection dans un index graphique pour répondre simultanément aux exigences de performance, de mémoire et d'évolutivité des applications d'IA modernes, surpassant ainsi HNSW en vitesse de requête tout en conservant une précision élevée.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Cet article propose une approche de récupération de formes 3D à partir d'images basée sur des encodeurs pré-alignés et un apprentissage contrastif dur, éliminant ainsi le besoin de synthèse de vues et permettant une récupération zero-shot avec des performances de pointe.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil SinhaTue, 10 Ma💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

Cet article présente un outil web scalable et agnostique du domaine qui exploite les grands modèles de langage pour automatiser la collecte et le filtrage de données scientifiques, réduisant ainsi considérablement la charge de travail manuelle tout en atteignant un taux de chevauchement de 90 % avec des bases de données expertes.

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico GomezTue, 10 Ma💻 cs

Multi-TAP: Multi-criteria Target Adaptive Persona Modeling for Cross-Domain Recommendation

Le papier présente Multi-TAP, un cadre de modélisation de personnalités adaptatif et multi-critères qui améliore la recommandation inter-domaines en capturant explicitement l'hétérogénéité des préférences utilisateurs et en transférant sélectivement les connaissances pertinentes entre les domaines.

Daehee Kang, Yeon-Chang LeeTue, 10 Ma💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Ce papier propose le cadre PSAD, qui combine une génération semi-autoregressive et une distillation de connaissances en ligne pour surmonter les compromis entre qualité et latence dans le reranking personnalisé, tout en améliorant l'interaction utilisateur-article grâce à un réseau de profil utilisateur.

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong ChenTue, 10 Ma💻 cs

Fine-Grained Table Retrieval Through the Lens of Complex Queries

Ce papier présente DCTR, un mécanisme de récupération de tables qui utilise une décomposition fine des requêtes et une conscience de la connectivité globale pour améliorer la réponse aux questions complexes sur des bases de données relationnelles ouvertes.

Wojciech Kosiuk, Xingyu Ji, Yeounoh Chung, Fatma Özcan, Madelon HulsebosTue, 10 Ma💬 cs.CL

← Précédent Suivant →