MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Ce papier présente MITRA, un assistant IA basé sur la génération augmentée par récupération (RAG) et hébergé localement pour garantir la confidentialité, conçu afin d'aider les chercheurs des collaborations physiques à naviguer efficacement dans la vaste documentation interne en utilisant un pipeline automatisé d'extraction de texte et une architecture de base de données vectorielle à deux niveaux.

Abhishikth Mallampalli, Sridhara DasuWed, 11 Ma🤖 cs.AI

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

Le papier présente RecThinker, un cadre agentique novateur qui améliore les systèmes de recommandation en passant d'une acquisition passive d'informations à une investigation autonome via un paradigme « Analyser-Planifier-Agir », l'utilisation dynamique d'outils pour combler les lacunes informationnelles et un pipeline d'entraînement combinant affinage supervisé et apprentissage par renforcement.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng DouWed, 11 Ma💻 cs

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Cet article propose une revue de la littérature sur les tests adaptatifs informatisés sous l'angle de l'apprentissage automatique, en examinant comment ces techniques peuvent optimiser les modèles de mesure, la sélection des questions et le contrôle des tests pour créer des systèmes d'évaluation plus robustes, équitables et efficaces.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Ce papier présente KrishokBondhu, un centre d'appels vocal basé sur l'IA générative augmentée par la récupération (RAG) conçu pour fournir des conseils agricoles experts en bengali aux agriculteurs du Bangladesh, démontrant lors d'une étude pilote une amélioration significative de la qualité et de la richesse contextuelle des réponses par rapport aux benchmarks existants.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Ce papier propose PESO, une méthode d'adaptation continue utilisant un régularisateur proximal pour optimiser l'apprentissage des adaptateurs LoRA dans les systèmes de recommandation génératifs en équilibrant l'adaptation aux comportements récents et la préservation des connaissances utiles, surpassant ainsi les méthodes existantes.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang TongTue, 10 Ma🤖 cs.LG

Semantic Search over 9 Million Mathematical Theorems

Cet article présente un système de recherche sémantique à grande échelle capable d'extraire des théorèmes spécifiques parmi 9,2 millions d'énoncés mathématiques issus d'arXiv et d'autres sources, démontrant une efficacité supérieure aux méthodes existantes pour répondre aux requêtes de mathématiciens professionnels.

Luke Alexander, Eric Leonen, Sophie Szeto, Artemii Remizov, Ignacio Tejeda, Jarod Alper, Giovanni Inchiostro, Vasily IlinTue, 10 Ma🔢 math

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Ce papier présente une méthode augmentant la pertinence de la recherche sur l'App Store en générant des millions d'étiquettes de pertinence textuelle via un modèle de langage spécialisé, ce qui améliore significativement les métriques hors ligne et le taux de conversion lors d'un test A/B mondial, en particulier pour les requêtes peu fréquentes.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat SundaranathaTue, 10 Ma🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

Cet article présente la Théorie de l'Espace d'Exploration (EST), un cadre formel fondé sur la théorie des espaces de connaissances qui modélise les dépendances prérequis entre lieux d'intérêt via des treillis distributifs, permettant ainsi de concevoir un système de recommandation géolocalisée garantissant mathématiquement la validité structurelle de chaque étape d'exploration.

Madjid SadallahTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Ce papier présente PAG, un nouveau cadre de recherche de voisins les plus proches approximatifs qui intègre des techniques de projection dans un index graphique pour répondre simultanément aux exigences de performance, de mémoire et d'évolutivité des applications d'IA modernes, surpassant ainsi HNSW en vitesse de requête tout en conservant une précision élevée.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Cet article propose une approche de récupération de formes 3D à partir d'images basée sur des encodeurs pré-alignés et un apprentissage contrastif dur, éliminant ainsi le besoin de synthèse de vues et permettant une récupération zero-shot avec des performances de pointe.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil SinhaTue, 10 Ma💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

Cet article présente un outil web scalable et agnostique du domaine qui exploite les grands modèles de langage pour automatiser la collecte et le filtrage de données scientifiques, réduisant ainsi considérablement la charge de travail manuelle tout en atteignant un taux de chevauchement de 90 % avec des bases de données expertes.

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico GomezTue, 10 Ma💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Ce papier propose le cadre PSAD, qui combine une génération semi-autoregressive et une distillation de connaissances en ligne pour surmonter les compromis entre qualité et latence dans le reranking personnalisé, tout en améliorant l'interaction utilisateur-article grâce à un réseau de profil utilisateur.

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong ChenTue, 10 Ma💻 cs