cs.IR papers | Gist.Science

FinRetrieval: A Benchmark for Financial Data Retrieval by AI Agents

Dit paper introduceert FinRetrieval, een benchmark van 500 financiële vragen die aantoont dat de beschikbaarheid van gestructureerde data-API's de prestaties van AI-agenten bij het ophalen van numerieke waarden aanzienlijk meer beïnvloedt dan redeneermodes of modelleveranciers.

Eric Y. Kim, Jie Huang2026-03-06💻 cs

Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

Deze studie toont aan dat een Large Language Model-framework ongestructureerde online feedback effectiever kan decoderen dan traditionele methoden om specifieke serviceproblemen en een opvallende perceptiekloof bij EgyptAir te identificeren, waardoor waardevolle strategische inzichten voor de luchtvaartsector worden gegenereerd.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs

Still Fresh? Evaluating Temporal Drift in Retrieval Benchmarks

Deze studie toont aan dat tijdsgerelateerde wijzigingen in technische corpora, zoals de migratie van documentatie naar concurrerende repositories, slechts een beperkte impact hebben op de betrouwbaarheid en rangschikking van informatiezoek-benchmarks, wat suggereert dat dergelijke evaluaties ook met evoluerende corpora stabiel blijven.

Nathan Kuissi, Suraj Subrahmanyan, Nandan Thakur + 1 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

iAgentBench is een dynamisch benchmark dat de vermogens van informatieve zoekagenten om zintuiglijke conclusies te trekken uit meerdere bronnen op populaire onderwerpen evalueert, waarbij wordt vastgesteld dat het enkel ophalen van informatie onvoldoende is voor het oplossen van complexe vragen die synthese vereisen.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

In dit paper stellen de auteurs CONE voor, een hybride transformer-model dat getallen, bereiken en gaussische verdelingen samen met eenheden en attribuutnamen encodeert in een semantisch rijke vectorruimte, waardoor het aanzienlijk betere prestaties behaalt dan bestaande modellen op taken met numeriek redeneren.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval

Dit paper introduceert DARE, een lichtgewicht retrieval-model dat data-distributie-informatie integreert om de prestaties van LLM-agents bij het genereren van R-code en het vinden van statistische pakketten aanzienlijk te verbeteren.

Maojun Sun, Yue Wu, Yifei Xie + 5 more2026-03-06💻 cs

Scaling Laws for Reranking in Information Retrieval

Dit artikel presenteert de eerste systematische studie naar schaalwetten voor rerankers in informatieretrieval, waarbij wordt aangetoond dat de prestaties van modellen van verschillende groottes en dataverbruik een voorspelbaar machtsverband vertonen, wat het mogelijk maakt om de prestaties van zeer grote modellen nauwkeurig te schatten op basis van kleinere experimenten en zo aanzienlijke rekenkracht te besparen.

Rahul Seetharaman, Aman Bansal, Hamed Zamani + 1 more2026-03-06💻 cs

Beyond Text: Aligning Vision and Language for Multimodal E-Commerce Retrieval

Dit artikel presenteert een nieuwe modale fusie-architectuur die tekst en afbeeldingen effectief combineert voor e-commerce zoekopdrachten, waarbij wordt aangetoond dat domeinspecifieke fine-tuning en een tweestaps-afstemming essentieel zijn voor het verbeteren van de zoekresultaten.

Qujiaheng Zhang, Guagnyue Xu, Fengjie Li2026-03-06💻 cs

Detecting RAG Advertisements Across Advertising Styles

Deze paper introduceert een nieuwe taxonomie voor advertentiestijlen in RAG-systemen en toont aan dat modellen met entiteitsdetectie advertentievermeldingen effectief en robuust kunnen lokaliseren, terwijl lichtere modellen juist kwetsbaar blijken voor veranderingen in de advertentiestijl.

Sebastian Heineking, Wilhelm Pertsch, Ines Zelch + 4 more2026-03-06💻 cs

Debiasing Sequential Recommendation with Time-aware Inverse Propensity Scoring

Deze paper introduceert Time-aware Inverse Propensity Scoring (TIPS), een methode die bestaande sequentiële aanbevelingsmodellen verbetert door selectie- en blootstellingsbias effectief aan te pakken via het modelleren van tijdsafhankelijke dynamiek en tegenstellige redenering.

Sirui Huang, Jing Long, Qian Li + 2 more2026-03-06🤖 cs.AI

Core-based Hierarchies for Efficient GraphRAG

Deze paper introduceert een efficiëntere en reproduceerbare variant van GraphRAG die de niet-deterministische Leiden-clustering vervangt door een deterministische k-core-decompositie, waardoor de kwaliteit van globale zingeving verbetert en de kosten voor taalmodellen dalen.

Jakir Hossain, Ahmet Erdem Sarıyüce2026-03-06💬 cs.CL

Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph

Dit onderzoek presenteert een innovatief systeem dat Large Language Models combineert met de ANU Scholarly Knowledge Graph via een Deep Document Model en geoptimaliseerde queryverwerking om nauwkeurig en efficiënt semantische vragen over computernetwerkbewerkingen aan de ANU te beantwoorden.

Runsong Jia, Bowen Zhang, Sergio J. Rodríguez Méndez + 1 more2026-03-05🤖 cs.AI

RAG vs. GraphRAG: A Systematic Evaluation and Key Insights

Dit artikel presenteert een systematische evaluatie die de prestaties van RAG en GraphRAG op tekstuele taken vergelijkt via een gestandaardiseerd protocol, waarbij inzichten worden gedeeld over hun respectievelijke sterkten, beperkingen en strategieën voor effectieve integratie.

Haoyu Han, Li Ma, Yu Wang + 9 more2026-03-05💻 cs

OSCAR: Online Soft Compression And Reranking

OSCAR is een nieuwe online zachte compressie- en herordeningstechniek die de rekentijd van Retrieval-Augmented Generation-pipelines aanzienlijk verkort zonder in te leveren op de nauwkeurigheid, door dynamisch en query-afhankelijk informatie te comprimeren tijdens de inferentie.

Maxime Louis, Thibault Formal, Hervé Dejean + 1 more2026-03-05🤖 cs.AI

PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

Dit paper introduceert PinRec, een schaalbaar generatief ophaalmodel voor Pinterest dat uitkomstgeconditioneerde generatie en multi-token generatie combineert om de diversiteit, prestaties en bedrijfsdoelen van aanbevelingssystemen effectief in evenwicht te brengen.

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin + 4 more2026-03-05🤖 cs.LG

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Deze paper introduceert de Co-Evolutionary Alignment (CoEA)-methode, die een Dual-Stable Interest Exploration-module en een Periodic Collaborative Optimization-mechanisme combineert om aanbevelingssystemen te verbeteren door zowel lange-termijngroepsidentiteit als korte-termijnpersoonlijke interesses te modelleren en via een dynamische gesloten lus serendipiteit te bevorderen.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI

Towards Personalized Deep Research: Benchmarks and Evaluations

Deze paper introduceert PDR-Bench, het eerste benchmark voor het evalueren van personalisatie in diepe onderzoeksagenten, en stelt het PQR-evaluatiekader op om de prestaties van deze systemen op het gebied van personalisatie, inhoudskwaliteit en feitelijke betrouwbaarheid te meten.

Yuan Liang, Jiaxian Li, Yuqing Wang + 11 more2026-03-05🤖 cs.AI

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

Het paper introduceert REVISION, een nieuw raamwerk dat offline redenering en online besluitvorming combineert om de discrepantie tussen impliciete gebruikersintenties en zoekresultaten in Taobao's visuele zoeksystemen te verminderen en zo de klikratio te verhogen.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Dit paper introduceert DevRev-Search, een benchmark en een schaalbaar framework voor multi-tenant zoeksystemen dat gebruikmaakt van een volledig geautomatiseerd datasetbouwpipeline en een indexbehoudende aanpassingsstrategie om alleen de query-encoder te finetunen, waardoor effectieve domeinadaptatie mogelijk wordt zonder kostbare herschrijving van documentindices.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

Generative Recommendation for Large-Scale Advertising

Dit paper introduceert GR4AD, een productiegerichte generatieve aanbevelingsarchitectuur voor grootschalige advertenties die middels innovaties zoals UA-SID-tokenisatie, LazyAR-decodering en RSPO-versterkingstheorie de inkomsten met tot 4,2% verhoogt en succesvol is ingezet in het Kuaishou-advertentiesysteem voor meer dan 400 miljoen gebruikers.

Ben Xue, Dan Liu, Lixiang Wang + 26 more2026-03-05🤖 cs.LG

← Vorige Volgende →