iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

iAgentBench is een dynamisch benchmark dat de vermogens van informatieve zoekagenten om zintuiglijke conclusies te trekken uit meerdere bronnen op populaire onderwerpen evalueert, waarbij wordt vastgesteld dat het enkel ophalen van informatie onvoldoende is voor het oplossen van complexe vragen die synthese vereisen.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Scaling Laws for Reranking in Information Retrieval

Dit artikel presenteert de eerste systematische studie naar schaalwetten voor rerankers in informatieretrieval, waarbij wordt aangetoond dat de prestaties van modellen van verschillende groottes en dataverbruik een voorspelbaar machtsverband vertonen, wat het mogelijk maakt om de prestaties van zeer grote modellen nauwkeurig te schatten op basis van kleinere experimenten en zo aanzienlijke rekenkracht te besparen.

Rahul Seetharaman, Aman Bansal, Hamed Zamani + 1 more2026-03-06💻 cs

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Deze paper introduceert de Co-Evolutionary Alignment (CoEA)-methode, die een Dual-Stable Interest Exploration-module en een Periodic Collaborative Optimization-mechanisme combineert om aanbevelingssystemen te verbeteren door zowel lange-termijngroepsidentiteit als korte-termijnpersoonlijke interesses te modelleren en via een dynamische gesloten lus serendipiteit te bevorderen.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Dit paper introduceert DevRev-Search, een benchmark en een schaalbaar framework voor multi-tenant zoeksystemen dat gebruikmaakt van een volledig geautomatiseerd datasetbouwpipeline en een indexbehoudende aanpassingsstrategie om alleen de query-encoder te finetunen, waardoor effectieve domeinadaptatie mogelijk wordt zonder kostbare herschrijving van documentindices.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI