cs.IR papers | Gist.Science

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

Deze paper introduceert OfficeQA Pro, een nieuwe benchmark gebaseerd op een uitgebreid corpus van US Treasury Bulletins die aantoont dat zelfs de meest geavanceerde AI-agenten moeite hebben met grondig, op documenten gebaseerd redeneren in zakelijke contexten, waarbij gestructureerde documentrepresentaties weliswaar de prestaties verbeteren maar nog steeds aanzienlijke ruimte voor verbetering laten.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing ChenTue, 10 Ma💬 cs.CL

Explainability of Text Processing and Retrieval Methods: A Survey

Dit artikel biedt een breed overzicht van onderzoek naar de uitlegbaarheid en interpreteerbaarheid van methoden voor natuurlijke taalverwerking en informatieretrieval, met name gericht op modellen zoals woordembeddings, transformers en BERT, en schetst toekomstige onderzoeksrichtingen.

Sourav Saha, Debapriyo Majumdar, Mandar MitraThu, 12 Ma💬 cs.CL

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

Dit artikel introduceert ADC-SID, een raamwerk dat adaptief ruis in collaboratieve informatie filtert door de uitlijning tussen gedrag en inhoud aan te passen en dynamische wegingen toe te passen, waardoor robuustere semantische ID's worden gegenereerd die beter presteren op items met lange staart in aanbevelingssystemen.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing ZhangThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Dit onderzoek toont aan dat de volgorde van beoordeling (eerst een cijfer geven versus eerst een review schrijven) consumentenbeoordelingen polariseert via een combinatie van affectieve heuristieken en cognitieve inspanning, waarbij de volgorde 'eerst cijfer' leidt tot extremere scores afhankelijk van de servicekwaliteit en producttype.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Dit onderzoek toont aan dat redenerende rerankers, in vergelijking met niet-redenerende modellen, noch de eerlijkheid verbeteren noch verslechteren, maar eerder de bestaande eerlijkheidskenmerken van de invoer rangschikking behouden.

Saron Samuel, Benjamin Van Durme, Eugene YangThu, 12 Ma🤖 cs.AI

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Deze paper introduceert AttnLFA en AttnMVP, twee nieuwe architecturen voor generatieve aanbevelingssystemen die door het elimineren van inefficiënte interleaving-mechanismen en het expliciet modelleren van causale afhankelijkheden tussen items en acties, zowel de prestaties als de trainings-efficiëntie aanzienlijk verbeteren.

Hailing ChengThu, 12 Ma🤖 cs.AI

Differentiable Geometric Indexing for End-to-End Generative Retrieval

Dit artikel introduceert Differentiable Geometric Indexing (DGI), een nieuw generatief zoekparadigma dat optimalisatieblokkades en geometrische conflicten oplost door een volledig differentieerbare route en isotrope optimalisatie te combineren, wat leidt tot superieure prestaties, vooral bij lange staart-items.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi ZengThu, 12 Ma💻 cs

Modeling Stage-wise Evolution of User Interests for News Recommendation

Deze paper presenteert een unificerend kader voor nieuwsaanbevelingen dat zowel lange-termijnvoorkeuren als korte-termijndynamieken modelleert door gebruik te maken van een globale interactiegrafiek en lokale, tijdsgebonden subgrafieken, wat resulteert in nauwkeurigere en actueelere aanbevelingen dan bestaande methoden.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng WangThu, 12 Ma🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Deze paper introduceert een nieuw kader dat agenttrajecties analyseert om gestructureerde, contextuele leermomenten te genereren en op te halen, waardoor zelfverbeterende LLM-agenten hun prestaties aanzienlijk verbeteren door fouten te vermijden en succesvolle strategieën toe te passen.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

Dit paper introduceert ExBI, een nieuw systeem dat een hypergraafdatamodel en steekproefgebaseerde algoritmen combineert om Exploratory Business Intelligence te ondersteunen door dynamische schema-evolutie en herbruikbaarheid mogelijk te maken, wat resulteert in aanzienlijke snelheidswinsten ten opzichte van bestaande systemen zoals Neo4j en MySQL bij het behouden van hoge analytische nauwkeurigheid.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation

Dit paper introduceert TriRec, het eerste tripartiete LLM-agent framework voor aanbevelingen dat gebruikers, items en het platform gelijktijdig optimaliseert om de duurzaamheid van het systeem te waarborgen en de traditionele afweging tussen relevantie en eerlijkheid te doorbreken.

Yaxin Gong, Chongming Gao, Chenxiao Fan, Wenjie Wang, Fuli Feng, Xiangnan HeThu, 12 Ma💻 cs

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Dit onderzoek toont aan dat het gebruik van gestructureerde linked data, specifiek verrijkte entiteitspagina's met JSON-LD en navigatie-instructies, de nauwkeurigheid en volledigheid van zowel standaard als agent-gestuurde Retrieval-Augmented Generation-systemen aanzienlijk verbetert.

Andrea Volpini, Elie Raad, Beatrice Gamba, David RiccitelliThu, 12 Ma🤖 cs.AI

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

Dit artikel introduceert RAGPerf, een open-source end-to-end benchmarkingframework dat modulaire RAG-pipelines analyseert door de prestaties en nauwkeurigheid van componenten zoals embedding, indexering en generatie te meten onder diverse realistische werklasten.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian HuangThu, 12 Ma💻 cs

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

Deze studie introduceert een interpreteerbare, door LLM's ondersteunde pipeline die vier Chinese metafooridentificatieprotocollen omzet in uitvoerbare regelscripts, waarmee voor het eerst een cross-protocol vergelijking wordt gedaan die aantoont dat de keuze van het protocol de grootste variatiebron is en dat deze transparante architectuur concurrerende prestaties levert.

Weihang Huang, Mengna LiuThu, 12 Ma💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Deze paper introduceert een tweetalig corpus en een machine-actievere GND-taxonomie voor het trainen en evalueren van AI-systemen die bibliothecarissen ondersteunen bij het automatisch toewijzen van onderwerpswoorden aan catalogusrecords.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma SuominenThu, 12 Ma💬 cs.CL

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

Dit paper introduceert PharmGraph-Auditor, een hybride framework dat een betrouwbaar farmaceutisch kennisbestand en een bewijsgebaseerde verificatiestrategie combineert om de veiligheid en traceerbaarheid van medicatieverificatie door apothekers te verbeteren.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng FanThu, 12 Ma🤖 cs.AI

A Systematic Study of Pseudo-Relevance Feedback with LLMs

Dit paper biedt een systematische studie naar pseudo-relevante feedback met grote taalmodellen en onthult dat de keuze van het feedbackmodel cruciaal is, terwijl de meest kosteneffectieve aanpak gebruikmaakt van door het model gegenereerde tekst, tenzij een sterke eerste-stap retriever beschikbaar is, waarbij corpus-gebaseerde feedback dan het meest voordelig is.

Nour Jedidi, Jimmy LinThu, 12 Ma💬 cs.CL

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

Dit paper introduceert LLMGreenRec, een innovatief multi-agent systeem dat Large Language Models gebruikt om duurzame e-commerce te bevorderen door zowel groene aankoopintenties te detecteren als het eigen digitale koolstofvoetafdruk te minimaliseren.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

Dit paper introduceert 'Reading Activity Traces' (RATs), een concept dat lezen als creatieve activiteit beschouwt door de interpretatieve arbeid die vaak door algoritmes wordt overgeslagen, zichtbaar te maken en te documenteren.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Dit paper introduceert HCT-QA, een uitgebreid benchmark voor vraag-antwoordtaken op mensgerichte tabellen, dat duizenden realistische en synthetische tabellen bevat om de prestaties van taal- en visiemodellen te evalueren en te verbeteren via fine-tuning.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

← Vorige Volgende →