OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

Deze paper introduceert OfficeQA Pro, een nieuwe benchmark gebaseerd op een uitgebreid corpus van US Treasury Bulletins die aantoont dat zelfs de meest geavanceerde AI-agenten moeite hebben met grondig, op documenten gebaseerd redeneren in zakelijke contexten, waarbij gestructureerde documentrepresentaties weliswaar de prestaties verbeteren maar nog steeds aanzienlijke ruimte voor verbetering laten.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing ChenTue, 10 Ma💬 cs.CL

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

Dit artikel introduceert ADC-SID, een raamwerk dat adaptief ruis in collaboratieve informatie filtert door de uitlijning tussen gedrag en inhoud aan te passen en dynamische wegingen toe te passen, waardoor robuustere semantische ID's worden gegenereerd die beter presteren op items met lange staart in aanbevelingssystemen.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing ZhangThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Dit onderzoek toont aan dat de volgorde van beoordeling (eerst een cijfer geven versus eerst een review schrijven) consumentenbeoordelingen polariseert via een combinatie van affectieve heuristieken en cognitieve inspanning, waarbij de volgorde 'eerst cijfer' leidt tot extremere scores afhankelijk van de servicekwaliteit en producttype.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

Dit artikel introduceert Differentiable Geometric Indexing (DGI), een nieuw generatief zoekparadigma dat optimalisatieblokkades en geometrische conflicten oplost door een volledig differentieerbare route en isotrope optimalisatie te combineren, wat leidt tot superieure prestaties, vooral bij lange staart-items.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi ZengThu, 12 Ma💻 cs

A Hypergraph-Based Framework for Exploratory Business Intelligence

Dit paper introduceert ExBI, een nieuw systeem dat een hypergraafdatamodel en steekproefgebaseerde algoritmen combineert om Exploratory Business Intelligence te ondersteunen door dynamische schema-evolutie en herbruikbaarheid mogelijk te maken, wat resulteert in aanzienlijke snelheidswinsten ten opzichte van bestaande systemen zoals Neo4j en MySQL bij het behouden van hoge analytische nauwkeurigheid.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

Deze studie introduceert een interpreteerbare, door LLM's ondersteunde pipeline die vier Chinese metafooridentificatieprotocollen omzet in uitvoerbare regelscripts, waarmee voor het eerst een cross-protocol vergelijking wordt gedaan die aantoont dat de keuze van het protocol de grootste variatiebron is en dat deze transparante architectuur concurrerende prestaties levert.

Weihang Huang, Mengna LiuThu, 12 Ma💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Deze paper introduceert een tweetalig corpus en een machine-actievere GND-taxonomie voor het trainen en evalueren van AI-systemen die bibliothecarissen ondersteunen bij het automatisch toewijzen van onderwerpswoorden aan catalogusrecords.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma SuominenThu, 12 Ma💬 cs.CL