HELIOS: Harmonizing Early Fusion, Late Fusion, and LLM Reasoning for Multi-Granular Table-Text Retrieval

Het artikel introduceert HELIOS, een nieuw model dat vroege en late fusie combineert met LLM-redenering om de prestaties van tabel-tekstretriever voor open-domein vragen te verbeteren door onnodige context te filteren, relevante knopen dynamisch uit te breiden en logische inferentie op ster-graf-niveau uit te voeren, wat leidt tot aanzienlijke verbeteringen op de OTT-QA-benchmark.

Sungho Park, Joohyung Yun, Jongwuk Lee + 1 more2026-03-04💬 cs.CL

Characterizing Memorization in Diffusion Language Models: Generalized Extraction and Sampling Effects

Dit artikel presenteert een systematische theoretische en empirische analyse van memorisatie in diffusion-taalmodellen, waarbij wordt aangetoond dat een verhoogde steekproefresolutie de kans op exacte extractie van trainingsdata vergroot, maar dat deze modellen onder bepaalde omstandigheden aanzienlijk minder gevoelig zijn voor het lekken van persoonsgegevens dan autoregressieve modellen.

Xiaoyu Luo, Wenrui Yu, Qiongxiu Li + 1 more2026-03-04💬 cs.CL

A Directed Graph Model and Experimental Framework for Design and Study of Time-Dependent Text Visualisation

Dit onderzoek introduceert een gericht graafmodel en een experimenteel kader voor tijdsafhankelijke tekstvisualisatie, waarbij een studie met synthetische LLM-gegenereerde teksten aantoont dat het voor gebruikers lastig is om patronen te herkennen en dat visualisaties mogelijk meer op de individuele gebruiker moeten worden afgestemd.

Songhai Fan, Simon Angus, Tim Dwyer + 3 more2026-03-04💬 cs.CL