Link Prediction for Event Logs in the Process Industry

Diese Arbeit stellt ein Record-Linking-Modell vor, das durch die Kombination von Cross-Document Coreference Resolution, Natural Language Inference und Semantic Text Similarity die Fragmentierung von Schichtbuch-Ereignisprotokollen in der deutschen Prozessindustrie überwindet und die Datenqualität für graphbasierte Retrieval-Augmented-Generation-Anwendungen signifikant verbessert.

Anastasia Zhukova, Thomas Walton, Christian E. Lobmüller + 1 more2026-03-04💬 cs.CL

Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers

Diese Arbeit stellt einen theoretischen Rahmen vor, der die Kolmogorov-Komplexität mit Deep Learning verbindet, indem sie zeigt, dass asymptotisch optimale Beschreibungsziel-Funktionen für Transformer-Modelle existieren und durch eine variationale Formulierung mit adaptivem Gaußschen Mischprior praktisch umsetzbar sind, um bessere Generalisierung durch Kompression zu erreichen.

Peter Shaw, James Cohan, Jacob Eisenstein + 1 more2026-03-04💬 cs.CL

Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective

Diese Arbeit analysiert theoretisch die Vor- und Nachteile von Reinforcement Learning für die Planung in Sprachmodellen und zeigt, dass Exploration entscheidend für die Generalisierung ist, während Policy Gradient zu einem Diversitätsverlust führt, wohingegen Q-Learning durch Off-Policy-Lernen und Diversitätserhaltung Vorteile bietet, sofern die Belohnungsfunktion sorgfältig gestaltet wird.

Siwei Wang, Yifei Shen, Haoran Sun + 5 more2026-03-04📊 stat

Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity

Die Studie zeigt, dass die alleinige Verwendung von n-Gram-Neuartigkeit als Metrik für Textkreativität unzureichend ist, da sie den Aspekt der Angemessenheit ignoriert und bei KI-Modellen oft mit geringerer Pragmatik einhergeht, während menschliche Expertenbewertungen und fortgeschrittene LLMs als Richter eine genauere Bewertung ermöglichen.

Arkadiy Saakyan, Najoung Kim, Smaranda Muresan + 1 more2026-03-04💬 cs.CL

LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

Die Arbeit stellt LaDiR vor, ein neues Reasoning-Framework, das die Ausdruckskraft kontinuierlicher latenter Räume mit den iterativen Verfeinerungsfähigkeiten latenter Diffusionsmodelle kombiniert, um die Genauigkeit, Vielfalt und Interpretierbarkeit von Schlussfolgerungen in großen Sprachmodellen über die Grenzen der autoregressiven Generierung hinaus zu verbessern.

Haoqiang Kang, Yizhe Zhang, Nikki Lijing Kuang + 4 more2026-03-04💬 cs.CL

Are Language Models Borrowing-Blind? A Multilingual Evaluation of Loanword Identification across 10 Languages

Diese Studie zeigt, dass vortrainierte Sprachmodelle trotz expliziter Anweisungen und Kontextinformationen über 10 Sprachen hinweg eine schlechte Fähigkeit zur Unterscheidung von Lehnwörtern von einheimischem Wortschatz aufweisen, was ihre Verzerrung zugunsten von Lehnwörtern bestätigt und Implikationen für die Entwicklung von NLP-Tools für Minderheitensprachen hat.

Mérilin Sousa Silva, Sina Ahmadi2026-03-04💬 cs.CL

STARS: Synchronous Token Alignment for Robust Supervision in Large Language Models

Die Arbeit stellt STARS vor, einen neuen Decoding-Algorithmus, der durch die Entkopplung der Segmentierung von Unsicherheitsmetriken und die Einführung synchroner, festgelegter Intervalle die Zuverlässigkeit der LLM-Ausrichtung verbessert und gleichzeitig die Hardwareauslastung optimiert, wodurch er herkömmliche dynamische Methoden und Fine-Tuning in Bezug auf Effizienz und Robustheit übertrifft.

Mohammad Atif Quamar, Mohammad Areeb, Mikhail Kuznetsov + 2 more2026-03-04💬 cs.CL

Are We Asking the Right Questions? On Ambiguity in Natural Language Queries for Tabular Data Analysis

Die Autoren schlagen ein kooperatives Rahmenwerk vor, das Mehrdeutigkeiten in natürlichen Sprachabfragen zu tabellarischen Daten nicht als Mangel, sondern als intentional gestaltete Interaktion zwischen Nutzer und System betrachtet, um damit bestehende Evaluierungsansätze zu kritisieren und neue Richtungen für die Gestaltung solcher Schnittstellen aufzuzeigen.

Daniel Gomm, Cornelius Wolff, Madelon Hulsebos2026-03-04💬 cs.CL