GraphMERT: Efficient and Scalable Distillation of Reliable Knowledge Graphs from Unstructured Data

Die Arbeit stellt GraphMERT vor, ein effizientes, kleines neuronales Modell, das zuverlässige, faktenbasierte und ontologisch konsistente Wissensgraphen aus unstrukturierten Texten ableitet und dabei die Zuverlässigkeit und Skalierbarkeit bestehender Neurosymbolischer Ansätze sowie die Leistungsfähigkeit großer Sprachmodelle übertrifft.

Margarita Belova, Jiaxin Xiao, Shikhar Tuli + 1 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Die Arbeit stellt COGS vor, ein dateneffizientes Framework, das durch die Zerlegung von Seed-Fragen in primitive Faktoren und deren systematische Neukombination mit synthetischen Bildern große Mengen an Trainingsdaten für das visuelle Schlussfolgern von Multi-modalen Large Language Models generiert und so deren Leistungsfähigkeit insbesondere bei komplexen, zusammengesetzten Aufgaben erheblich steigert.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

Die Arbeit stellt REVISION vor, ein Framework, das durch die Kombination von offline-gestützter Implizit-Intent-Mining mit großen Modellen und einer online-optimierten Entscheidungsfindung die Diskrepanz zwischen Nutzerabsicht und Suchsystem in Taobos visuellen Suchsystemen adressiert und so die Nicht-Klick-Rate signifikant senkt.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

Die Arbeit stellt MuSaG vor, das erste deutschsprachige multimodale Datenset zur Sarkasmerkennung mit synchronisierten Text-, Audio- und Videodaten aus Fernsehsendungen, das zeigt, dass aktuelle Modelle im Gegensatz zu Menschen, die stark auf Audiohinweise angewiesen sind, primär auf Text basieren, und dient als Ressource für die Entwicklung robusterer multimodaler Systeme.

Aaron Scott, Maike Züfle, Jan Niehues2026-03-05🤖 cs.AI

Dutch Metaphor Extraction from Cancer Patients' Interviews and Forum Data using LLMs and Human in the Loop

Diese Arbeit stellt eine Methode zur Extraktion von Metaphern aus niederländischen Interviews und Forenbeiträgen von Krebspatienten mittels Large Language Models und eines Human-in-the-Loop-Ansatzes vor, um das Korpus HealthQuote.NL zu erstellen und damit die Patientenversorgung sowie die Kommunikation im Gesundheitswesen zu verbessern.

Lifeng Han, David Lindevelt, Sander Puts + 2 more2026-03-05💬 cs.CL