Probing Memes in LLMs: A Paradigm for the Entangled Evaluation World

Diese Arbeit stellt mit „Probing Memes" ein neues Evaluationsparadigma vor, das Large Language Models als Träger kultureller Gene (Memes) betrachtet und durch eine Wahrnehmungsmatrix die komplexen Wechselwirkungen zwischen Modellen und Daten analysiert, um verborgene Fähigkeitsstrukturen und populationsbasierte Verhaltensmerkmale zu quantifizieren, die traditionelle Methoden übersehen.

Luzhou Peng, Zhengxin Yang, Honglu Ji + 6 more2026-03-06💻 cs

Multiclass Hate Speech Detection with RoBERTa-OTA: Integrating Transformer Attention and Graph Convolutional Networks

Die Studie stellt RoBERTa-OTA vor, ein hybrides Modell, das Transformer-Aufmerksamkeitsmechanismen mit Graph Convolutional Networks und ontologischem Wissen kombiniert, um die Genauigkeit der multiklassigen Hassrede-Erkennung über demografische Kategorien hinweg signifikant zu steigern, ohne dabei die Recheneffizienz nennenswert zu beeinträchtigen.

Mahmoud Abusaqer, Jamil Saquer2026-03-06💻 cs

The Thinking Boundary: Quantifying Reasoning Suitability of Multimodal Tasks via Dual Tuning

Die vorgestellte Arbeit führt das „Dual Tuning"-Framework ein, um durch den systematischen Vergleich von Chain-of-Thought- und Direkt-Antwort-Training eine „Denkgrenze" zu definieren, die bestimmt, für welche multimodalen Aufgaben reasoning-basierte Ansätze tatsächlich vorteilhaft sind und somit eine ressourcenschonende, adaptive Trainingsstrategie ermöglicht.

Ruobing Zheng, Tianqi Li, Jianing Li + 3 more2026-03-06💻 cs

Optimizing What We Trust: Reliability-Guided QUBO Selection of Multi-Agent Weak Framing Signals for Arabic Sentiment Prediction

Die Autoren stellen einen Zuverlässigkeits-bewussten Rahmen für schwache Überwachung vor, der Multi-Agenten-LLMs nutzt, um epistemische Signale zu extrahieren und mittels QUBO-basierter Subselektion ausgewogene, redundanzarme Datensätze für die arabische Sentiment-Analyse zu kuratieren, die übertragbare Strukturen erfassen, ohne starke Baselines zu beeinträchtigen.

Rabab Alkhalifa2026-03-06💻 cs

A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

Diese Studie stellt ein umfassendes End-to-End-Framework für die Entwicklung von domänenspezifischen Large Language Models in der Verbrennungswissenschaft vor, das eine multimodale Wissensdatenbank, ein Evaluierungsbenchmark und einen dreistufigen Wissensinjektionspfad kombiniert, um die Grenzen reiner Retrieval-Augmented-Generation zu überwinden und durch strukturierte Wissensgraphen sowie fortgesetztes Pretraining fundierte Modelle zu schaffen.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs