Optimizing What We Trust: Reliability-Guided QUBO Selection of Multi-Agent Weak Framing Signals for Arabic Sentiment Prediction

Die Autoren stellen einen Zuverlässigkeits-bewussten Rahmen für schwache Überwachung vor, der Multi-Agenten-LLMs nutzt, um epistemische Signale zu extrahieren und mittels QUBO-basierter Subselektion ausgewogene, redundanzarme Datensätze für die arabische Sentiment-Analyse zu kuratieren, die übertragbare Strukturen erfassen, ohne starke Baselines zu beeinträchtigen.

Rabab Alkhalifa2026-03-06💻 cs

A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

Diese Studie stellt ein umfassendes End-to-End-Framework für die Entwicklung von domänenspezifischen Large Language Models in der Verbrennungswissenschaft vor, das eine multimodale Wissensdatenbank, ein Evaluierungsbenchmark und einen dreistufigen Wissensinjektionspfad kombiniert, um die Grenzen reiner Retrieval-Augmented-Generation zu überwinden und durch strukturierte Wissensgraphen sowie fortgesetztes Pretraining fundierte Modelle zu schaffen.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs

Vibe Code Bench: Evaluating AI Models on End-to-End Web Application Development

Die Studie stellt mit „Vibe Code Bench" einen neuen Benchmark für die End-to-End-Entwicklung von Webanwendungen vor, der zeigt, dass selbst die besten aktuellen KI-Modelle bei der vollständigen Erstellung funktionsfähiger Apps noch erhebliche Schwierigkeiten haben und dabei die Bedeutung von Selbsttests sowie die Auswirkungen der Evaluatoren-Auswahl auf die Ergebnisse aufdeckt.

Hung Tran, Langston Nashold, Rayan Krishnan + 2 more2026-03-06💻 cs

Coordinated Semantic Alignment and Evidence Constraints for Retrieval-Augmented Generation with Large Language Models

Diese Arbeit stellt eine Methode für retrieval-augmentierte Generierung vor, die durch die koordinierte Modellierung semantischer Ausrichtung und expliziter Evidenzbeschränkungen die faktische Zuverlässigkeit und Verifizierbarkeit von Large Language Models verbessert, indem sie semantische Fehlausrichtungen und unzureichende Evidenznutzung überwindet.

Xin Chen, Saili Uday Gadgil, Jiarong Qiu2026-03-06💻 cs

Stan: An LLM-based thermodynamics course assistant

Die Arbeit stellt „Stan" vor, ein auf lokalen Open-Weight-Modellen basierendes Assistenzsystem für einen Thermodynamik-Kurs, das mittels Retrieval-Augmented Generation sowohl Studierenden kontextbezogene Antworten als auch Lehrenden strukturierte Kursanalysen aus denselben Transkripten bietet, wobei Datenschutz und Reproduzierbarkeit durch den Verzicht auf Cloud-APIs gewährleistet werden.

Eric M. Furst, Vasudevan Venkateshwaran2026-03-06🔬 physics