Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

Diese Studie untersucht die Wirksamkeit von Daten-Augmentierung und Feature-Enhancement-Techniken zur Hate-Speech-Erkennung und zeigt, dass das Open-Source-Modell gpt-oss-20b die besten Ergebnisse erzielt, während traditionelle Ansätze wie Delta TF-IDF durch Daten-Augmentierung ebenfalls hohe Genauigkeiten erreichen, wobei die Erkennung impliziter Hassrede weiterhin eine Herausforderung bleibt.

Brian Jing Hong Nge, Stefan Su, Thanh Thi Nguyen + 3 more2026-03-06💻 cs

AI-Assisted Moot Courts: Simulating Justice-Specific Questioning in Oral Arguments

Die Studie untersucht, wie KI-Modelle auf Basis von US-Supreme-Court-Transkripten Richterfragen für Moot-Court-Trainings simulieren können, und stellt ein zweistufiges Evaluierungsframework vor, das zwar Realismus und inhaltliche Relevanz bestätigt, aber auch signifikante Mängel wie mangelnde Diversität und Sycophancy aufdeckt, die bei herkömmlichen Evaluierungsmethoden oft unentdeckt bleiben.

Kylie Zhang, Nimra Nadeem, Lucia Zheng + 2 more2026-03-06💻 cs

Privacy-Aware Camera 2.0 Technical Report

Dieser technische Bericht stellt ein neues, datenschutzfreundliches Wahrnehmungsframework namens „Privacy-Aware Camera 2.0" vor, das mithilfe des AI-Flow-Paradigmas und einer Edge-Cloud-Architektur Rohbilder am Rand in irreversible abstrakte Merkmalsvektoren umwandelt, um gleichzeitig den Datenschutz zu gewährleisten und eine semantische Verhaltensanalyse sowie eine visuelle Rekonstruktion über eine „dynamische Kontur"-Sprache in der Cloud zu ermöglichen.

Huan Song, Shuyu Tian, Ting Long + 5 more2026-03-06💻 cs

Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents

Die Studie vergleicht ein faktenbasiertes Speichersystem mit Langkontext-LLMs und zeigt, dass während Letztere bei der faktischen Abrufleistung oft überlegen sind, das Speichersystem bei langen Kontexten und vielen Interaktionen aufgrund eines günstigeren Kosten-Nutzen-Verhältnisses eine effiziente Alternative für persistente Agenten darstellt.

Natchanon Pollertlam, Witchayut Kornsuwannawit2026-03-06💬 cs.CL

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

Diese Metaanalyse zeigt, dass KI-Modelle beim automatisierten Bewerten von Kurzantworten hinter menschlichen Experten zurückbleiben, wobei die Schwierigkeit für Menschen keine Vorhersagekraft für die KI-Leistung hat, Decoder-Architekturen signifikant schlechter abschneiden als Encoder und zudem Verzerrungen sowie Diskriminierung in Bildungskontexten aufweisen.

Michael Hardy2026-03-06💬 cs.CL

From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models

Die Arbeit stellt GDS vor, eine Methode zur Erkennung von Vorab-Trainingsdaten in großen Sprachmodellen, die auf der Analyse von Gradientenabweichungen (Magnitude, Lage und Konzentration der Parameteraktualisierungen) basiert und damit bestehende likelihood-basierte Ansätze in Bezug auf Leistung und Übertragbarkeit übertrifft.

Ruiqi Zhang, Lingxiang Wang, Hainan Zhang + 2 more2026-03-06💬 cs.CL