Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

Dit onderzoek evalueert de effectiviteit van data-augmentatie en kenmerkverbetering voor de detectie van haatzaaiende taal, waarbij het aantoont dat open-source modellen zoals gpt-oss-20b over het algemeen het beste presteren, hoewel traditionele methoden zoals Delta TF-IDF met augmentatie op specifieke datasets tot 98,2% nauwkeurigheid kunnen bereiken, en benadrukt dat de detectie van impliciete haatzaaiende taal complexer is en sterk afhankelijk is van de interactie tussen dataset, model en techniek.

Brian Jing Hong Nge, Stefan Su, Thanh Thi Nguyen + 3 more2026-03-06💻 cs

Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents

Deze studie vergelijkt fact-gebaseerde geheugensystemen met lange-context LLM's voor persistente agents en concludeert dat, hoewel lange-context modellen vaak betere feitelijke recall bieden, het geheugenarchitectuur op de lange termijn kostenefficiënter is en een waardevol alternatief biedt voor productiedeployments afhankelijk van de contextlengte en het type taak.

Natchanon Pollertlam, Witchayut Kornsuwannawit2026-03-06💬 cs.CL

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

Deze meta-analyse onthult dat AI-modellen voor het beoordelen van korte antwoorden significant tekortschieten in vergelijking met menselijke experts, waarbij decoder-only-architecturen slechter presteren dan encoders, de moeilijkheidsgraad van de taak geen invloed heeft op de AI-prestaties, en er sprake is van ernstige gevoeligheid voor formulering en raciale discriminatie in hoge-stakes onderwijscontexten.

Michael Hardy2026-03-06💬 cs.CL