cs.CL Arbeiten | Gist.Science

Diffusion Language Models Are Natively Length-Aware

Die vorgestellte Arbeit zeigt, dass Diffusionssprachmodelle durch eine zero-shot-Mechanik zur dynamischen Vorschätzung der erforderlichen Antwortlänge aus dem latenten Prompt-Input erheblich rechnerisch effizienter werden, ohne dabei die Leistung auf gängigen Benchmarks zu beeinträchtigen.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

A Causal Graph Approach to Oppositional Narrative Analysis

Die Arbeit stellt ein graphbasiertes Framework vor, das oppositionelle Narrative durch die Modellierung von Entitätsinteraktionen und kausaler Schätzung auf Knotenebene analysiert und dabei eine überlegene Klassifizierungsgenauigkeit sowie interpretierbare Ergebnisse im Vergleich zu herkömmlichen Black-Box-Methoden erzielt.

Diego Revilla, Martin Fernandez-de-Retana, Lingfeng Chen, Aritz Bilbao-Jayo, Miguel Fernandez-de-Retana2026-03-09🤖 cs.AI

Do Compact SSL Backbones Matter for Audio Deepfake Detection? A Controlled Study with RAPTOR

Die Studie RAPTOR zeigt, dass für die robuste Erkennung von Audio-Deepfakes über verschiedene Domänen hinweg die Art des SSL-Vor-Trainings (insbesondere multilinguales HuBERT) entscheidender ist als die reine Modellgröße, wobei kompakte Modelle mit 100 Millionen Parametern kommerzielle Großsysteme übertreffen und eine stabilere Kalibrierung unter Störungen aufweisen.

Ajinkya Kulkarni, Sandipana Dowerah, Atharva Kulkarni, Tanel Alumäe, Mathew Magimai Doss2026-03-09🤖 cs.AI

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

Die vorgestellte Arbeit schlägt ein zweistufiges Framework vor, das durch den Übergang von kontrastivem Lernen auf künstlichen Alphabeten zu selbstüberwachtem Wissenstransfer auf historische Schriften eine robuste Ähnlichkeitsmessung für Glyphen ermöglicht, ohne dass ground-truth evolutionäre Beziehungen erforderlich sind.

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

Das Paper stellt CRIMSON vor, ein klinisch fundiertes Evaluierungsframework für die Generierung von Röntgenbefunden, das mithilfe einer detaillierten Fehler-Taxonomie und gewichteten klinischen Bedeutungen eine genauere Bewertung der diagnostischen Korrektheit und Patientensicherheit im Vergleich zu bestehenden Metriken ermöglicht.

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI

MAPO: Mixed Advantage Policy Optimization for Long-Horizon Multi-Turn Dialogue

Die Arbeit stellt MAPO vor, einen effizienten, kritikerfreien Reinforcement-Learning-Algorithmus, der durch dichte Prozessrückmeldungen und einen gemischten Vorteilsschätzer die Stabilität und Leistung von KI-Modellen bei langfristigen, subjektiven Mehrfachdialogen signifikant verbessert.

Naifan Zhang, Ruihan Sun, Jinwei Su, Hengjie Yang, Zhengyuan Pan, Zhaohan Chen, Xiaofan Zhang2026-03-09🤖 cs.AI

Wisdom of the AI Crowd (AI-CROWD) for Ground Truth Approximation in Content Analysis: A Research Protocol & Validation Using Eleven Large Language Models

Die Studie stellt das AI-CROWD-Protokoll vor, das durch die Aggregation der Konsensentscheidungen eines Ensembles aus elf großen Sprachmodellen eine zuverlässige Annäherung an fehlende Ground-Truth-Daten für die groß angelegte Inhaltsanalyse ermöglicht.

Luis de-Marcos, Manuel Goyanes, Adrián Domínguez-Díaz2026-03-09💬 cs.CL

LIT-RAGBench: Benchmarking Generator Capabilities of Large Language Models in Retrieval-Augmented Generation

Die Arbeit stellt LIT-RAGBench vor, ein umfassendes Benchmark-System, das die Fähigkeiten von Large Language Models in Retrieval-Augmented Generation durch die Bewertung von fünf Kategorien (Integration, Schlussfolgern, Logik, Tabellen und Enthaltung) auf der Basis eines neu erstellten Datensatzes mit japanischen und englischen Fragen systematisch misst.

Koki Itai, Shunichi Hasegawa, Yuta Yamamoto, Gouki Minegishi, Masaki Otsuki2026-03-09💬 cs.CL

FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

Die Arbeit stellt FlashPrefill vor, ein Framework, das durch sofortige Mustererkennung und dynamische Schwellenwertbildung die quadratische Komplexität der Aufmerksamkeit überwindet und so eine ultra-schnelle Vorverarbeitung für lange Kontexte ermöglicht, die selbst bei 256K Token eine 27,78-fache Beschleunigung erreicht.

Qihang Fan, Huaibo Huang, Zhiying Wu, Juqiu Wang, Bingning Wang, Ran He2026-03-09🤖 cs.AI

SPOT: Span-level Pause-of-Thought for Efficient and Interpretable Latent Reasoning in Large Language Models

Die Arbeit stellt SPOT vor, ein Framework, das durch spanenweise semantische Ausrichtung und eine entschlüsselbare, eingefrorene Kopf-Beschränkung explizite Chain-of-Thought-Argumentation in effiziente und interpretierbare latente Pausetoken komprimiert, wodurch die Genauigkeit gesteigert und der Token-Aufwand signifikant reduziert wird.

Yunlong Chu, Minglai Shao, Yuhang Liu, Bing Hao, Yumeng Lin, Jialu Wang, Ruijie Wang2026-03-09💬 cs.CL

Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion

Diese Studie zeigt, dass aktuelle große Sprachmodelle trotz guter Leistung bei allgemeinen sozialen Themen in asiatischen Ländern häufig religiöse Minderheitenmeinungen falsch abbilden und negative Stereotype verstärken, wobei einfache Eingabeanpassungen diese kulturellen Lücken nur teilweise schließen können.

Hari Shankar, Vedanta S P, Sriharini Margapuri, Debjani Mazumder, Ponnurangam Kumaraguru, Abhijnan Chakraborty2026-03-09💬 cs.CL

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

Das Paper stellt EpisTwin vor, ein neuro-symbolisches Framework, das durch die Verankerung generativer KI in einem personalisierten Wissensgraphen und die dynamische visuelle Verfeinerung die Fragmentierung persönlicher Daten überwindet und so vertrauenswürdige, ganzheitliche Sinnbildung ermöglicht.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

Continual Adaptation for Pacific Indigenous Speech Recognition

Diese Studie zeigt, dass die Anpassung von Sprachgrundmodellen an ressourcenarme pazifische indigene Sprachen durch Datenknappheit und das Problem des katastrophalen Vergessens bei sequenziellem Lernen erschwert wird, was eine dringende Notwendigkeit robusterer Anpassungsstrategien unterstreicht.

Yang Xiao, Aso Mahmudi, Nick Thieberger, Eliathamby Ambikairajah, Eun-Jung Holden, Ting Dang2026-03-09💬 cs.CL

The Art That Poses Back: Assessing AI Pastiches after Contemporary Artworks

Diese Studie zeigt, dass KI-generierte Pastiches zeitgenössischer Kunstwerke zwar farblich und texturähnlich sein können, jedoch in Bezug auf Komposition, Konzept und emotionale Tiefe oft als kontextlose Paraphrasen wahrgenommen werden, was die Notwendigkeit eines multidimensionalen Bewertungsansatzes unterstreicht.

Anca Dinu, Andreiana Mihail, Andra-Maria Florescu, Claudiu Creanga2026-03-09💬 cs.CL

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Die Arbeit stellt SAHOO vor, ein praktisches Framework, das durch einen gelernten Zielabweichungsindex, die Durchsetzung sicherheitskritischer Invarianten und die Quantifizierung von Regressionsrisiken die Ausrichtungsdrift während des rekursiven Selbstverbesserungsprozesses überwacht und kontrolliert, um signifikante Qualitätssteigerungen bei gleichzeitiger Wahrung von Sicherheitsgrenzen zu ermöglichen.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

Transparent AI for Mathematics: Transformer-Based Large Language Models for Mathematical Entity Relationship Extraction with XAI

Diese Studie stellt einen transparenten, auf Transformer-Modellen (insbesondere BERT) basierenden Rahmen für die Extraktion mathematischer Entitätsbeziehungen vor, der durch SHAP-basierte Erklärbarkeit (XAI) eine hohe Genauigkeit von 99,39 % mit nachvollziehbaren Modellentscheidungen verbindet.

Tanjim Taharat Aurpa2026-03-09💬 cs.CL

Evaluation of Deontic Conditional Reasoning in Large Language Models: The Case of Wason's Selection Task

Diese Studie zeigt, dass Large Language Models wie Menschen beim Wason-Selektionstest bei deontischen Regeln besser abschneiden als bei deskriptiven und dabei ähnliche Fehlermuster wie die menschliche Matching-Bias aufweisen.

Hirohiko Abe, Kentaro Ozeki, Risako Ando, Takanobu Morishita, Koji Mineshima, Mitsuhiro Okada2026-03-09💬 cs.CL

From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring

Diese Studie bietet den ersten umfassenden empirischen Vergleich verschiedener LLM-basierter Ansätze für die automatisierte Bewertung von IELTS-Aufsätzen und zeigt, dass eine Kombination aus überwachtem Feinabstimmen und retrievalgestützter Generierung mit einer F1-Score von 93 % die beste Leistung erzielt.

Minh Hoang Nguyen, Vu Hoang Pham, Xuan Thanh Huynh, Phuc Hong Mai, Vinh The Nguyen, Quang Nhut Huynh, Huy Tien Nguyen, Tung Le2026-03-09💬 cs.CL

Abductive Reasoning with Syllogistic Forms in Large Language Models

Diese Arbeit untersucht die Genauigkeit von Large Language Models beim abduktiven Schließen, indem sie syllogistische Datensätze umwandelt, um zu prüfen, ob diese Modelle ähnliche Verzerrungen wie Menschen aufweisen und wie sich kontextualisiertes Denken über formale Deduktion hinaus verbessern lässt.

Hirohiko Abe, Risako Ando, Takanobu Morishita Kentaro Ozeki, Koji Mineshima, Mitsuhiro Okada2026-03-09🤖 cs.AI

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

Die Arbeit stellt PONTE vor, ein Framework für personalisierte und vertrauenswürdige Erklärungen in der KI, das durch einen geschlossenen Regelkreis aus Präferenzmodellierung, generativen Modellen und Verifizierungsmodulen die Lücken zwischen technischer Genauigkeit und individuellen Nutzerbedürfnissen schließt.

Vittoria Vineis, Matteo Silvestri, Lorenzo Antonelli, Filippo Betello, Gabriele Tolomei2026-03-09🤖 cs.AI

← Zurück Weiter →