cs.CL Arbeiten | Gist.Science

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI ist ein erklärbares Framework zur Erkennung maschinell generierter Texte, das curvature-basierte Signale und stilometrische Merkmale in einem XGBoost-Modell kombiniert und durch SHAP-Analysen sowie eine LLM-gestützte Schicht verständliche, natürliche Begründungen für die Klassifizierung liefert.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

Diese Studie untersucht, wie Chain-of-Thought-Prompting die Privatsphäre-Risiken durch die Offenlegung personenbezogener Daten in LLM-Antworten erhöht, und bewertet verschiedene Gatekeeper-Methoden zur Minderung dieses Risikos, wobei keine einzelne Lösung universell überlegen ist und hybride Ansätze empfohlen werden.

Patrick Ahrend, Tobias Eder, Xiyang Yang, Zhiyi Pan, Georg Groh2026-03-09💬 cs.CL

RACAS: Controlling Diverse Robots With a Single Agentic System

Die Studie stellt RACAS vor, ein roboteragnostisches Agentic-System, das mittels natürlicher Sprache und großer Sprachmodelle diverse Roboterplattformen ohne Anpassung des Quellcodes steuern kann und so die Hürden für die Prototypenentwicklung senkt.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

Die Studie zeigt, dass moralische Urteile von Large Language Models durch narrative Perspektiven und Prompt-Strukturen stark manipuliert werden können, was zu erheblicher Instabilität und Reproduzierbarkeitsproblemen führt, insbesondere bei moralisch mehrdeutigen Fällen.

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

FreeTxt-Vi ist ein kostenloses, webbasiertes Toolkit, das eine integrierte Pipeline für die Segmentierung, Sentiment-Analyse und Zusammenfassung von vietnamesisch-englischen Texten bietet und dabei durch eine hybride Segmentierungsstrategie sowie feinabgestimmte Transformer-Modelle eine wettbewerbsfähige Leistung erzielt, um die textbasierte Forschung in unterrepräsentierten Sprachen zu erleichtern.

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

Die Studie stellt Ptychi-Evolve vor, ein autonomes Framework, das mittels evolutionärer Large-Language-Model-Reasoning-Verfahren neuartige Regularisierungsalgorithmen für die Ptychographie entwickelt, die in Experimenten mit verschiedenen Datensätzen konventionelle Rekonstruktionsmethoden signifikant übertreffen.

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

Diese Arbeit vergleicht die Robustheit von Retrieval-Augmented Generation (RAG) basierend auf einem Wissensgraphen (GraphRAG) mit einem Standard-RAG-Baseline unter Verwendung des RGB-Benchmarks und zeigt, dass angepasste GraphRAG-Methoden die Zuverlässigkeit von LLMs in Szenarien wie Rauschresistenz und negativer Ablehnung verbessern.

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Diese Studie analysiert auf Basis einer globalen Umfrage unterschiedliche kulturelle Perspektiven und Erwartungen an Generative KI, um daraus handlungsleitende Empfehlungen für eine kultursensible und partizipative KI-Entwicklung abzuleiten.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

Diese Arbeit stellt eine Tensor-Transformer-Architektur vor, die durch strukturierte spektrale Faktorisierung des Einbettungsraums die Encoder-Parameter um bis zu 75 % reduziert, während sie die Leistungsfähigkeit und Semantik herkömmlicher Transformer-Modelle bewahrt.

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

Dieser Positionspapier plädiert anhand des Fallbeispiels Guaraní für einen oralen Ansatz in der KI, der durch eine Multi-Agenten-Architektur die mündlichen Kommunikationspraktiken indigener Gemeinschaften respektiert und so die Dominanz textbasierter Systeme überwindet.

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

Das Paper stellt CodeScout vor, einen Ansatz zur kontextuellen Verfeinerung von Problemstellungen durch eine leichte Vorab-Analyse des Codebases, der die Erfolgsrate von Software-Agenten auf der SWEBench-Verified-Benchmark um 20 % steigert, indem er unpräzise Anfragen in umfassende, handlungsorientierte Aufgaben umwandelt.

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

Die Studie stellt NERdME vor, einen neuartigen Datensatz mit annotierten README-Dateien, der die Lücke bei der Extraktion von Implementierungsdetails aus Code-Repositories schließt und die automatische Erforschung von Forschungsartefakten ermöglicht.

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

Die Studie stellt PVminerLLM vor, einen speziell feinabgestimmten Large Language Model, der Patiententexte zuverlässig strukturiert analysiert und dabei Prompt-basierte Baseline-Modelle in der Extraktion von sozialen und erfahrungsbasierten Gesundheitsfaktoren deutlich übertrifft.

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

Dieser Beitrag stellt eine Theorie-fundierte Taxonomie vor, die durch einen hybriden deduktiv-induktiven Prozess entwickelt wurde, um tutorielle Interaktionen in vier Kategorien zu strukturieren und so eine skalierbare Analyse von Lehrstrategien mittels KI und empirischer Forschung zu ermöglichen.

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

Die Arbeit stellt „Proof-of-Guardrail" vor, ein System, das mithilfe von Trusted Execution Environments (TEEs) kryptografische Nachweise für die Ausführung von Sicherheitsguardrails durch KI-Agenten ermöglicht, um das Vertrauen in die Sicherheit zu stärken, gleichzeitig aber vor Täuschungsversuchen durch böswillige Entwickler warnt.

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

Das Paper stellt RouteGoT vor, ein budgetkontrollierbares, knotenadaptives Routing-Framework für Graph-of-Thoughts-Reasoning, das durch die dynamische Zuweisung von leistungsstarken Modellen für Planungs- und Synthesetasks sowie leichtgewichtiger Modelle für einfachere Teilaufgaben die Token-Nutzung um durchschnittlich 79,1 % reduziert und gleichzeitig die Genauigkeit im Vergleich zu bestehenden Methoden wie AGoT verbessert.

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

Das Paper stellt HART vor, ein neuartiges Framework zur feinkörnigen Attribution von Halluzinationen in großen Sprachmodellen, das durch eine strukturierte Vier-Phasen-Analyse und einen speziell dafür erstellten Datensatz die Interpretierbarkeit von Fehlern sowie die Nachverfolgbarkeit von Belegen verbessert.

Shize Liang, Hongzhi Wang2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Diese Studie untersucht die Wirksamkeit und Grenzen des Many-Shot-Promptings als Testzeit-Anpassungsmethode für Large Language Models und zeigt, dass sie zwar bei strukturierten Aufgaben mit hohem Informationsgewinn effektiv ist, jedoch bei offenen Generierungsaufgaben stark von der Auswahlstrategie abhängt und oft nur begrenzte Vorteile bietet.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

Die Arbeit stellt ReflexiCoder vor, ein Reinforcement-Learning-Framework, das Large Language Models befähigt, Code autonom durch internalisierte Selbstreflexion und Selbstkorrektur zu verbessern, wodurch sie bei algorithmischen Aufgaben neue State-of-the-Art-Ergebnisse erzielen und dabei deutlich token-effizienter sind als herkömmliche Ansätze.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Die Arbeit stellt ROSE vor, eine optimierte Version von SparseGPT, die durch eine adaptive, verlustbasierte Neuordnung der Gewichte die Genauigkeit beim One-Shot-Pruning von Large Language Models signifikant verbessert.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

← Zurück Weiter →