cs.CL Arbeiten | Gist.Science

Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

Diese Studie zeigt, dass spektrale Metriken, die aus strukturellen Netzwerken von Anforderungstexten abgeleitet werden, den Integrationsaufwand mit einer Korrelation von über 0,95 präziser vorhersagen können als herkömmliche strukturelle Kennzahlen.

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh Babu2026-03-10💬 cs.CL

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

Die Arbeit stellt CoCoA vor, einen trainingfreien Decodierungsalgorithmus, der durch die Analyse von Inkonsistenzen zwischen den inneren Schichten von Large Language Models Halluzinationen reduziert und so die faktische Korrektheit ohne Nachtraining verbessert.

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

Neuro-Symbolic Synergy for Interactive World Modeling

Die Arbeit stellt NeSyS vor, ein Neuro-Symbolisches Framework, das die semantische Ausdruckskraft von Large Language Models mit der logischen Konsistenz symbolischer Weltmodelle kombiniert, um durch wechselseitiges Training und direkte Wahrscheinlichkeitsbeschränkungen Halluzinationen zu reduzieren und gleichzeitig die Trainingsdatenmenge um 50 % zu verringern.

Hongyu Zhao, Siyu Zhou, Haolin Yang, Zengyi Qin, Tianyi Zhou2026-03-10💬 cs.CL

Learning Page Order in Shuffled WOO Releases

Die Studie untersucht Methoden zur Wiederherstellung der Seitenreihenfolge in 5.461 verschütteten niederländischen WOO-Dokumenten und zeigt, dass spezialisierte Modelle bei langen Dokumenten deutlich besser abschneiden als Seq2Seq-Transformer, die aufgrund unterschiedlicher Ordnungsstrategien bei kurzen und langen Texten sowie fehlender Generalisierungsfähigkeit versagen.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Diese Studie stellt einen reaktionsfreien Framework vor, der mithilfe von Topic Modeling und semantischen Embeddings psychologische Skalen effizient vereinfacht, indem sie die inhärente semantische Struktur der Items nutzt, um die Skalenlänge im Durchschnitt um 60,5 % zu reduzieren, ohne dabei die psychometrische Güte oder die zugrundeliegenden Konstrukte zu beeinträchtigen.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

Diese Studie entwickelt interpretierbare maschinelle Lernmodelle zur Vorhersage der CEFR-Sprachniveau-Stufen (A2–C1) bei estnischen Lernertexten durch gezielte linguistische Merkmalsauswahl, erreicht eine hohe Klassifizierungsgenauigkeit und hat die Ergebnisse in eine Open-Source-Sprachlernumgebung integriert.

Kais Allkivi2026-03-10💬 cs.CL

A Geometric Taxonomy of Hallucinations in LLMs

Die Arbeit schlägt eine geometrische Taxonomie von Halluzinationen in LLMs vor, die Unwahrhaftigkeit, Konfabulation und faktische Fehler unterscheidet, und stellt darauf aufbauend neue Detektionsmethoden vor, die insbesondere bei Konfabulationen hohe Genauigkeit erreichen, während sie gleichzeitig methodische Grenzen bei der Erkennung faktischer Fehler aufzeigen.

Javier Marín2026-03-10💬 cs.CL

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Das Papier argumentiert, dass der Erfolg von Code-Generierung im Vergleich zu Reinforcement Learning auf einer hierarchischen Lernbarkeit beruht, die durch die Informationsstruktur und die Verfügbarkeit von Feedback bestimmt wird, und zeigt auf, dass die Grenzen des maschinellen Lernens weniger von der Modellgröße als vielmehr von der grundlegenden Lernbarkeit der Aufgaben abhängen.

Zhimin Zhao2026-03-10🤖 cs.LG

Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

Die vorgestellte Arbeit führt XTF ein, ein erklärbares Framework zur Filterung von Token-level-Rauschen in Fine-Tuning-Datensätzen durch die Zerlegung von Token-Beiträgen in drei Attribute, was die Leistung von Large Language Models in verschiedenen Downstream-Aufgaben signifikant verbessert.

Yuchen Yang, Wenze Lin, Enhao Huang, Zhixuan Chu, Hongbin Zhou, Lan Tao, Yiming Li, Zhan Qin, Kui Ren2026-03-10💬 cs.CL

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

Das Paper stellt CogitoRAG vor, ein RAG-Framework, das menschliche kognitive Gedächtnisprozesse nachahmt, indem es semantische Gist-Extraktion, einen multidimensionalen Wissensgraphen und einen Diffusionsmechanismus nutzt, um bei komplexen Fragen die semantische Integrität zu bewahren und die Leistung gegenüber bestehenden Methoden signifikant zu steigern.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

Die Arbeit stellt EC-Net vor, ein hyperbolisches Hypergraph-Framework, das durch die Modellierung von Modalitätshierarchien in Poincaré-Kugel-Einbettungen und bidirektionale Hypergraph-Nachrichtenübertragung robuste und genaue multimodale Emotionserkennung auch bei verrauschten oder unvollständigen Daten ermöglicht.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Die Arbeit stellt ModalImmune vor, ein Trainingsframework, das durch gezieltes, kontrolliertes Zusammenbrechen ausgewählter Modalitäten während des Trainings robuste multimodale Repräsentationen erzeugt, um die Zuverlässigkeit von Systemen bei Ausfall oder Korruption von Eingabekanälen zu gewährleisten.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Die Autoren stellen mit CondMedQA den ersten Benchmark für kontextabhängige biomedizinische Fragen vor und entwickeln das Condition-Gated Reasoning (CGR)-Framework, das durch bedingungsbasierte Pfadsteuerung in Wissensgraphen zuverlässigere medizinische Schlussfolgerungen ermöglicht.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

Die Autoren stellen MrBERT vor, eine Familie effizienter multilingualer Encoder auf ModernBERT-Basis, die durch gezielte Anpassung an 35 Sprachen sowie spezialisierte Domänen und die Integration von Matryoshka-Repräsentationslernen sowohl state-of-the-art-Leistung als auch kosteneffiziente Inferenz ermöglicht.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Die Arbeit stellt CeRA vor, eine neue Methode zur parametereffizienten Feinabstimmung, die durch Manifold-Expansion die linearen Grenzen von LoRA bei komplexen Aufgaben wie mathematischem Schlussfolgern überwindet und dabei bei deutlich niedrigerem Rang eine überlegene Leistung erzielt.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

Das Paper stellt KVSlimmer vor, einen theoretisch fundierten und gradientenfreien Algorithmus zur effizienten Komprimierung von KV-Caches in großen Sprachmodellen, der durch eine geschlossene Formel die Hessian-Informationen exakt erfasst und dabei sowohl die Speicher- als auch die Latenzkosten signifikant senkt, ohne die Leistung einzubüßen.

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan Zhong2026-03-10💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Die Studie zeigt, dass eine konforme Vorhersage durch domänenspezifische Kalibrierung trotz unterschiedlicher Fehlkalibrierungstendenzen in strukturierten FDA-Texten und freien Radiologieberichten zuverlässige Abdeckungsgarantien für die Extraktion medizinischer Entitäten mittels großer Sprachmodelle ermöglicht.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

Die Arbeit stellt CyclicJudge vor, eine effiziente Round-Robin-Strategie zur Eliminierung systematischer Urteilsverzerrungen bei LLM-Evaluierungen, die ohne zusätzliche Kosten zuverlässigere Rankings ermöglicht.

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong Chen2026-03-10💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

Das Paper stellt PrivMedChat vor, ein End-to-End-Framework für differenziell privates RLHF, das medizinische Dialogsysteme durch den Einsatz von DP-SGD und einer annotierungsfreien Präferenzkonstruktionsstrategie sicher und datenschutzkonform anpasst.

Sudip Bhujel2026-03-10💬 cs.CL

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

Die Studie zeigt, dass die Methode CDD zur Erkennung von Datenkontamination in kleinen Sprachmodellen (70M–410M Parameter) in den meisten getesteten Szenarien nur zufällige Ergebnisse liefert und dabei von etablierten Wahrscheinlichkeitsmethoden wie Perplexity und Min-k% Prob übertroffen wird, da ihre Wirksamkeit kritisch von der Entstehung wortwörtlicher Memorierung abhängt.

Omer Sela (Tel Aviv University)2026-03-10💬 cs.CL

← Zurück Weiter →