Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers

Die Arbeit zeigt theoretisch und experimentell, dass Analogieschluss in Transformern durch das Erlernen einer gemeinsamen Repräsentationsgeometrie für ähnliche Entitäten ermöglicht wird, wobei eine sequenzielle Trainingsreihenfolge von Ähnlichkeits- zu Attributwissen sowie das explizite Vorhandensein von Identitätsbrücken für mehrstufiges Schlussfolgern entscheidend sind.

Ruichen Xu, Wenjing Yan, Ying-Jun Angela Zhang2026-03-06🤖 cs.LG

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Die Studie stellt C2-Faith vor, einen Benchmark zur Bewertung der Zuverlässigkeit von LLM-Richtern bei der Erkennung kausaler Fehler und der Vollständigkeit von Chain-of-Thought-Argumentationen, und zeigt dabei auf, dass keine einzelne Richterkonfiguration alle Aufgaben gleichermaßen meistert und erhebliche Lücken zwischen der Fehlererkennung und deren Lokalisierung bestehen.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Sparse-BitNet: 1.58-bit LLMs are Naturally Friendly to Semi-Structured Sparsity

Der Artikel stellt Sparse-BitNet vor, ein Framework, das 1,58-Bit-Quantisierung und semi-strukturierte N:M-Sparsity kombiniert und zeigt, dass diese Kombination im Vergleich zu vollpräzisen Modellen eine höhere Kompatibilität aufweist, geringere Leistungsverluste bei Sparsität ermöglicht und durch benutzerdefinierte Tensor-Kerne sowohl beim Training als auch beim Inferieren signifikante Beschleunigungen erzielt.

Di Zhang, Xun Wu, Shaohan Huang + 9 more2026-03-06💬 cs.CL

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Diese Richtlinie stellt ein systematisches Rahmenwerk zur Annotation und Visualisierung der Argumentationsstruktur in chinesischen Gerichtsentscheidungen bereit, das auf einer Unterscheidung von vier Propositionstypen und fünf Relationstypen basiert, um eine konsistente Datengrundlage für die computergestützte Analyse juristischer Argumentation zu schaffen.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Distilling Formal Logic into Neural Spaces: A Kernel Alignment Approach for Signal Temporal Logic

Die Autoren stellen einen effizienten Rahmen vor, der mittels eines Teacher-Student-Ansatzes und eines Kernel-Alignment-Ziels die Semantik von Signal-Temporal-Logik in invertierbare neuronale Embeddings überführt, wodurch die rechenintensive symbolische Kernel-Berechnung bei gleichzeitiger Erhaltung der semantischen Struktur und Robustheitsvorhersage ersetzt wird.

Sara Candussio, Gabriele Sarti, Gaia Saveri + 1 more2026-03-06💬 cs.CL

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Die vorgestellte Arbeit optimiert die Effizienz des spekulativen Dekodierens bei Large Language Models, indem sie die Vokabulargröße von Draft-Modellen durch ein constrained-Optimierungsverfahren reduziert, das eine Balance zwischen der Abdeckung notwendiger Token und der Latenz herstellt, was insbesondere bei domänenspezifischen Aufgaben zu signifikanten Geschwindigkeitssteigerungen führt.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Oral to Web: Digitizing 'Zero Resource'Languages of Bangladesh

Die Studie stellt das „Multilingual Cloud Corpus" vor, das erste national skalige, parallele und multimodale linguistische Datenset für Bangladeschs überwiegend mündliche und computergestützt „ressourcenarme" Minderheitensprachen, das durch systematische Feldforschung 107 Stunden Audioaufnahmen sowie strukturierte Textdaten für 42 Sprachvarietäten aus vier Sprachfamilien umfasst und somit die Dokumentation bedrohter Sprachen sowie die Entwicklung von Low-Resource-NLP-Anwendungen ermöglicht.

Mohammad Mamun Or Rashid2026-03-06💬 cs.CL