Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

Das Paper stellt Med-V1 vor, eine Familie effizienter Small Language Models mit nur drei Milliarden Parametern, die durch Training auf hochwertigen synthetischen Daten in der biomedizinischen Evidenzattribution und Halluzinationserkennung die Leistung von teuren Frontier-Modellen wie GPT-5 erreichen und dabei skalierbare Anwendungen für die klinische Praxis ermöglichen.

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Dieses Paper stellt ein mehrsprachiges, von Menschen annotiertes Korpus mit Originaltexten und vereinfachten Easy-to-Read-Versionen für Spanisch, Katalanisch und Italienisch vor, um die automatische Textvereinfachung zu unterstützen und den Zugang zu demokratischen Partizipationsprozessen zu fördern.

Stefan Bott, Verena Riegler, Horacio Saggion + 2 more2026-03-06💬 cs.CL

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

Diese Arbeit untersucht die Eignung von Modell-Merging für die Mehrdomänen-Anpassung in der automatischen Spracherkennung, stellt mit BoostedTSV-M einen neuen Algorithmus vor, der die numerische Stabilität verbessert, und zeigt, dass dieser Ansatz die Leistung einer vollständigen Feinabstimmung für europäisches Portugiesisch übertrifft, während die Generalisierungsfähigkeit erhalten bleibt.

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL

Distributed Partial Information Puzzles: Examining Common Ground Construction Under Epistemic Asymmetry

Die Studie stellt das verteilte Puzzle mit partiellen Informationen (DPIP) als neue multimodale Datensatz und Aufgabe vor, um die Konstruktion gemeinsamen Wissens unter epistemischer Asymmetrie zu untersuchen, und zeigt, dass sowohl moderne Large Language Models als auch ein axiomatischer Ansatz der dynamischen epistemischen Logik Schwierigkeiten haben, den Glaubenszustand und den Fortschritt in solchen kollaborativen Szenarien präzise zu verfolgen.

Yifan Zhu, Mariah Bradford, Kenneth Lai + 4 more2026-03-06🤖 cs.AI

FlashAttention-4: Algorithm and Kernel Pipelining Co-Design for Asymmetric Hardware Scaling

Dieses Paper stellt FlashAttention-4 vor, eine neuartige Implementierung für Blackwell-GPUs, die durch algorithmische und Kernel-Pipelining-Optimierungen zur Bewältigung asymmetrischer Hardware-Skalierung sowie durch die vollständige Implementierung in CuTe-DSL eine bis zu 2,7-fache Beschleunigung und deutlich schnellere Kompilierungszeiten erreicht.

Ted Zadouri, Markus Hoehnerbach, Jay Shah + 3 more2026-03-06💬 cs.CL

DEBISS: a Corpus of Individual, Semi-structured and Spoken Debates

Die Arbeit stellt das DEBISS-Korpus vor, eine Sammlung von gesprochenen und individuellen Debatten mit halbstrukturierten Merkmalen, die durch umfangreiche NLP-Annotationen wie Spracherkennung, Sprecherdiarisierung, Argumentmining und Debattantenbewertung ergänzt wird, um die Lücke im Bereich der Debattenkorpora zu schließen.

Klaywert Danillo Ferreira de Souza, David Eduardo Pereira, Cláudio E. C. Campelo + 1 more2026-03-06💬 cs.CL