PonderLM-3: Adaptive Token-Wise Pondering with Differentiable Masking

Das Paper stellt PonderLM-3 vor, ein vortrainiertes Framework, das durch differenzierbare Maskierung während des Trainings und eine konsistente Pruning-Regel beim Inferenzvorgang eine adaptive, tokenweise Zuweisung von Rechenleistung ermöglicht, wodurch die Berechnungskosten nur bei tatsächlichem Nutzen anfallen und eine effizientere Pareto-Grenze erreicht wird.

He Li, Feichen Song, Boyi Zeng, Shixiang Song, Zhiqin John Xu, Ziwei He, Zhouhan LinWed, 11 Ma💬 cs.CL

Fish Audio S2 Technical Report

Der technische Bericht stellt Fish Audio S2 vor, ein Open-Source-Text-to-Speech-System, das durch mehrstufiges Training und eine spezielle Datenpipeline eine natürliche Sprachsteuerung, Multi-Speaker-Fähigkeiten und Multi-Turn-Generation ermöglicht und dabei mit einer effizienten SGLang-Inferenz-Engine eine Echtzeitfaktor von 0,195 sowie eine Latenz unter 100 ms erreicht.

Shijia Liao, Yuxuan Wang, Songting Liu, Yifan Cheng, Ruoyi Zhang, Tianyu Li, Shidong Li, Yisheng Zheng, Xingwei Liu, Qingzheng Wang, Zhizhuo Zhou, Jiahua Liu, Xin Chen, Dawei HanWed, 11 Ma🤖 cs.AI

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers

Das Paper stellt MultiGraSCCo vor, ein multilinguales Benchmark-Dataset mit über 2.500 Annotationen persönlicher Identifikatoren in zehn Sprachen, das durch maschinelle Übersetzung und kulturelle Anpassung synthetischer medizinischer Daten erstellt wurde, um die Entwicklung und Validierung von Anonymisierungssystemen zu unterstützen.

Ibrahim Baroud, Christoph Otto, Vera Czehmann, Christine Hovhannisyan, Lisa Raithel, Sebastian Möller, Roland RollerWed, 11 Ma💬 cs.CL

ConFu: Contemplate the Future for Better Speculative Sampling

Die Arbeit stellt ConFu vor, ein neues Framework für spekulatives Decoding, das durch die Einführung von „Contemplate Tokens" und weichen Prompts Draft-Modellen ermöglicht, die zukünftige Generierungsrichtung des Zielmodells vorherzusehen, wodurch die Akzeptanzraten und die Geschwindigkeit im Vergleich zu EAGLE-3 signifikant gesteigert werden.

Zongyue Qin, Raghavv Goel, Mukul Gagrani, Risheek Garrepalli, Mingu Lee, Yizhou SunWed, 11 Ma💬 cs.CL

SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation

Die Studie stellt mit SciTaRC einen neuen Benchmark für wissenschaftliche Tabellendaten vor, der zeigt, dass aktuelle KI-Modelle aufgrund von Schwächen in der Planausführung, dem Sprachverständnis und der Berechnung bei über 23 % der Fragen scheitern.

Hexuan Wang, Yaxuan Ren, Srikar Bommireddypalli, Shuxian Chen, Adarsh Prabhudesai, Rongkun Zhou, Elina Baral, Philipp KoehnWed, 11 Ma💬 cs.CL

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

Die Studie stellt PathoScribe vor, ein einheitliches Framework auf Basis von Retrieval-Augmented Large Language Models, das statische Pathologie-Archive in eine interaktive Wissensdatenbank verwandelt und durch Funktionen wie semantische Suche, automatische Kohortenbildung sowie klinische Fragebeantwortung die Diagnoseunterstützung und Forschungseffizienz erheblich steigert.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance

Die Studie stellt ein automatisiertes Framework zur thematischen Analyse klinischer qualitativer Daten vor, das durch iterative Verfeinerung des Codebuchs und vollständige Nachverfolgbarkeit die Skalierbarkeit und Reproduzierbarkeit verbessert und dabei in mehreren Datensätzen die höchste Gesamtqualität sowie eine hohe Übereinstimmung mit Expertenbewertungen erreicht.

Seungjun Yi, Joakim Nguyen, Huimin Xu, Terence Lim, Joseph Skrovan, Mehak Beri, Hitakshi Modi, Andrew Well, Carlos M. Mery, Yan Zhang, Mia K. Markey, Ying DingWed, 11 Ma💬 cs.CL

Learning When to Sample: Confidence-Aware Self-Consistency for Efficient LLM Chain-of-Thought Reasoning

Die vorgestellte Arbeit führt einen konfidenzbasierten Rahmen ein, der anhand eines einzelnen Lösungswegs adaptiv zwischen Einzel- und Mehrfachpfad-Reasoning entscheidet, um die Genauigkeit von Large Language Models bei gleichzeitiger Reduktion des Tokenverbrauchs um bis zu 80 % zu erhalten.

Juming Xiong, Kevin Guo, Congning Ni, Chao Yan, Katherine Brown, Avinash Baidya, Xiang Gao, Bradley Marlin, Zhijun YinWed, 11 Ma💬 cs.CL

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Die Studie stellt vor, dass der autonome KI-Agent „Sentinel" durch die Verwendung des Model Context Protocol (MCP) klinische Triage-Daten aus der Fernüberwachung von Patienten mit höherer Sensitivität und Konsistenz als menschliche Ärzte klassifiziert und dabei eine skalierbare, kosteneffiziente Lösung für die Überlastung des medizinischen Personals bietet.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)Wed, 11 Ma🤖 cs.AI