Training Dynamics-Aware Multi-Factor Curriculum Learning for Target Speaker Extraction

Die Arbeit stellt ein training dynamics-aware Multi-Factor-Curriculum-Learning-Verfahren für die Zielsprecherextraktion vor, das durch die datengestützte Analyse von Trainingsdynamiken mittels TSE-Datamap eine adaptive und interaktive Steuerung verschiedener Schwierigkeitsfaktoren ermöglicht, um die Leistung in komplexen Mehrsprecher-Szenarien zu verbessern.

Yun Liu, Xuechen Liu, Xiaoxiao Miao + 1 more2026-03-06💻 cs

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Die Studie zeigt, dass Audio-Modelle mit höherer Leistung in nachgelagerten Aufgaben auch eine stärkere Ähnlichkeit mit menschlichen Gehirnaktivitäten aufweisen, was darauf hindeutet, dass brain-ähnliche Repräsentationen ein emergentes Nebenprodukt des Lernens aus natürlichen Audiodaten sind.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

CMI-RewardBench: Evaluating Music Reward Models with Compositional Multimodal Instruction

Die Arbeit schließt die Lücke in der Bewertung von Musikgenerierungsmodellen, indem sie ein umfassendes Ökosystem für Reward-Modelle unter kompositorischen multimodalen Anweisungen (CMI) einführt, das aus einem großen Datensatz, einem menschlich annotierten Korpus und einem einheitlichen Benchmark besteht, um die Ausrichtung auf Musikalität und Text-Musik-Konsistenz zu verbessern.

Yinghao Ma, Haiwen Xia, Hewei Gao + 9 more2026-03-05🤖 cs.AI

Automated Measurement of Geniohyoid Muscle Thickness During Speech Using Deep Learning and Ultrasound

Die Studie stellt SMMA vor, ein auf Deep Learning basierendes, vollautomatisiertes Framework zur präzisen Messung der Geniohyoid-Muskeldicke während der Sprache, das manuelle Annotationen überflüssig macht und neue Einblicke in die Sprachmotorik sowie potenzielle Anwendungen bei der Diagnose von Sprech- und Schluckstörungen ermöglicht.

Alisher Myrgyyassov, Bruce Xiao Wang, Yu Sun + 4 more2026-03-05🤖 cs.LG