Continued Pretraining for Low-Resource Swahili ASR: Achieving State-of-the-Art Performance with Minimal Labeled Data

Die Studie zeigt, dass durch fortgesetztes Vortraining mit Pseudo-Labels und anschließendes Feinabstimmen auf nur 20.000 gelabelten Swahili-Daten ein State-of-the-Art-Ergebnis von 3,24 % Wortfehlerrate erreicht wird, was eine relative Verbesserung von 82 % gegenüber der Basislinie und 61 % gegenüber dem bisherigen akademischen Rekord darstellt.

Hillary Mutisya, John MuganeFri, 13 Ma⚡ eess

SliceFed: Federated Constrained Multi-Agent DRL for Dynamic Spectrum Slicing in 6G

Die Arbeit stellt SliceFed vor, ein neuartiges Framework für federiertes, eingeschränktes Multi-Agenten-Deep-Reinforcement-Learning, das durch die Kombination von Lagrange-Primal-Dual-Methoden mit Proximal Policy Optimization und Federated Averaging eine sichere und effiziente dynamische Spektrumsslicing-Steuerung für 6G-Netze ermöglicht, die strenge URLLC-Latenzanforderungen erfüllt und den Datenschutz wahrt.

Hossein Mohammadi, Seyed Bagher Hashemi Natanzi, Ramak Nassiri, Jamshid Hassanpour, Bo Tang, Vuk MarojevicFri, 13 Ma⚡ eess

Standard Condition Number-Based Detection for MIMO ISAC Systems under Noise Uncertainty

Diese Arbeit stellt einen analytischen und optimierenden Rahmen für die Standard-Condition-Number-basierte Detektion in MIMO-ISAC-Systemen unter Rauschunsicherheit vor, der durch die Herleitung geschlossener Ausdrücke für die Fehlalarm- und Detektionswahrscheinlichkeit eine robuste, konstante Fehlalarmrate (CFAR) garantiert und durch eine optimierte Leistungszuweisung die Detektionsgenauigkeit unter Störungen signifikant verbessert.

Alex Obando, Tharindu Udupitiya, Saman Atapattu, Kandeepan SithamparanathanFri, 13 Ma⚡ eess

Machine Learning-Based Analysis of Critical Process Parameters Influencing Product Quality Defects: A Real-World Case Study in Manufacturing

Diese Studie demonstriert, wie maschinelle Lernmodelle in einem realen Gießereibetrieb genutzt werden können, um kritische Prozessparameter zu identifizieren und Gussfehler proaktiv vorherzusagen, wodurch die Produktqualität und Produktionseffizienz erheblich verbessert werden.

Sukumaran Rajasekaran, Ebru Turanoglu Bekar, Kanika Gandhi, Sabino Francesco Roselli, Mohan RajashekarappaFri, 13 Ma⚡ eess

SEMamba++: A General Speech Restoration Framework Leveraging Global, Local, and Periodic Spectral Patterns

Die Arbeit stellt SEMamba++ vor, ein allgemeines Framework zur Sprachwiederherstellung, das durch die Einführung von Frequency GLP und einem multi-resolutionen Zeit-Frequenz-Dual-Verarbeitungsblock spezifische spektrale Muster wie Periodizität und Multi-Resolution-Analysen effizient nutzt, um bei geringem Rechenaufwand den aktuellen Stand der Technik zu übertreffen.

Yongjoon Lee, Jung-Woo ChoiFri, 13 Ma⚡ eess

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

Die Studie stellt einen neuen Datensatz vor und zeigt, dass die Emotionserkennung aus Oberflächen-EMG-Signalen des Gesichts und des Halses sowohl bei phonierter als auch bei stummer Sprache zuverlässig möglich ist, wobei Frustration besonders gut mit einem AUC-Wert von 0,845 klassifiziert werden kann.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. SchullerFri, 13 Ma⚡ eess

Rotatable Antenna Enabled Covert Communication

Die vorgestellte Arbeit schlägt ein neues System für verdeckte Kommunikation mit rotierenden Antennen vor, bei dem durch die gemeinsame Optimierung von Sendestrahlformung und Antennenrotationswinkeln mittels eines alternierenden Optimierungsalgorithmus die Übertragungsrate maximiert und gleichzeitig die Entdeckungswahrscheinlichkeit durch mehrere Wächter minimiert wird.

Qi Dai, Beixiong Zheng, Yanhua Tan, Weidong Mei, Shiqi Gong, Jie Tang, Chengwen XingFri, 13 Ma⚡ eess

BER Analysis and Optimization for Continuous RIS-Enabled NOMA

Dieser Beitrag analysiert die Bitfehlerrate in einem uplink-NOMA-System mit kontinuierlicher rekonfigurierbarer intelligenter Oberfläche (CRIS) unter räumlich korreliertem Fading und entwickelt einen gemeinsamen Optimierungsansatz für Leistungszuweisung und RIS-Partitionierung, der die Bitfehlerrate minimiert und die Leistung gegenüber herkömmlichen OMA- und nicht-optimierten NOMA-Schemata nachweislich verbessert.

Mahmoud AlaaEldin, Amy S. Inwood, Peter J. Smith, Michail MatthaiouFri, 13 Ma⚡ eess