G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Het paper introduceert G-STAR, een end-to-end systeem dat een tijdbewuste spreker-trackingmodule koppelt aan een Speech-LLM-transcriptiebackbone om tijdgestempelde, spreker-gelabelde transcripties te genereren voor lange, multi-partij gesprekken met overlappingen, terwijl het de consistentie van sprekeridentiteiten op vergaderingsniveau behoudt.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai WangThu, 12 Ma⚡ eess

World Model for Battery Degradation Prediction Under Non-Stationary Aging

Dit artikel introduceert een wereldmodel voor het voorspellen van de degradatie van lithium-ionbatterijen onder niet-stationaire omstandigheden, waarbij het gebruik van een latentetoestand en een geleerde dynamiek de voorspelling van de gezondheidstoestand over de toekomstige cycli significant verbetert ten opzichte van directe regressie, met name wanneer een Single Particle Model-beperking wordt toegepast om de nauwkeurigheid bij de degradatieknie te verhogen.

Kai Chin Lim, Khay Wai SeeThu, 12 Ma⚡ eess

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Dit artikel introduceert een taalgeleid raamwerk voor cognitieve defectanalyse in actieve infraroodthermografie van CFK-materialen, dat gebruikmaakt van vooraf getrainde vision-language modellen en een lichte adapter om zero-shot defectdetectie mogelijk te maken zonder uitgebreide trainingsdatasets.

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra AbdulrahmanThu, 12 Ma⚡ eess

Suppressing Acoustomigration and Temperature Rise for High-power Robust Acoustics

Deze paper introduceert een gelaagd akoestisch golfplatform (LAW) dat door middel van een quasi-oneindige multifunctionele bovenlaag de mechanische en thermische randvoorwaarden herdefinieert, waardoor voor het eerst gelijktijdig acoustomigratie en temperatuurstijging worden onderdrukt, wat resulteert in een robuustere transducer met een temperatuurstijgingreductie van 70% en een ongekende drempel voor vermogensdichtheid.

Fangsheng Qian, Shuhan Chen, Wei Wei, Jiashuai Xu, Kai Yang, Junyan Zheng, Zijun Ren, Xingyu Liu, Yansong YangThu, 12 Ma⚡ eess

Path Planning for Sound Speed Profile Estimation

Dit artikel beschrijft een methode waarbij een autonoom onderwatervoertuig (AUV) met een CTD-sensor en een akoestische ontvanger, in combinatie met een Unscented Kalman-filter en een padplanningsstrategie die de voorspelde geluidssnelheidsvariantie minimaliseert, wordt gebruikt om het geluidssnelheidsprofiel (SSP) in een gebied nauwkeuriger te schatten dan met constante beweging.

Ludvig Lindström, Tadas Paskevicius, Andreas Jakobsson, Isaac SkogThu, 12 Ma⚡ eess

Flexible Multi-Target Angular Emulation for Over-the-Air Testing of Large-Scale ISAC Base Stations: Principle and Experimental Verification

Dit artikel presenteert en valideert experimenteel een flexibel raamwerk voor over-the-air-emulatie van meerdere doelen, dat gebruikmaakt van een draadloze kabelmethode met amplitude- en fasemodulatie en een geoptimaliseerde opstelling van sondes om de prestaties van grote ISAC-basisstations in gecontroleerde laboratoria te evalueren zonder extra radar-emulatiebronnen.

Chunhui Li, Hao Sun, Wei FanThu, 12 Ma⚡ eess

Propagation and Rate-Aware Cell Switching Optimization in HAPS-Assisted Wireless Networks

Deze studie optimaliseert energievriendelijke celswitching in HAPS-gestuurde netwerken door realistische propagatie-effecten te integreren en een meerdoelsoptimalisatieframework te gebruiken dat energiebesparing combineert met verbeterde connectiviteit en data-snelheid, waarbij de resultaten aantonen dat degradatie voor binnenlandse gebruikers aanzienlijk wordt verminderd.

Mehmet Eren Uluçınar, Özgün Ersoy, Berk Ciloglu, Metin Ozturk, Ali GorcinThu, 12 Ma⚡ eess

Parallel-in-Time Nonlinear Optimal Control via GPU-native Sequential Convex Programming

Dit paper introduceert een volledig GPU-native framework voor niet-lineaire optimale controle dat door middel van sequentieel convexe programmering en tijdsdeling de planningssnelheid voor autonome systemen aanzienlijk verhoogt, wat resulteert in een viervoudige doorvoersnelheid en een halvering van het energieverbruik ten opzichte van geoptimaliseerde CPU-baselines.

Yilin Zou, Zhong Zhang, Fanghua JiangThu, 12 Ma⚡ eess

MOS-Bias: From Hidden Gender Bias to Gender-Aware Speech Quality Assessment

Dit onderzoek onthult een systematische genderbias in de Mean Opinion Score (MOS) voor spraakkwaliteit, waarbij mannelijke luisteraars consequent hogere scores toekennen dan vrouwelijke luisteraars, en stelt een genderbewust model voor om deze vertekening te corrigeren en eerlijkere evaluaties mogelijk te maken.

Wenze Ren, Yi-Cheng Lin, Wen-Chin Huang, Erica Cooper, Ryandhimas E. Zezario, Hsin-Min Wang, Hung-yi Lee, Yu TsaoThu, 12 Ma⚡ eess

Scaling and Trade-offs in Multi-agent Autonomous Systems

Dit artikel toont aan dat het toepassen van dimensieanalyse en data-schaling op grote agent-gebaseerde simulaties van drone-zwermen leidt tot voorspelbare schalingswetten die complexe ontwerpruimtes vereenvoudigen, kritieke succes-falen grenzen onthullen en fundamentele trade-offs tussen agentaantallen en platformparameters kwantificeren.

Abram H. Clark, Liraz Mudrik, Colton Kawamura, Nathan C. Redder, João P. Hespanha, Isaac KaminerThu, 12 Ma⚡ eess

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Dit artikel introduceert Sign-Prioritized FL (SP-FL), een nieuw framework voor draadloze federatielearning dat de betrouwbaarheid en nauwkeurigheid verbetert door ongelijkwaardige hulpbronnen toe te wijzen aan belangrijke gradiëntinformatie, waarbij prioriteit wordt gegeven aan het teken van de gradiënten boven de grootte.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit NiyatoThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Dit paper introduceert een adaptief semantisch communicatiesysteem voor satellieten dat gebruikmaakt van een dubbelstroom-generatieve architectuur en een op grote taalmodellen gebaseerde besluitvorming om onder beperkte bandbreedte en variërende omstandigheden hoogwaardige, gesynchroniseerde audiovisuele reconstructie te realiseren door dynamisch de belangrijkste modus te selecteren en de andere modus te genereren.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess