Calibration-Reasoning Framework for Descriptive Speech Quality Assessment

Cet article présente un nouveau cadre de post-entraînement pour les modèles linguistiques audio qui, en combinant une étape d'étalonnage et un apprentissage par renforcement avec GRPO, améliore considérablement l'évaluation descriptive de la qualité de la parole en permettant une analyse multidimensionnelle, une localisation temporelle précise des artefacts et une prédiction plus fiable des scores MOS.

Elizaveta Kostenok, Mathieu Salzmann, Milos CernakThu, 12 Ma⚡ eess

In-Situ Timing Diagnosis of PDN and Configuration-Upset-Induced Routing Delay Degradation in SRAM-based FPGAs

Cet article présente une architecture de diagnostic temporel in situ évolutive pour les FPGA basés sur SRAM, capable de distinguer et de caractériser finement, sans instrumentation externe, les dégradations de délai induites par le réseau d'alimentation de ceux provoqués par des perturbations de routage en analysant les distributions de probabilité et les corrélations spatiales.

Mostafa DarvishiThu, 12 Ma⚡ eess

Over-the-Air Consensus-based Formation Control of Heterogeneous Agents: Communication-Rate and Geometry-Aware Convergence Guarantees

Cet article propose une méthode de contrôle de formation pour des agents hétérogènes communiquant via un canal multiple accès sans fil, qui exploite la superposition des signaux pour calculer des combinaisons convexes normalisées et garantit la convergence vers une formation prescrite sous des conditions liées au taux de communication et à la géométrie du système.

Michael Epp, Fabio Molinari, Jörg RaischThu, 12 Ma⚡ eess

High-Fidelity Digital Twin Dataset Generation for Inverter-Based Microgrids Under Multi-Scenario Disturbances

Cet article présente un jeu de données haute fidélité généré par jumeau numérique pour les microgrids à base d'onduleurs, couvrant onze scénarios de perturbations avec des signaux électromagnétiques transitoires synchronisés destinés à l'entraînement de modèles de substitution et à l'analyse de résilience cyber-physique.

Osasumwen Cedric Ogiesoba-Eguakun, Kaveh Ashenayi, Suman RathThu, 12 Ma⚡ eess

Optimal Control Synthesis of Closed-Loop Recommendation Systems over Social Networks

Cet article propose une synthèse de contrôle optimal pour les systèmes de recommandation dans les réseaux sociaux, démontrant que la conception d'un contrôleur à rétroaction d'état peut stabiliser les dynamiques d'opinion et équilibrer l'engagement avec la diversité, tandis que des pondérations inadaptées risquent de provoquer une polarisation et une instabilité.

Simone Mariano, Paolo FrascaThu, 12 Ma⚡ eess

Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

Ce papier propose le cadre d'inférence sans entraînement et indépendant du modèle, appelé distillation visuelle à porte conceptuelle (CGVD), qui surmonte le « fossé précision-raisonnement » des modèles vision-langage-action dans des environnements encombrés en éliminant le bruit sémantique via l'inpainting de Fourier et en ciblant précisément les objets à manipuler, permettant ainsi d'atteindre un taux de réussite de 77,5 % contre 43,0 % pour les méthodes de l'état de l'art.

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick ThiyagarajanThu, 12 Ma⚡ eess

Multi-Modal Intelligent Channel Modeling: From Fine-tuned LLMs to Pre-trained Foundation Models

Cet article propose deux nouveaux paradigmes de modélisation intelligente de canaux multimodaux pour la 6G, basés sur les grands modèles de langage (LLM4CM) et un modèle fondamental dédié aux canaux sans fil (WiCo), afin de répondre aux exigences de prédiction précise, d'extensibilité et de participation systémique dans des environnements de communication complexes.

Lu Bai, Zengrui Han, Mingran Sun, Xiang ChengThu, 12 Ma⚡ eess

UAV-Based 3D Spectrum Sensing: Insights on Altitude, Bandwidth, Trajectory, and Effective Antenna Patterns on REM Reconstruction

Cet article présente une analyse complète de la reconstruction de cartes radioenvironnementales 3D par drones, démontrant l'impact de l'altitude, de la bande passante, de la trajectoire et de la calibration des antennes sur la précision, tout en proposant des méthodes avancées comme le krigeage simple et la décomposition des zones d'ombre profonde pour améliorer la fiabilité des mesures.

Mushfiqur Rahman, Sung Joon Maeng, Ismail Guvenc, Chau-Wai Wong, Mihail Sichitiu, Jason A. Abrahamson, Arupjyoti BhuyanThu, 12 Ma⚡ eess

FireRedASR2S: A State-of-the-Art Industrial-Grade All-in-One Automatic Speech Recognition System

Ce papier présente FireRedASR2S, un système de reconnaissance automatique de la parole (ASR) industriel de pointe intégrant quatre modules unifiés (ASR, détection d'activité vocale, identification de langue parlée et prédiction de ponctuation) qui atteignent des performances state-of-the-art sur divers benchmarks multilingues et dialectaux.

Kaituo Xu, Yan Jia, Kai Huang, Junjie Chen, Wenpeng Li, Kun Liu, Feng-Long Xie, Xu Tang, Yao HuThu, 12 Ma⚡ eess

Spyglass: Directional Spectrum Sensing with Single-shot AoA Estimation and Virtual Arrays

Ce papier présente Spyglass, un capteur de spectre utilisant une antenne commutée et l'algorithme Searchlite pour estimer avec précision l'angle d'arrivée de signaux multiples en une seule transmission, surmontant ainsi les défis de coût et de complexité du traitement de réseau dans des environnements radiofréquences denses.

Raghav Subbaraman, Akshit Agarwal, Wenhao Chen, Dinesh BharadiaThu, 12 Ma⚡ eess

3-D Trajectory Optimization for Robust Direction Sensing in Movable Antenna Systems

Cet article propose un système de détection sans fil innovant utilisant une antenne mobile en mouvement 3D pour optimiser la trajectoire de l'antenne et minimiser l'erreur angulaire maximale, surpassant ainsi les performances des systèmes à antennes fixes ou à mouvement bidimensionnel en offrant une estimation de direction plus robuste et précise sur l'ensemble de la région angulaire.

Wenyan Ma, Lipeng Zhu, Xiaodan Shao, Rui ZhangThu, 12 Ma⚡ eess