Calibration-Reasoning Framework for Descriptive Speech Quality Assessment

Este artigo apresenta um novo framework de pós-treinamento que combina calibração e aprendizado por reforço (GRPO) para adaptar modelos de linguagem de áudio grandes, permitindo a avaliação explicativa da qualidade de fala através da análise multidimensional de dimensões perceptivas, localização temporal de artefatos e previsão aprimorada de MOS.

Elizaveta Kostenok, Mathieu Salzmann, Milos CernakThu, 12 Ma⚡ eess

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

O artigo apresenta o ARCHE, um framework de compressão de imagens aprendido de ponta a ponta que equilibra precisão de modelagem e eficiência computacional ao unificar priores hierárquicos, espaciais e de canal sem depender de componentes recorrentes ou baseados em transformers, alcançando eficiência taxa-distorção superior a codecs tradicionais e existentes com parâmetros moderados e tempo de execução rápido.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios SkodrasThu, 12 Ma⚡ eess

In-Situ Timing Diagnosis of PDN and Configuration-Upset-Induced Routing Delay Degradation in SRAM-based FPGAs

Este artigo apresenta uma arquitetura de diagnóstico temporal in-situ escalável para FPGAs baseados em SRAM que, ao monitorar distribuições probabilísticas de atraso nas rotas, permite distinguir e caracterizar com precisão as degradações causadas por marginalidade da rede de distribuição de energia (PDN) e por perturbações induzidas na configuração, sem interferir no design do usuário.

Mostafa DarvishiThu, 12 Ma⚡ eess

Over-the-Air Consensus-based Formation Control of Heterogeneous Agents: Communication-Rate and Geometry-Aware Convergence Guarantees

Este artigo propõe um método de controle de formação para agentes heterogêneos que explora a superposição de sinais em canais de acesso múltiplo sem fio para calcular combinações convexas normalizadas, garantindo a convergência para uma formação prescrita sob condições baseadas na taxa de comunicação e na geometria, com uma redução significativa no número de transmissões necessárias em comparação com protocolos que evitam interferência.

Michael Epp, Fabio Molinari, Jörg RaischThu, 12 Ma⚡ eess

High-Fidelity Digital Twin Dataset Generation for Inverter-Based Microgrids Under Multi-Scenario Disturbances

Este artigo apresenta a geração de um conjunto de dados de gêmeo digital de alta fidelidade para microrredes baseadas em inversores, contendo 38 canais de sinais de transientes eletromagnéticos sincronizados sob 11 cenários de perturbação distintos, validados fisicamente e prontos para treinar modelos substitutos e analisar a resiliência ciber-física.

Osasumwen Cedric Ogiesoba-Eguakun, Kaveh Ashenayi, Suman RathThu, 12 Ma⚡ eess

Inverse Learning-Based Output Feedback Control of Nonlinear Systems with Verifiable Guarantees

Este artigo apresenta um controlador de realimentação de saída baseado em aprendizado inverso para sistemas não lineares, que utiliza dados de medição entrada/saída livres de ruído e um mecanismo de seleção de referência para garantir a regulação prática da saída sob uma condição verificável.

Yeongjun Jang, Hamin Chang, Heein Park, Hyeonyeong Jang, Takashi Tanaka, Hyungbo ShimThu, 12 Ma⚡ eess

Simulation-in-the-Reasoning (SiR): A Conceptual Framework for Empirically Grounded AI in Autonomous Transportation

Este artigo apresenta o "Simulation-in-the-Reasoning" (SiR), um novo quadro conceitual que integra simuladores de domínio específico diretamente no ciclo de raciocínio de Modelos de Linguagem Grandes (LLMs) para transformar o raciocínio hipotético em um fluxo de trabalho falsificável e empiricamente fundamentado, visando sistemas de transporte autônomo mais confiáveis.

Wuping XinThu, 12 Ma⚡ eess

Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

O artigo propõe o CGVD, um framework de inferência livre de treinamento que supera a lacuna entre precisão e raciocínio em modelos de Visão-Linguagem-Ação em ambientes desordenados, utilizando inpainting baseado em Fourier e refinamento de alvos para suprimir distrações semânticas e alcançar uma taxa de sucesso significativamente superior à dos métodos existentes.

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick ThiyagarajanThu, 12 Ma⚡ eess

UAV-Based 3D Spectrum Sensing: Insights on Altitude, Bandwidth, Trajectory, and Effective Antenna Patterns on REM Reconstruction

Este artigo apresenta uma análise abrangente da reconstrução de Mapas de Ambiente de Rádio (REM) em 3D utilizando UAVs, demonstrando como a altitude, a largura de banda, a trajetória e a calibração do padrão da antena afetam a precisão, e propondo um framework para melhorar a reconstrução em regiões de sombra profunda.

Mushfiqur Rahman, Sung Joon Maeng, Ismail Guvenc, Chau-Wai Wong, Mihail Sichitiu, Jason A. Abrahamson, Arupjyoti BhuyanThu, 12 Ma⚡ eess

FireRedASR2S: A State-of-the-Art Industrial-Grade All-in-One Automatic Speech Recognition System

O artigo apresenta o FireRedASR2S, um sistema de reconhecimento automático de fala (ASR) industrial de ponta e tudo-em-um que integra módulos de detecção de atividade vocal, identificação de língua falada e previsão de pontuação, alcançando desempenho superior ao estado da arte em diversos benchmarks para mandarim, dialetos chineses, inglês e código misto.

Kaituo Xu, Yan Jia, Kai Huang, Junjie Chen, Wenpeng Li, Kun Liu, Feng-Long Xie, Xu Tang, Yao HuThu, 12 Ma⚡ eess

Spyglass: Directional Spectrum Sensing with Single-shot AoA Estimation and Virtual Arrays

O artigo apresenta o Spyglass, um sensor de espectro que utiliza um arranjo comutado e técnicas de processamento de sinal inovadoras para estimar com precisão a direção de chegada (AoA) de múltiplos sinais simultâneos em uma única transmissão, superando desafios de custo e complexidade em ambientes de radiofrequência densos.

Raghav Subbaraman, Akshit Agarwal, Wenhao Chen, Dinesh BharadiaThu, 12 Ma⚡ eess