A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Este estudo apresenta uma avaliação sistemática de métodos de compressão de redes neurais — especificamente poda, quantização e destilação de conhecimento — para classificação de imagens hiperespectrais, demonstrando que é possível reduzir significativamente o tamanho e o custo computacional dos modelos mantendo um desempenho competitivo em plataformas de recursos limitados.

Sai Shi2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Este comentário de panorama avalia a família GPT-5 como raciocinador clínico multimodal, demonstrando avanços significativos na síntese de dados textuais e de imagem que superam o GPT-4o, mas revelando que, embora represente um progresso em direção ao raciocínio integrado, os modelos generalistas ainda não substituem sistemas especializados em tarefas críticas de percepção como neurorradiologia e mamografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation

Este artigo apresenta o ConTSG-Bench, um benchmark unificado e em grande escala que fornece um conjunto abrangente de métricas e um conjunto de dados alinhado para avaliar sistematicamente modelos de geração de séries temporais condicionais, revelando as limitações atuais e direções futuras para o controle estrutural preciso e a utilidade em tarefas downstream.

Shaocheng Lan, Shuqi Gu, Zhangzhi Xiong + 1 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Este artigo propõe um framework de aprendizado por reforço distribuído e sensível ao risco, que integra o gargalo de informação e otimização de Conditional Value-at-Risk para otimizar parâmetros de equalização de DRAM com garantias de pior caso, quantificação de incerteza e uma aceleração de 51 vezes em comparação com métodos tradicionais.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Este trabalho apresenta a primeira caracterização de equivalência distribucional e um método de aprendizado estruturalmente livre para modelos causais lineares não-Gaussianos com variáveis latentes e ciclos, estabelecendo critérios gráficos e um algoritmo para recuperar modelos a partir de dados sem assumir restrições estruturais prévias.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Este artigo propõe o Diffusion Policy through Conditional Proximal Policy Optimization, um método eficiente que permite o treinamento de políticas de difusão em cenários de aprendizado por reforço on-policy ao alinhar a iteração da política com o processo de difusão, eliminando a necessidade de cálculos complexos de verossimilhança e permitindo a regularização por entropia, resultando em desempenho superior em diversas tarefas de robótica.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Este artigo demonstra que a localidade e o compartilhamento de pesos em redes neurais convolucionais alteram fundamentalmente a regularização implícita, permitindo a generalização em dados esféricos de alta dimensão onde redes totalmente conectadas falham, ao acoplar os filtros aprendidos a uma variedade de patches de baixa dimensão.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Este artigo apresenta a solução "WhisperAlign" para o DL Sprint 4.0, que combina uma estratégia de fragmentação de áudio baseada em WhisperX para reconhecimento de fala e um modelo de diarização de fala ajustado especificamente para o dataset da competição, resultando em reduções significativas nas taxas de erro para transcrição e identificação de falantes em longas gravações de áudio em bengali.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity

Este artigo estabelece uma conexão entre polaridade quadrática e divergências de Fenchel-Young polares, demonstrando que transformações de Legendre-Fenchel podem ser manipuladas via álgebra linear em coordenadas homogêneas e revelando uma nova dualidade de referência na geometria da informação através da generalização de divergências de Bregman.

Frank Nielsen, Basile Plus-Gourdon, Mahito Sugiyama2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artigo investiga as capacidades de generalização de modelos fundacionais corporativos para assistência corretiva em conjunto aberto, demonstrando através de dados sintéticos no Overcooked que o desempenho ideal requer conjuntos de dados diversificados que abranjam fundamentação multimodal, inferência de defeitos e exposição a cenários variados.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI