eess.IV artigos | Gist.Science

Image Compression Using Novel View Synthesis Priors

Este artigo propõe uma técnica de compressão de imagens baseada em modelos que utiliza síntese de novas vistas e otimização por descida de gradiente para permitir o feedback visual em tempo real no controle de veículos operados remotamente subaquáticos, superando as limitações de largura de banda da comunicação acústica.

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

Este artigo propõe um novo framework de comunicação semântica que utiliza controle de taxa adaptativo baseado em entropia e estado do canal, combinado com compensação de características via modelos de linguagem multimodal (MLLM), para otimizar a transmissão de recursos em canais de desvanecimento Rayleigh MIMO.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

O artigo apresenta o LiM-YOLO, um detector de navios otimizado para imagens de sensoriamento remoto que, ao deslocar os níveis da pirâmide de características de P3-P5 para P2-P4 e empregar normalização por grupos, resolve desafios de escala e estabilidade de treinamento, alcançando precisão superior com menos parâmetros.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

Este artigo apresenta um quadro nativo quântico para correspondência de imagens em computadores analógicos de átomos neutros, que converte imagens em nuvens de pontos esparsas via pré-processamento clássico e utiliza a evolução temporal de Rydberg para extrair impressões digitais quânticas baseadas em correlações e fatores de estrutura estática, permitindo reconhecimento de objetos com poucos átomos e aplicação em computação de reservatório quântico.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

O artigo apresenta o CoPeDiT, um modelo de difusão latente unificado equipado com percepção de completude que, ao inferir automaticamente estados de dados ausentes sem necessidade de guias externos, supera os métodos atuais na síntese de alta fidelidade e consistência estrutural de ressonâncias magnéticas 3D.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

Este artigo propõe um framework probabilístico de duas etapas que combina reconstrução de dados de incêndios corrompidos por nuvens e fumaça com previsão espaço-temporal, demonstrando que a recuperação prévia das observações parciais restaura significativamente a precisão das previsões de propagação de incêndios, superando o gap de domínio entre dados de treinamento limpos e entradas degradadas.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

O artigo apresenta o M2Diff, um modelo de difusão multi-modality e multi-tarefa que processa separadamente imagens de MRI e PET de baixa dose para extrair características específicas e fundi-las hierarquicamente, resultando na reconstrução de imagens PET de dose padrão com maior fidelidade tanto em cérebros saudáveis quanto em pacientes com doença de Alzheimer.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

DFPF-Net: Dynamically Focused Progressive Fusion Network for Remote Sensing Change Detection

O artigo propõe a DFPF-Net, uma rede de fusão progressiva com foco dinâmico que combina transformadores de visão em pirâmide e mecanismos de atenção para superar limitações de CNNs e ruídos locais em transformadores, alcançando desempenho superior na detecção de mudanças em imagens de sensoriamento remoto.

Chengming Wang, Peng Duan, Jinjiang LiWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

O artigo apresenta o MetaSpectra+, uma câmera compacta de banda larga baseada em superfícies metassuperficiais que, em uma única captura, realiza imageamento hiperespectral de alta precisão combinado com modos de alta faixa dinâmica (HDR) ou polarização, superando as limitações de banda estreita e o tamanho de dispositivos anteriores.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Este trabalho aprimora o modelo de aprendizado profundo POLISH para reconstrução de imagens de interferometria de rádio, introduzindo estratégias de treinamento em patches e transformações de intensidade não lineares que permitem a descoberta robusta de lentes gravitacionais fortes em grandes campos de visão e alto alcance dinâmico, superando significativamente os métodos tradicionais como o CLEAN.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

Este estudo demonstra que a progressão radiológica da fibroelastose pleuroparenquimatosa (PPFE) em programas de rastreio de cancro do pulmão está independentemente associada ao aumento da mortalidade e a desfechos clínicos adversos, sugerindo que a sua avaliação quantitativa pode servir como um biomarcador relevante para identificar indivíduos com maior risco respiratório.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

O artigo apresenta o KV-Lock, uma abordagem livre de treinamento para modelos de difusão de vídeo baseados em DiT que otimiza a consistência de fundo e a qualidade do primeiro plano ajustando dinamicamente a fusão de chaves-valor (KVs) e a escala de orientação condicional (CFG) com base na detecção de alucinação.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

$M^2$ -Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

O artigo apresenta o $M^2$ -Occ, um framework inovador para previsão de oclusão semântica 3D em direção autônoma que utiliza reconstrução mascarada multiview e memória de características para manter a precisão geométrica e semântica mesmo na ausência de múltiplas câmeras, superando significativamente os métodos existentes em cenários de falha de visão.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

O artigo apresenta o PanoAffordanceNet, um novo framework e conjunto de dados (360-AGD) que estabelecem a tarefa de "Grounding de Apropriação Holística" em ambientes internos de 360°, superando desafios como distorções geométricas e dispersão semântica para permitir uma percepção global em agentes corporificados.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

O artigo apresenta o CycleULM, um quadro de aprendizado profundo unificado e sem rótulos que supera as limitações de dados e simulação na microscopia de localização por ultrassom, melhorando significativamente a resolução, a precisão de localização de microbolhas e a velocidade de processamento para viabilizar aplicações clínicas em tempo real.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Improving Visual Object Tracking through Visual Prompting

O artigo apresenta o PiVOT, um novo mecanismo de prompting visual que aproveita um modelo fundacional pré-treinado (CLIP) para gerar e refinar dinamicamente prompts online, permitindo que o rastreador suprima distratores e melhore o desempenho no rastreamento genérico de objetos.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu LinTue, 10 Ma💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

Este artigo propõe um modelo de difusão agnóstico ao problema, baseado na estimativa de um termo guiado de máxima a posteriori (MAP), que aproveita modelos pré-treinados incondicionais para resolver problemas inversos em processamento de imagens, demonstrando superioridade na preservação de estruturas e coerência em comparação com métodos existentes.

Pingping Tao, Haixia Liu, Jing SuTue, 10 Ma💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Este estudo propõe um algoritmo que funde imagens de ressonância magnética multimodais (T1, T2, T1ce e FLAIR) segmentadas por redes U-Net em 2D e 3D e classificadas por um modelo ResNet50, alcançando uma precisão de 99,25% na subclasse de gliomas e superando técnicas existentes.

Kiranmayee Janardhan, Christy Bobby ThomasTue, 10 Ma💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Este artigo propõe uma abordagem de aprendizado profundo baseada nas arquiteturas UNET, Inception e ResNet para realizar a segmentação automática e precisa de gliomas em imagens de ressonância magnética 2D e 3D, alcançando alto desempenho e equilibrando eficiência computacional com acurácia espacial para auxiliar no diagnóstico clínico.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Este artigo propõe um modelo de aprendizado profundo geométrico baseado em transformadores, que utiliza uma nova esquematização de tokenização em malhas tetraédricas com marcos anatômicos para melhorar o diagnóstico da doença de Alzheimer e prever a positividade da amiloide cerebral em indivíduos de risco médio, oferecendo uma alternativa precisa e não invasiva aos exames PET.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs

eess.IV