DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

이 논문은 방사선 노출을 줄이면서도 고품질 CBCT 영상을 재구성하기 위해 다중 뷰 2D 및 다중 스케일 3D 특징을 통합한 DiCE 네트워크와 하이브리드 뷰 샘플링 사전 학습 (HyViP) 프레임워크를 갖춘 최초의 CBCT 재구성 기반 모델인 'DeepSparse'를 제안하고, 이를 통해 기존 방법들보다 우수한 재구성 성능을 입증했습니다.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

이 논문은 GAN 의 모드 붕괴 문제를 해결하고 구조적 다양성을 강화하기 위해 분산 패널티를 도입한 변형된 피라미드 pix2pix 모델을 개발하여, 비용 효율적이고 확장 가능한 HER2 양성 유방암 진단을 위해 H&E 염색 이미지를 고품질 IHC 이미지로 변환하는 새로운 딥러닝 프레임워크를 제시합니다.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung NamTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

이 논문은 CNN 의 국소적 특징 추출 능력과 트랜스포머의 전역적 문맥 이해 능력을 결합한 TransUNet-GradCAM 모델을 제안하여, 다양한 외부 데이터셋에서도 견고한 제로샷 성능과 높은 설명 가능성을 갖춘 당뇨병성 발궤양 자동 분할 솔루션을 제시합니다.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

이 논문은 희소 데이터에서도 재학습 없이 3D 광음향 단층촬영 (PACT) 의 원시 센서 데이터로부터 직접 고품질 3D 영상을 생성하는 물리 인식 신경 연산자 'PANO'를 제안하여, 기존 알고리즘보다 우수한 성능과 실시간 추론을 가능하게 함으로써 임상 적용을 위한 새로운 길을 제시합니다.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

이 논문은 7 개 해부학적 영역의 9,700 개 이상의 주석이 포함된 대규모 데이터셋으로 학습된 UltraUPConvNet 을 제안하여, 기존 AI 연구에서 분리되어 수행되던 초음파 질병 예측과 조직 분할을 단일 효율적인 프레임워크로 통합하고 우수한 성능을 달성함을 보여줍니다.

Zhi Chen, Le ZhangTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

이 논문은 실제 오디오와 정지 얼굴 이미지를 동기화하여 합성된 시각 데이터를 생성함으로써, 시각적 자료가 전혀 없는 언어에서도 오디오만 사용하는 모델보다 우수한 성능을 보이는 오디오비주얼 음성 인식 (AVSR) 모델을 구축할 수 있음을 입증했습니다.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

이 논문은 저비용 전장 OCT(Self-OCT) 영상을 심층 학습 기반의 합성곱 신경망 (CNN) 과 합성곱 제거 오토인코더 (CDAE) 를 활용하여 망막과 색소 상피 박리 (PED) 를 자동 분할하고, CDAE 를 통해 아티팩트로 인한 오류를 보정하는 새로운 방법을 제시합니다.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

이 논문은 물리 기반 역해법으로 초기화를 수행하고 3D 합성곱 U-Net 을 통해 데이터 기반의 공간적 의존성을 학습하는 하이브리드 모델인 3D-PIUNet 을 제안하여, 기존 전통적 방법 및 순차적 딥러닝 접근법보다 뇌 전도 (EEG) 신호의 공간적 정확도를 획기적으로 향상시켰음을 보여줍니다.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

이 논문은 H&E 염색 조직 슬라이드에서 직접 분자 아형 (기저형 및 고전형) 을 예측하여 비용 효율적이고 해석 가능한 췌장암 정밀 의학을 가능하게 하는 딥러닝 프레임워크 'PanSubNet'을 제안하고, 다기관 코호트에서 높은 정확도와 예후 예측 능력을 입증했습니다.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

이 논문은 초고장 MRI 데이터의 신호 불균일성과 이질적인 대비 문제로 인해 기존 도구들이 한계를 보였던 뇌 분할 및 피질 분할 문제를 해결하기 위해, 다양한 대비와 해상도에 적응 가능한 35 개 라벨의 뇌 분할과 62 개 라벨의 DKT 피질 분할을 수행하는 차세대 딥러닝 툴박스인 GOUHFI 2.0 을 소개합니다.

Marc-Antoine Fortin, Anne Louise Kristoffersen, Paal Erik GoaThu, 12 Ma⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

이 논문은 의료 영상에서 공간적 배열 정보가 약한 경우 기존 비전 트랜스포머의 고정된 공간 사전 지식이 비효율적일 수 있음을 지적하고, 위치 임베딩과 [CLS] 토큰을 제거한 경량화된 ZACH-ViT 아키텍처를 제안하여 데이터가 부족한 의료 영상 환경에서 데이터 구조에 맞는 아키텍처 정렬이 성능 향상에 기여함을 입증합니다.

Athanasios AngelakisThu, 12 Ma⚡ eess

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

이 논문은 재귀적 잔차 압축, 하이퍼프리오어 및 엑시테이션을 통합하여 기존 학습 기반 이미지 압축 방식의 계산 비용과 병렬성 한계를 극복하면서도 Balle, Minnen & Singh 모델 및 VVC 인트라 코덱 대비 우수한 비트율-왜곡 효율을 달성하는 ARCHE 프레임워크를 제안합니다.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios SkodrasThu, 12 Ma⚡ eess

An FPGA Implementation of Displacement Vector Search for Intra Pattern Copy in JPEG XS

이 논문은 JPEG XS 의 인트라 패턴 복사 (IPC) 기능을 위한 변위 벡터 검색 모듈의 효율적인 파이프라인 FPGA 아키텍처를 제안하여, 최적화된 메모리 조직을 통해 38.3 Mpixels/s 의 처리량과 277mW 의 저전력 소모를 달성함으로써 실제 하드웨어 배포의 실현 가능성을 입증했습니다.

Qiyue Chen, Yao Li, Jie Tao, Song Chen, Li Li, Dong LiuThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

본 논문은 대역폭 제약과 긴 전파 지연이 있는 위성 환경에서 고품질의 동기화된 오디오비주얼 재구성을 위해, 주요 모달리티만 전송하고 다른 모달리티는 생성으로 복원하는 적응형 멀티모달 의미 기반 전송 시스템과 LLM 기반 의사결정 모듈을 제안합니다.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

이 논문은 외부 학습 데이터 없이도 슬라이스 프로파일 추정, 슬라이스 간격, 도메인 이동 및 임의의 업샘플링 인자를 모두 해결하여 2D MR 볼륨의 이방성 해상도를 향상시키는 자기 초해상도 방법인 ECLARE 를 제안하고, 이를 통해 신호 복원 및 하류 작업에서 기존 방법들을 능가하는 성능을 입증합니다.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs