eess.IV 편의 논문 | Gist.Science

Image Compression Using Novel View Synthesis Priors

이 논문은 수중 원격 조작 차량의 실시간 시각 피드백을 위해 사전 임무 정보를 활용한 학습 기반의 새로운 뷰 합성 기법을 통해 기존 방법보다 우수한 압축률과 화질을 달성하는 모델 기반 이미지 압축 기술을 제안합니다.

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

이 논문은 MIMO 레일리 페이딩 채널 환경에서 엔트로피와 채널 상태를 인식하여 적응형 전송률을 제어하고, MLLM 을 활용한 특징 보상을 통해 자원 효율성과 작업 성능을 동시에 극대화하는 새로운 의미 통신 프레임워크를 제안합니다.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

이 논문은 위성 영상 내 선박 검출의 극심한 크기 차이와 높은 종횡비 문제를 해결하기 위해, 기존 YOLO 아키텍처의 피라미드 레벨을 P3-P5 에서 P2-P4 로 전환하고 그룹 정규화를 적용하여 정확도와 효율성을 동시에 극대화한 'LiM-YOLO'를 제안합니다.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

본 논문은 Sobel 엣지 추출과 RDP 알고리즘을 통해 이미지를 희소 점구름으로 변환한 후 중성 원자 아날로그 양자 컴퓨터 (QuEra Aquila) 의 Rydberg Hamiltonian 에 물리적으로 인코딩하여, 정적 구조 인자 (static structure factor) 와 같은 양자 관측량을 활용한 지문 추출을 통해 이미지 매칭 및 머신러닝을 가능하게 하는 'Rydberg Vision' 프레임워크를 제안합니다.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

이 논문은 임상 환경에서 외부 가이드 없이도 결손 상태를 스스로 인식하여 3D MRI 의 완전성을 파악하고 생성할 수 있도록 설계된 'CoPeDiT'라는 새로운 잠재 확산 모델을 제안하며, 이를 통해 다양한 결손 패턴에서도 높은 정확도와 구조적 일관성을 갖춘 고품질 3D MRI 합성을 가능하게 합니다.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

이 논문은 구름과 연기 등으로 인한 위성 관측 데이터의 불완전성 문제를 해결하기 위해, 손상된 화재 맵을 복원하는 1 단계와 복원된 시퀀스를 기반으로 산불 확산을 예측하는 2 단계로 구성된 확률적 프레임워크를 제안하여, 학습 기반 복원 모델을 통해 예측 정확도를 원본 데이터 수준으로 회복할 수 있음을 입증했습니다.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

이 논문은 MRI 와 저선량 PET 스캔을 각각 처리하여 모달리티별 특징을 학습한 후 계층적 특징 융합을 통해 고선량 PET 를 재구성하는 다중 모달리티 다중 태스크 확산 모델 (M2Diff) 을 제안하여, 건강한 뇌와 알츠하이머병 환자 데이터셋 모두에서 우수한 재구성 성능을 입증했습니다.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

DFPF-Net: Dynamically Focused Progressive Fusion Network for Remote Sensing Change Detection

이 논문은 원거리 감지 이미지에서 전역 및 국소적 노이즈를 동시에 해결하기 위해 피라미드 비전 트랜스포머 기반의 점진적 융합 모듈과 동적 변화 집중 모듈을 결합한 DFPF-Net 을 제안하고, 여러 데이터셋에서 기존 방법들보다 우수한 성능을 입증합니다.

Chengming Wang, Peng Duan, Jinjiang LiWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

이 논문은 가시광선 전체 스펙트럼 (250nm) 에서 작동하며 단일 스냅샷으로 HDR 또는 편광 정보를 포함한 초고해상도 초분광 데이터를 재구성할 수 있는 소형 광대역 메타표면 카메라 'MetaSpectra+' 를 제안합니다.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

이 논문은 실제 관측 환경의 고동적 범위와 광시야 문제를 해결하기 위해 패치 기반 학습과 비선형 밝기 변환을 도입한 딥러닝 기반 전파 간섭계 영상 재구성 모델 POLISH 를 개선하여, 차세대 전파 천문학에서 강중력렌즈 발견 효율을 기존 방법 대비 10 배 향상시킬 수 있음을 보였습니다.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

이 연구는 두 개의 대규모 폐암 선별 코호트를 분석한 결과, 저선량 CT 를 통해 정량화한 폐쇄성 폐섬유증 (PPFE) 의 진행이 사망률 및 호흡기 관련 임상 결과와 독립적으로 연관됨을 확인하여, PPFE 진행 정량 평가가 선별 프로그램 내 고위험군 식별을 위한 유용한 영상 바이오마커가 될 수 있음을 시사합니다.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

이 논문은 배경 일관성을 유지하면서 전경 품질을 향상시키기 위해, 할루시네이션 감지를 통해 캐시된 배경 키 - 값과 생성된 키 - 값의 융합 비율 및 CFG 스케일을 동적으로 조절하는 훈련 불필요 KV-Lock 프레임워크를 제안합니다.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

$M^2$ -Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

이 논문은 실제 자율주행 환경에서 카메라 입력이 불완전한 상황에서도 3D 시맨틱 오큐팬시 예측의 견고성을 확보하기 위해 누락된 뷰의 특징을 복원하고 전역적 의미적 일관성을 유지하는 $M^2$ -Occ 프레임워크를 제안합니다.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

이 논문은 360 도 실내 환경에서의 전역적 지각을 위해 왜곡 인식 스펙트럼 모듈레이터와 오미-구형 밀도화 헤드를 갖춘 PanoAffordanceNet 프레임워크와 고품질 데이터셋 360-AGD 를 제안하여, 기존 객체 중심 및 평면 뷰에 국한된 affordance grounding 의 한계를 극복하고 장면 수준의 지각을 위한 강력한 기준을 마련했습니다.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

이 논문은 라벨이 없는 데이터로 초음파 국소화 현미경 (ULM) 의 해상도와 국소화 정확도를 획기적으로 향상시키면서도 실시간 처리가 가능한 최초의 통합 딥러닝 프레임워크인 'CycleULM'을 제안합니다.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Improving Visual Object Tracking through Visual Prompting

이 논문은 사전 훈련된 CLIP 모델을 활용하여 온라인으로 시각적 프롬프트를 자동 생성 및 정제함으로써 주변 방해 요인을 억제하고 범용 객체 추적 성능을 향상시키는 새로운 'PiVOT' 메커니즘을 제안합니다.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu LinTue, 10 Ma💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

이 논문은 베이지안 규칙에 기반하여 무조건부 사전 훈련된 확산 모델과 가우시안 사전 분포를 활용한 MAP 기반 유도 항 추정 기법을 제안함으로써, 초해상도 및 이미지 복원 등 다양한 역문제에서 기존 최첨단 방법보다 더 우수한 구조 보존과 일관성을 달성하는 문제-무관형 확산 모델을 개발했습니다.

Pingping Tao, Haixia Liu, Jing SuTue, 10 Ma💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

이 논문은 BraTS 데이터셋의 다중 MRI 시퀀스를 기반으로 UNet 을 활용한 2D 및 3D 분할 결과를 가중 평균으로 융합하고 사전 학습된 ResNet50 모델에 입력하여 뇌종양 아형 분류 정확도를 99.25% 로 극대화하는 새로운 기법을 제안합니다.

Kiranmayee Janardhan, Christy Bobby ThomasTue, 10 Ma💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

이 논문은 BraTS 데이터셋을 기반으로 UNET, Inception, ResNet 아키텍처를 활용한 딥러닝 기반 2D 및 3D MRI 뇌종양 자동 분할 모델을 제안하여, 3D 분할에서 98.91% 의 정확도와 0.9888 의 Dice 점수를 달성함으로써 임상 진단 효율성을 크게 향상시켰음을 보여줍니다.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

이 논문은 사전 학습된 가우시안 프로세스 모델로 생성된 해부학적 랜드마크를 통합한 새로운 토큰화 방식과 트랜스포머 기반의 기하학적 딥러닝 모델을 제안하여, 고비용 침습적 PET 스캔 없이도 알츠하이머병 진단 및 중위험군의 뇌 아밀로이드 양성 예측 정확도를 향상시켰습니다.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs

eess.IV