Image Compression Using Novel View Synthesis Priors
이 논문은 수중 원격 조작 차량의 실시간 시각 피드백을 위해 사전 임무 정보를 활용한 학습 기반의 새로운 뷰 합성 기법을 통해 기존 방법보다 우수한 압축률과 화질을 달성하는 모델 기반 이미지 압축 기술을 제안합니다.
93 편의 논문
이 논문은 수중 원격 조작 차량의 실시간 시각 피드백을 위해 사전 임무 정보를 활용한 학습 기반의 새로운 뷰 합성 기법을 통해 기존 방법보다 우수한 압축률과 화질을 달성하는 모델 기반 이미지 압축 기술을 제안합니다.
이 논문은 MIMO 레일리 페이딩 채널 환경에서 엔트로피와 채널 상태를 인식하여 적응형 전송률을 제어하고, MLLM 을 활용한 특징 보상을 통해 자원 효율성과 작업 성능을 동시에 극대화하는 새로운 의미 통신 프레임워크를 제안합니다.
이 논문은 위성 영상 내 선박 검출의 극심한 크기 차이와 높은 종횡비 문제를 해결하기 위해, 기존 YOLO 아키텍처의 피라미드 레벨을 P3-P5 에서 P2-P4 로 전환하고 그룹 정규화를 적용하여 정확도와 효율성을 동시에 극대화한 'LiM-YOLO'를 제안합니다.
본 논문은 Sobel 엣지 추출과 RDP 알고리즘을 통해 이미지를 희소 점구름으로 변환한 후 중성 원자 아날로그 양자 컴퓨터 (QuEra Aquila) 의 Rydberg Hamiltonian 에 물리적으로 인코딩하여, 정적 구조 인자 (static structure factor) 와 같은 양자 관측량을 활용한 지문 추출을 통해 이미지 매칭 및 머신러닝을 가능하게 하는 'Rydberg Vision' 프레임워크를 제안합니다.
이 논문은 임상 환경에서 외부 가이드 없이도 결손 상태를 스스로 인식하여 3D MRI 의 완전성을 파악하고 생성할 수 있도록 설계된 'CoPeDiT'라는 새로운 잠재 확산 모델을 제안하며, 이를 통해 다양한 결손 패턴에서도 높은 정확도와 구조적 일관성을 갖춘 고품질 3D MRI 합성을 가능하게 합니다.
이 논문은 구름과 연기 등으로 인한 위성 관측 데이터의 불완전성 문제를 해결하기 위해, 손상된 화재 맵을 복원하는 1 단계와 복원된 시퀀스를 기반으로 산불 확산을 예측하는 2 단계로 구성된 확률적 프레임워크를 제안하여, 학습 기반 복원 모델을 통해 예측 정확도를 원본 데이터 수준으로 회복할 수 있음을 입증했습니다.
이 논문은 MRI 와 저선량 PET 스캔을 각각 처리하여 모달리티별 특징을 학습한 후 계층적 특징 융합을 통해 고선량 PET 를 재구성하는 다중 모달리티 다중 태스크 확산 모델 (M2Diff) 을 제안하여, 건강한 뇌와 알츠하이머병 환자 데이터셋 모두에서 우수한 재구성 성능을 입증했습니다.
이 논문은 원거리 감지 이미지에서 전역 및 국소적 노이즈를 동시에 해결하기 위해 피라미드 비전 트랜스포머 기반의 점진적 융합 모듈과 동적 변화 집중 모듈을 결합한 DFPF-Net 을 제안하고, 여러 데이터셋에서 기존 방법들보다 우수한 성능을 입증합니다.
이 논문은 가시광선 전체 스펙트럼 (250nm) 에서 작동하며 단일 스냅샷으로 HDR 또는 편광 정보를 포함한 초고해상도 초분광 데이터를 재구성할 수 있는 소형 광대역 메타표면 카메라 'MetaSpectra+' 를 제안합니다.
이 논문은 실제 관측 환경의 고동적 범위와 광시야 문제를 해결하기 위해 패치 기반 학습과 비선형 밝기 변환을 도입한 딥러닝 기반 전파 간섭계 영상 재구성 모델 POLISH 를 개선하여, 차세대 전파 천문학에서 강중력렌즈 발견 효율을 기존 방법 대비 10 배 향상시킬 수 있음을 보였습니다.
이 연구는 두 개의 대규모 폐암 선별 코호트를 분석한 결과, 저선량 CT 를 통해 정량화한 폐쇄성 폐섬유증 (PPFE) 의 진행이 사망률 및 호흡기 관련 임상 결과와 독립적으로 연관됨을 확인하여, PPFE 진행 정량 평가가 선별 프로그램 내 고위험군 식별을 위한 유용한 영상 바이오마커가 될 수 있음을 시사합니다.
이 논문은 배경 일관성을 유지하면서 전경 품질을 향상시키기 위해, 할루시네이션 감지를 통해 캐시된 배경 키 - 값과 생성된 키 - 값의 융합 비율 및 CFG 스케일을 동적으로 조절하는 훈련 불필요 KV-Lock 프레임워크를 제안합니다.
이 논문은 실제 자율주행 환경에서 카메라 입력이 불완전한 상황에서도 3D 시맨틱 오큐팬시 예측의 견고성을 확보하기 위해 누락된 뷰의 특징을 복원하고 전역적 의미적 일관성을 유지하는 -Occ 프레임워크를 제안합니다.
이 논문은 360 도 실내 환경에서의 전역적 지각을 위해 왜곡 인식 스펙트럼 모듈레이터와 오미-구형 밀도화 헤드를 갖춘 PanoAffordanceNet 프레임워크와 고품질 데이터셋 360-AGD 를 제안하여, 기존 객체 중심 및 평면 뷰에 국한된 affordance grounding 의 한계를 극복하고 장면 수준의 지각을 위한 강력한 기준을 마련했습니다.
이 논문은 라벨이 없는 데이터로 초음파 국소화 현미경 (ULM) 의 해상도와 국소화 정확도를 획기적으로 향상시키면서도 실시간 처리가 가능한 최초의 통합 딥러닝 프레임워크인 'CycleULM'을 제안합니다.
이 논문은 사전 훈련된 CLIP 모델을 활용하여 온라인으로 시각적 프롬프트를 자동 생성 및 정제함으로써 주변 방해 요인을 억제하고 범용 객체 추적 성능을 향상시키는 새로운 'PiVOT' 메커니즘을 제안합니다.
이 논문은 베이지안 규칙에 기반하여 무조건부 사전 훈련된 확산 모델과 가우시안 사전 분포를 활용한 MAP 기반 유도 항 추정 기법을 제안함으로써, 초해상도 및 이미지 복원 등 다양한 역문제에서 기존 최첨단 방법보다 더 우수한 구조 보존과 일관성을 달성하는 문제-무관형 확산 모델을 개발했습니다.
이 논문은 BraTS 데이터셋의 다중 MRI 시퀀스를 기반으로 UNet 을 활용한 2D 및 3D 분할 결과를 가중 평균으로 융합하고 사전 학습된 ResNet50 모델에 입력하여 뇌종양 아형 분류 정확도를 99.25% 로 극대화하는 새로운 기법을 제안합니다.
이 논문은 BraTS 데이터셋을 기반으로 UNET, Inception, ResNet 아키텍처를 활용한 딥러닝 기반 2D 및 3D MRI 뇌종양 자동 분할 모델을 제안하여, 3D 분할에서 98.91% 의 정확도와 0.9888 의 Dice 점수를 달성함으로써 임상 진단 효율성을 크게 향상시켰음을 보여줍니다.
이 논문은 사전 학습된 가우시안 프로세스 모델로 생성된 해부학적 랜드마크를 통합한 새로운 토큰화 방식과 트랜스포머 기반의 기하학적 딥러닝 모델을 제안하여, 고비용 침습적 PET 스캔 없이도 알츠하이머병 진단 및 중위험군의 뇌 아밀로이드 양성 예측 정확도를 향상시켰습니다.