EO-VAE: Towards A Multi-sensor Tokenizer for Earth Observation Data

이 논문은 다양한 센서 사양과 스펙트럼 채널을 가진 지구 관측 (EO) 데이터를 단일 모델로 효율적으로 인코딩하고 재구성하기 위해 동적 하이퍼네트워크를 활용한 'EO-VAE'라는 새로운 다중 센서 토크나이저를 제안하고, TerraMesh 데이터셋 실험을 통해 기존 방법보다 우수한 재구성 정확도를 입증합니다.

Nils Lehmann, Yi Wang, Zhitong Xiong + 1 more2026-03-04💻 cs

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

이 논문은 희귀 질환과 같은 긴 꼬리 데이터를 줄이고 강화학습 및 도구 증강 에이전트 훈련을 통해 진단 추론 능력을 향상시킨 엔티티 인식 지속적 사전 훈련 프레임워크를 도입하여, 다양한 의료 벤치마크에서 최첨단 성능을 달성하고 폐쇄형 멀티모달 시스템을 능가하는 의료용 대규모 멀티모달 모델 'MedXIAOHE'를 제안합니다.

Baorong Shi, Bo Cui, Boyuan Jiang + 17 more2026-03-04⚡ eess

CRAFT-LoRA: Content-Style Personalization via Rank-Constrained Adaptation and Training-Free Fusion

이 논문은 기존 LoRA 기반 개인화 기법의 한계를 극복하기 위해, 콘텐츠와 스타일 표현의 분리를 촉진하는 랭크 제약 미세조정, 프롬프트 기반의 정밀 제어 메커니즘, 그리고 추가 학습 없이 안정성을 높이는 시간 단계 의존적 무분류기 가이드 방식을 통합한 CRAFT-LoRA 를 제안합니다.

Yu Li, Yujun Cai, Chi Zhang2026-03-04💻 cs

3D Modality-Aware Pre-training for Vision-Language Model in MRI Multi-organ Abnormality Detection

이 논문은 3D MRI 기반 다기관 이상 감지 성능을 향상시키기 위해 12 가지 MRI 모달리티와 9 가지 이상을 포함하는 대규모 데이터셋 'MedMoM-MRI3D'를 구축하고, 모달리티 인식 정렬 및 미세 조정 단계를 거치는 새로운 의료 모달리티 인식 사전 학습 프레임워크 'MedMAP'을 제안합니다.

Haowen Zhu, Ning Yin, Xiaogen Zhou2026-03-04🤖 cs.AI

Leveraging GenAI for Segmenting and Labeling Centuries-old Technical Documents

이 논문은 16~17 세기 선박 건조 논고와 같은 고문서의 자동 분류 및 검색을 위해 SAM2, Florence2, ChatGPT 와 같은 생성형 AI 기술과 도메인 특화 온톨로지를 결합한 시나리오를 제시하며, 데이터 부족과 전문성이라는 한계에도 불구하고 역사적 자료의 디지털 큐레이션 잠재력을 입증합니다.

Carlos Monroy, Benjamin Navarro2026-03-04⚡ eess

A Novel Evolutionary Method for Automated Skull-Face Overlay in Computer-Aided Craniofacial Superimposition

이 논문은 연조직 두께의 변이성을 3D 원뿔 모델로 표현하고 차분 진화 알고리즘을 활용하여 해부학적 및 사진적 타당성을 보장하는 'Lilium'이라는 자동화된 진화적 방법을 제안함으로써 두개골 - 안면 오버레이의 정확성과 견고성을 크게 향상시켰습니다.

Práxedes Martínez-Moreno, Andrea Valsecchi, Pablo Mesejo + 3 more2026-03-04🤖 cs.AI

GLIDE-Reg: Global-to-Local Deformable Registration Using Co-Optimized Foundation and Handcrafted Features

이 논문은 전역 의미적 단서와 국소 기술자를 결합하고 VFM 임베딩을 등록 관련성 있게 압축하는 공동 최적화 방식을 통해 다양한 해상도와 해부학적 범위를 아우르는 강건한 변형 등록을 달성하여 기존 최첨단 방법보다 우수한 성능을 보이는 'GLIDE-Reg'를 제안합니다.

Yunzheng Zhu, Aichi Chien, Kimaya kulkarni + 5 more2026-03-04⚡ eess

ShiftLUT: Spatial Shift Enhanced Look-Up Tables for Efficient Image Restoration

이 논문은 엣지 장치 배포를 저해하는 연산 및 저장 오버헤드를 줄이면서 기존 LUT 기반 방법 중 가장 넓은 수용 영역을 확보하고 성능을 향상시키기 위해 학습 가능한 공간 이동 모듈, 비대칭 듀얼 브랜치 아키텍처, 그리고 오류 제한 적응적 샘플링을 결합한 ShiftLUT 프레임워크를 제안합니다.

Xiaolong Zeng, Yitong Yu, Shiyao Xiong + 4 more2026-03-04💻 cs

Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications

이 논문은 상업용 및 산업용 폐기물의 무게를 정밀하게 추정하기 위해 RGB 이미지와 물리적 메타데이터를 융합한 '다중 모달 무게 예측기 (MWP)' 프레임워크와 1 만 개 이상의 실제 폐기물 데이터셋을 제안하고, 시각적 및 물리적 단서를 상호 보완적으로 활용하여 다양한 무게 구간에서 높은 정확도와 해석 가능성을 입증했습니다.

Md. Adnanul Islam, Wasimul Karim, Md Mahbub Alam + 7 more2026-03-04💻 cs