Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

이 논문은 희소한 병리학자 주석과 지수 이동 평균 기반의 교사 네트워크를 활용하여 점진적으로 가짜 마스크를 정제하는 약지도 교사 - 학생 프레임워크를 제안함으로써, 비용 효율적이고 일반화 가능한 대장암 조직병리선 분할을 가능하게 합니다.

Hikmat Khan, Wei Chen, Muhammad Khalid Khan Niazi2026-03-10💻 cs

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

이 논문은 단일 주체의 캡처 데이터만으로도 다양한 표정 일반화 능력을 향상시키기 위해, 학습 중 유사한 표정을 검색하여 증강하는 'RAF(Retrieval-Augmented Faces)' 기법을 제안하고 템플릿 없는 애니메이션 가능한 헤드 아바타의 표현 충실도를 크게 개선함을 보여줍니다.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

RBF Weighted Hyper-Involution for RGB-D Object Detection

이 논문은 RGB-D 객체 탐지를 위해 원시 깊이 맵의 공간적 상호작용 패턴에 따라 동적으로 조정되는 RBF 가중 초-전환 (hyper-involution) 과 정보 손실 없이 특징을 융합하는 학습 가능한 업샘플링 레이어를 도입하여, 실시간으로 높은 성능을 달성하는 두 스트림 모델을 제안합니다.

Mehfuz A Rahman, Khushal Das, Jiju Poovvancheri, Neil London, Dong Chen2026-03-09💻 cs

Fuse4Seg: Image Fusion for Multi-Modal Medical Segmentation via Bi-level Optimization

이 논문은 의료 분할 작업의 성능을 직접적으로 최적화하기 위해 분할 모델의 의미론적 기울기를 피드백으로 활용하는 이수준 최적화 프레임워크 'Fuse4Seg'를 제안하여, 기존 시각 중심 융합 방식의 한계를 극복하고 동시에 물리적 정확성과 임상적 해석 가능성을 보장합니다.

Yuchen Guo, Junli Gong, Hongmin Cai, Yiu-ming Cheung, Weifeng Su2026-03-09💻 cs

PACE: Marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization

이 논문은 파라미터 효율적 미세 조정 (PEFT) 의 일반화 성능을 향상시키기 위해 적응기에서 학습된 특징에 곱셈 노이즈를 가해 일관성 정규화를 수행하는 'PACE'를 제안하며, 이를 통해 그래디언트 노름을 감소시키고 사전 학습된 지식을 유지하여 다양한 시각 및 언어 작업에서 기존 방법들을 능가하는 성능을 입증합니다.

Yao Ni, Shan Zhang, Piotr Koniusz2026-03-09🤖 cs.LG

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

이 논문은 UAV 영상에서 배경 노이즈를 줄이고 행동 관련 객체 정보에 집중하여 미래 동작을 예측하는 'FALCON'이라는 자기지도 학습 전처리 방법을 제안함으로써, UAV 행동 인식의 정확도를 높이고 추론 속도를 크게 개선했다고 요약할 수 있습니다.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

AuthFace: Towards Authentic Blind Face Restoration with Face-oriented Generative Diffusion Prior

이 논문은 고해상도 사진 데이터셋과 사진가들의 전문적인 가이드를 기반으로 한 얼굴 중심 생성 확산 사전 지식을 학습하여, 기존 방법의 한계를 극복하고 눈과 입과 같은 중요한 부위의 아티팩트를 최소화하면서도 사실적인 안면 복원 결과를 달성하는 'AuthFace' 프레임워크를 제안합니다.

Guoqiang Liang, Qingnan Fan, Bingtao Fu, Jinwei Chen, Hong Gu, Lin Wang2026-03-09💻 cs

PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance

이 논문은 비디오 콘텐츠의 높은 중복성을 해결하기 위해 사용자 지시를 기반으로 관심 영역을 식별하고 적응형 풀링을 통해 시각 토큰을 최대 18 배까지 압축하면서도 성능을 유지하는 프롬프트 기반 풀링 LLaVA(PPLLaVA) 를 제안하여 비디오 이해의 효율성과 처리량을 획기적으로 개선합니다.

Shangkun Sun, Ruyang Liu, Haoran Tang, Yixiao Ge, Haibo Lu, Jiankun Yang, Chen Li2026-03-09💻 cs

Rethinking the Mixture of Vision Encoders Paradigm for Enhanced Visual Understanding in Multimodal LLMs

이 논문은 다양한 비전 인코더의 시각 토큰을 효과적으로 통합하는 경량화된 설계 원칙을 제안하고, 이를 적용한 'LEO'라는 새로운 아키텍처가 다양한 벤치마크와 자율주행 도메인에서 기존 혼합 비전 인코더 (MoVE) 기반 모델보다 우수한 성능을 보임을 입증합니다.

Mozhgan Nasr Azadani, James Riddell, Sean Sedwards, Krzysztof Czarnecki2026-03-09💬 cs.CL

PoI: A Filter to Extract Pixel of Interest from Novel Views for Scene Coordinate Regression

이 논문은 3D 가우스 스플래팅과 확산 모델을 활용한 새로운 뷰 합성 기법과 재투영 오류 기반의 점진적 픽셀 필터링 전략을 결합하여, 희소하거나 극단적인 시점에서도 신뢰할 수 있는 픽셀만 선별적으로 학습함으로써 장면 좌표 회귀 기반의 시각적 국소화 정확도를 획기적으로 향상시키는 PoI 프레임워크를 제안합니다.

Feifei Li, Qi Song, Chi Zhang, Hui Shuai, Rui Huang2026-03-09💻 cs

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

이 논문은 대규모 멀티모달 언어 모델을 활용한 과학적 발견, 실험, 콘텐츠 생성 및 평가의 5 가지 핵심 영역에 대한 데이터셋, 방법론, 평가 전략, 한계 및 윤리적 문제를 포괄적으로 검토하여 AI 기반 과학 연구의 현재와 미래를 조명하는 종합적인 조사를 제공합니다.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

이 논문은 외부 학습 데이터 없이도 슬라이스 프로파일 추정, 슬라이스 간격, 도메인 이동 및 임의의 업샘플링 인자를 모두 해결하여 2D MR 볼륨의 이방성 해상도를 향상시키는 자기 초해상도 방법인 ECLARE 를 제안하고, 이를 통해 신호 복원 및 하류 작업에서 기존 방법들을 능가하는 성능을 입증합니다.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. Dewey2026-03-09💻 cs

EarthScape: A Multimodal Dataset for Surficial Geologic Mapping and Earth Surface Analysis

이 논문은 디지털 고도 모델, 항공 이미지, 지형 및 수문 벡터 데이터 등을 통합한 AI 준비형 다중 모달 데이터셋 'EarthScape'를 소개하고, 이를 통해 표층 지질 매핑의 효율성을 높이고 다양한 모달리티 융합 및 도메인 적응을 위한 벤치마크를 제공한다고 요약할 수 있습니다.

Matthew Massey, Nusrat Munia, Abdullah-Al-Zubaer Imran2026-03-09💻 cs