cs.CV 편의 논문 | Gist.Science

Efficient Degradation-agnostic Image Restoration via Channel-Wise Functional Decomposition and Manifold Regularization

이 논문은 채널별 기능 분해와 매니폴드 정규화를 통해 다양한 열화 유형을 효율적으로 처리하면서도 뛰어난 성능을 달성하는 새로운 이미지 복원 프레임워크인 MIRAGE 를 제안합니다.

Bin Ren, Yawei Li, Xu Zheng + 6 more2026-03-02💻 cs

OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

이 논문은 제한된 기존 데이터셋의 한계를 극복하고 실제 환경으로의 일반화 성능을 검증하기 위해, 80 시간 분량의 15 개 영상과 16 가지 클래스로 구성된 3 가지 영역 (스태지드, 합성, 자연 발생) 을 아우르는 통합 벤치마크 'OmniFall'을 제안합니다.

David Schneider, Zdravko Marinov, Zeyun Zhong + 5 more2026-03-02💻 cs

Cora: Correspondence-aware image editing using few step diffusion

이 논문은 구조적 변화가 필요한 이미지 편집 시 발생하는 아티팩트를 해결하고 원본의 구조와 질감을 정확히 유지하기 위해 대응 관계 기반 노이즈 보정과 보간된 어텐션 맵을 도입한 새로운 프레임워크 'Cora'를 제안합니다.

Amirhossein Alimohammadi, Aryan Mikaeili, Sauradip Nag + 3 more2026-03-02💻 cs

ECAM: A Contrastive Learning Approach to Avoid Environmental Collision in Trajectory Forecasting

이 논문은 기존 궤적 예측 모델에 통합되어 환경적 충돌을 방지하는 능력을 크게 향상시키는 대비 학습 기반의 ECAM(환경 충돌 회피 모듈) 을 제안하고 ETH/UCY 데이터셋을 통해 그 유효성을 입증합니다.

Giacomo Rosin, Muhammad Rameez Ur Rahman, Sebastiano Vascon2026-03-02💻 cs

LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation

이 논문은 LLM 의 지식을 활용하여 텍스트 정보를 강화하고, CLIP 기반의 멀티모달 융합 및 다중 어텐션 메커니즘을 통해 도메인 간 선호도와 복잡한 사용자 관심을 효과적으로 포착함으로써 기존 방법보다 우수한 성능을 보이는 새로운 크로스 도메인 순차 추천 모델인 LLM-EMF 를 제안합니다.

Wangyu Wu, Zhenhong Chen, Wenqiao Zhang + 5 more2026-03-02💻 cs

Distilling Balanced Knowledge from a Biased Teacher

이 논문은 편향된 교사 모델로부터 균형 잡힌 지식을 추출하기 위해 교차 그룹 손실과 그룹 내 손실을 재구성하고 각각을 보정 및 재가중하는 '장기 꼬리 지식 증류 (LTKD)' 프레임워크를 제안하여, 기존 방법들보다 전반적 및 꼬리 클래스 정확도에서 우수한 성능을 입증합니다.

Seonghak Kim2026-03-02💻 cs

Empowering Small VLMs to Think with Dynamic Memorization and Exploration

이 논문은 SFT 와 RLVR 간의 트레이드오프를 동적으로 관리하고 시각적 감독 메커니즘을 결합한 'DyME'라는 새로운 학습 패러다임을 제안함으로써, 제한된 용량의 소형 시각 - 언어 모델 (SVLM) 에도 안정적이고 효과적인 추론 능력을 부여하는 것을 목표로 합니다.

Jiazhen Liu, Yuchuan Deng, Long Chen2026-03-02💻 cs

SelvaBox: A high-resolution dataset for tropical tree crown detection

이 논문은 열대 우림의 개별 수관 탐지를 위해 3 개 국가의 드론 영상에서 83,000 개 이상의 수관을 수동으로 라벨링한 'SelvaBox'라는 대규모 오픈 액세스 데이터셋을 소개하고, 이를 통해 고해상도 입력의 중요성과 다른 데이터셋에 대한 제로샷 탐지 성능을 입증했습니다.

Hugo Baudchon, Arthur Ouaknine, Martin Weiss + 5 more2026-03-02💻 cs

Concept-based Adversarial Attack: a Probabilistic Perspective

이 논문은 단일 이미지 변형을 넘어 개념의 확률적 분포를 조작하여 원본 개념을 유지하면서도 다양하고 효율적인 적대적 예제를 생성하는 새로운 프레임워크를 제안합니다.

Andi Zhang, Xuan Ding, Steven McDonagh + 1 more2026-03-02🤖 cs.AI

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

이 논문은 기상학 분야에서 인간의 지식을 반영한 해석 가능한 머신러닝 알고리즘인 설명 가능 부스팅 머신 (EBM) 을 활용하여 위성 영상에서 오버슈팅 탑을 식별하는 방법을 제시하고, 복잡한 모델의 정확도는 다소 낮지만 인간과 기계의 협업을 통해 투명하고 신뢰할 수 있는 예보 모델 개발의 가능성을 보여줍니다.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG

pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models

이 논문은 비전 - 언어 모델의 개인화와 일반화 사이의 균형을 달성하기 위해, 로컬 데이터에 맞춰 적응하는 모달리티별 어댑터와 전역적으로 공유되는 프로젝션 레이어를 결합한 새로운 개인화 페더러드 학습 프레임워크인 pFedMMA 를 제안합니다.

Sajjad Ghiasvand, Mahnoosh Alizadeh, Ramtin Pedarsani2026-03-02🤖 cs.LG

Conformal Prediction for Long-Tailed Classification

이 논문은 긴 꼬리 분포를 가진 분류 문제에서 기존 방법의 한계를 극복하고, 예측 집단의 크기와 클래스별 커버리지 간의 균형을 이루는 새로운 컨포멀 예측 기법을 제안하고 실증합니다.

Tiffany Ding, Jean-Baptiste Fermanian, Joseph Salmon2026-03-02📊 stat

Animal behavioral analysis and neural encoding with transformer-based self-supervised pretraining

이 논문은 레이블이 없는 비디오 데이터를 활용하여 다양한 신경 - 행동 분석 과제의 성능을 향상시키는 새로운 자기지도 학습 기반의 BEAST 프레임워크를 제안합니다.

Yanchen Wang, Han Yu, Ari Blau + 5 more2026-03-02🧬 q-bio

Fast Learning of Non-Cooperative Spacecraft 3D Models through Primitive Initialization

이 논문은 단안 이미지와 CNN 기반의 기본 도형 초기화기를 활용하여 정밀한 포즈가 없어도 비협조적 우주선의 3D 모델을 3D 가우스 스플래팅 (3DGS) 으로 빠르게 학습하고 고충실도 3D 표현을 생성하는 방법을 제안합니다.

Pol Francesch Huc, Emily Bates, Simone D'Amico2026-03-02🤖 cs.LG

DA-Occ: Direction-Aware 2D Convolution for Efficient and Geometry-Preserving 3D Occupancy Prediction in Autonomous Driving

이 논문은 자율주행의 3D 점유율 예측을 위해 깊이 기반 리프팅에 높이 점수 프로젝션과 방향 인식 합성곱을 도입하여 정밀한 기하학적 구조를 유지하면서도 높은 추론 속도를 달성한 DA-Occ 프레임워크를 제안합니다.

Yuchen Zhou, Yan Luo, Xiaogang Wang + 3 more2026-03-02💻 cs

← 이전 다음 →

cs.CV