Spectrum Shortage for Radio Sensing? Leveraging Ambient 5G Signals for Human Activity Detection

이 논문은 기존 5G 통신 신호를 재사용하여 주파수 부족 문제를 해결하고, 새로운 하드웨어 아키텍처와 크로스 모달 학습 프레임워크를 통해 인간 활동 인식 및 골격 추정 등 정밀한 라디오 센싱을 가능하게 하는 '환경 라디오 센싱 (Ambient Radio Sensing, ARS)' 시스템을 제안하고 실험을 통해 검증했습니다.

Kunzhe Song, Maxime Zingraff, Huacheng Zeng2026-03-05💻 cs

Detection and Identification of Penguins Using Appearance and Motion Features

이 논문은 균일한 외형과 빠른 자세 변화, 환경적 노이즈로 인해 어려운 펭귄 감시 문제를 해결하기 위해 YOLO11 에 시간적 일관성을 부여한 2 프레임 기반 감지 모델과 트랙릿 기반 대비 학습을 결합한 프레임워크를 제안하여 펭귄의 탐지 및 식별 성능을 향상시켰습니다.

Kasumi Seko, Hiroki Kinoshita, Raj Rajeshwar Malinda + 1 more2026-03-05💻 cs

Parallax to Align Them All: An OmniParallax Attention Mechanism for Distributed Multi-View Image Compression

이 논문은 인코더 측에서 뷰 간 정보가 필요 없는 분산 다중 뷰 이미지 압축 (DMIC) 의 성능 한계를 극복하기 위해 제안된 'OmniParallax Attention Mechanism'과 'ParaHydra' 프레임워크를 통해, 기존 최첨단 다중 뷰 압축 코덱보다 압축 효율과 처리 속도를 획기적으로 개선한 최초의 DMIC 방법을 제시합니다.

Haotian Zhang, Feiyue Long, Yixin Yu + 7 more2026-03-05💻 cs

LeafInst - Unified Instance Segmentation Network for Fine-Grained Forestry Leaf Phenotype Analysis: A New UAV based Benchmark

이 논문은 야외 환경의 수목 잎에 대한 정밀한 인스턴스 분할을 위해 UAV 기반의 'Poplar-leaf' 데이터셋을 구축하고, 다중 스케일 및 불규칙한 형태를 효과적으로 처리하는 새로운 'LeafInst' 네트워크를 제안하여 기존 모델보다 우수한 성능을 입증합니다.

Taige Luo, Junru Xie, Chenyang Fan + 5 more2026-03-05💻 cs

RAGTrack: Language-aware RGBT Tracking with Retrieval-Augmented Generation

이 논문은 MLLM 을 활용한 텍스트 주석 생성 파이프라인을 도입하고, 다중 모달 트랜스포머 인코더, 적응형 토큰 융합, 그리고 검색 증강 생성 (RAG) 기반의 맥락 인식 추론 모듈을 포함하는 새로운 RAGTrack 프레임워크를 제안하여 기존 RGBT 추적기의 한계를 극복하고 다양한 환경에서 최첨단 성능을 달성함을 보여줍니다.

Hao Li, Yuhao Wang, Wenning Hao + 3 more2026-03-05💻 cs

Image-based Prompt Injection: Hijacking Multimodal LLMs through Visually Embedded Adversarial Instructions

이 논문은 자연스러운 이미지 내에 인간의 눈에는 보이지 않지만 다중 모달 LLM 의 행동을 조작할 수 있는 적대적 지시문을 숨기는 '이미지 기반 프롬프트 인젝션 (IPI)' 공격 기법을 제안하고, 이를 통해 블랙박스 환경에서 최대 64% 의 공격 성공률을 달성할 수 있음을 보여줍니다.

Neha Nagaraja, Lan Zhang, Zhilong Wang + 2 more2026-03-05🤖 cs.AI

EvoPrune: Early-Stage Visual Token Pruning for Efficient MLLMs

이 논문은 고해상도 이미지 및 비디오와 같은 복잡한 시나리오에서 MLLM 의 추론 효율성을 제한하는 시각 토큰의 기하급수적 증가 문제를 해결하기 위해, 시각 인코딩 단계 자체에서 토큰 유사성, 다양성 및 어텐션 기반 중요도를 활용하여 정보성이 높은 토큰만 선별하는 초기 단계 시각 토큰 가지치기 방법인 EvoPrune 을 제안하고, 이를 통해 VideoMME 데이터셋에서 2 배의 추론 속도 향상과 1% 미만의 성능 저하를 달성했음을 입증합니다.

Yuhao Chen, Bin Shan, Xin Ye + 1 more2026-03-05🤖 cs.AI