Stateful Token Reduction for Long-Video Hybrid VLMs

이 논문은 하이브리드 아키텍처 (어텐션과 Mamba 블록이 혼합된 구조) 를 가진 장시간 비디오 VLM 에서 레이어별 토큰 중요도 변화에 대응하기 위해, 점진적 토큰 축소 스케줄과 언어 인식 점수 메커니즘을 제안하여 압축률 25% 에서도 기존 성능을 유지하면서 전처리 속도를 3.8~4.2 배 향상시키는 방법을 제시합니다.

Jindong Jiang, Amala Sanjay Deshmukh, Kateryna Chumachenko + 7 more2026-03-03🤖 cs.AI

VisRef: Visual Refocusing while Thinking Improves Test-Time Scaling in Multi-Modal Large Reasoning Models

이 논문은 시각적 토큰의 주의력 상실을 방지하고 추론을 시각적 맥락에 효과적으로 고정시키기 위해 의미적으로 관련성 있으면서도 다양한 시각적 토큰 코어셋을 재주입하는 'VisRef' 프레임워크를 제안하여, 추가적인 강화학습 미세조정 없이도 멀티모달 대형 추론 모델의 테스트 시간 확장 성능을 획기적으로 향상시킵니다.

Soumya Suvra Ghosal, Youngeun Kim, Zhuowei Li + 6 more2026-03-03🤖 cs.AI

Physical Evaluation of Naturalistic Adversarial Patches for Camera-Based Traffic-Sign Detection

이 논문은 자율주행 차량 환경에 맞춘 CompGTSRB 데이터셋을 활용하여 생성된 자연주의적 적대적 패치 (NAPs) 가 물리적 환경에서 교통 표지판 탐지기의 STOP 클래스 신뢰도를 얼마나 효과적으로 저하시키는지 Quanser QCar 테스트베드를 통해 실험적으로 평가하고, 이를 통해 신뢰할 수 있는 물리적 평가 프로토콜의 유용성과 임베디드 인지 파이프라인에 대한 방어 연구의 필요성을 제시합니다.

Brianna D'Urso, Tahmid Hasan Sakib, Syed Rafay Hasan + 1 more2026-03-03🤖 cs.AI

Pretty Good Measurement for Radiomics: A Quantum-Inspired Multi-Class Classifier for Lung Cancer Subtyping and Prostate Cancer Risk Stratification

이 논문은 양자 상태 판별에 기반한 'Pretty Good Measurement (PGM)'을 다중 클래스 분류기로 재해석하여 폐암 아형 분류 및 전립선암 위험도 stratification 과 같은 방사선학 (radiomics) 사례에 적용한 결과, 기존 고전적 방법과 경쟁력 있거나 더 우수한 성능을 보임을 입증했습니다.

Giuseppe Sergioli, Carlo Cuccu, Giovanni Pasini + 4 more2026-03-03⚛️ quant-ph

Seeking Necessary and Sufficient Information from Multimodal Medical Data

이 논문은 의료 영상 및 기타 데이터 소스로부터 결과 발생에 필수적이고 충분하며 모달리티가 누락되더라도 견고한 예측을 가능하게 하는 특징을 학습하기 위해, 확률적 필요성과 충분성 (PNS) 을 모달리티 불변 및 모달리티 특정 구성 요소로 분해하여 확장한 새로운 다중 모달 학습 방법을 제안하고 그 유효성을 검증합니다.

Boyu Chen, Weiye Bao, Junjie Liu + 5 more2026-03-03💻 cs

Deep Learning-Based Meat Freshness Detection with Segmentation and OOD-Aware Classification

본 논문은 U-Net 기반 분할을 통해 배경을 제거하고 효율적인 특징 추출을 수행하며, OOD 인식 거부 메커니즘을 통해 신뢰도가 낮은 샘플을 식별하는 동시에 모바일 환경에서의 실시간 배포 가능성을 검증한 고도화된 육류 신선도 분류 프레임워크를 제안합니다.

Hutama Arif Bramantyo, Mukarram Ali Faridi, Rui Chen + 2 more2026-03-03⚡ eess

Unsupervised Semantic Segmentation in Synchrotron Computed Tomography with Self-Correcting Pseudo Labels

이 논문은 수동 라벨링 없이 동기방사선 CT 데이터를 자동으로 분할하기 위해 클러스터링 기반의 가짜 라벨을 생성하고 'Unbiased Teacher' 기법으로 이를 자기 수정하는 새로운 프레임워크를 제안하며, 이를 통해 기존 가짜 라벨 대비 픽셀 정확도와 평균 교집합 합집합 비율 (mIoU) 을 각각 13.31% 와 15.94% 향상시켰음을 보여줍니다.

Austin Yunker, Peter Kenesei, Hemant Sharma + 3 more2026-03-03💻 cs

PointAlign: Feature-Level Alignment Regularization for 3D Vision-Language Models

3D-비전 언어 모델의 학습에서 발생하는 기하학적 정보 손실 문제를 해결하기 위해, 중간 점구름 토큰과 시각 입력 토큰 간의 일관성 손실을 통해 미세한 3D 기하 - 의미 정보를 보존하는 새로운 특징 수준 정렬 정규화 방법인 PointAlign 을 제안하고, 이를 통해 분류 및 캡셔닝 성능을 크게 향상시켰습니다.

Yuanhao Su, Shaofeng Zhang, Xiaosong Jia + 1 more2026-03-03💻 cs