Beyond Single-Sample: Reliable Multi-Sample Distillation for Video Understanding

이 논문은 단일 샘플 기반의 불안정한 교사를 대체하여 교사의 샘플링 변이를 명시적으로 모델링하고 질감지향 신호 매칭과 적대적 증류 목표를 통합한 'R-MSD' 프레임워크를 제안함으로써, 4B 규모의 비디오 이해 모델에서 VideoMME, Video-MMMU, MathVerse 등 주요 벤치마크에서 기존 방법보다 우수한 성능을 달성함을 보여줍니다.

Songlin Li, Xin Zhu, Zechao Guan + 2 more2026-03-13💻 cs

A Generalized Theory of Load Distribution in Redundantly-actuated Robotic Systems

이 논문은 다중 독립 폐쇄 운동 사슬로 구성된 중복 구동 로봇 시스템에서 강체에 가해지는 하중 분포를 설명하는 일반화된 이론을 제시하고, 기존 방법론의 한계를 보완하며 선형 시간 복잡도로 계산 가능한 명시적 해법을 도출하여 다중 그리퍼, 보행 로봇, 협력 로봇 등의 힘 제어에 중요한 시사점을 제공합니다.

Joshua Flight, Clément Gosselin2026-03-13💻 cs

NCCLbpf: Verified, Composable Policy Execution for GPU Collective Communication

NCCLbpf 는 NCCL 의 주소 공간 내에서 실행되는 검증되지 않은 네이티브 플러그인의 위험을 해결하기 위해, NCCL 자체를 수정하지 않고도 eBPF 런타임을 내장하여 부하 시 정적 검증을 통한 안전성 보장, 정책의 구성 가능성 및 실시간 업데이트를 가능하게 하며, 8 개 NVIDIA B300 GPU 환경에서 0.03% 미만의 오버헤드로 최대 27% 의 AllReduce 처리량 향상을 입증한 검증된 고성능 확장 프레임워크입니다.

Yusheng Zheng2026-03-13💻 cs

Stay in your Lane: Role Specific Queries with Overlap Suppression Loss for Dense Video Captioning

이 논문은 밀집 비디오 캡셔닝의 다중 작업 간섭과 시간적 중복성을 해결하기 위해 국소화와 캡션 생성을 위한 역할별 쿼리를 분리하고, 의미적 일관성을 위한 대비 정렬, 시간적 중복을 억제하는 새로운 손실 함수, 그리고 개념 수준의 표현을 강화하는 경량 모듈을 제안합니다.

Seung Hyup Baek, Jimin Lee, Hyeongkeun Lee + 1 more2026-03-13💻 cs

Enhancing Lightweight Vision Language Models through Group Competitive Learning for Socially Compliant Navigation

이 논문은 사회적 준수 내비게이션을 위한 경량 비전 언어 모델의 추론 능력을 향상시키기 위해 그룹 경쟁 학습 (GCL) 전략을 제안하며, 이를 통해 소형 모델이 대규모 모델보다 뛰어난 성능을 달성하고 실시간 배포의 효율성과 정확성을 동시에 확보할 수 있음을 입증합니다.

Xinyu Zhang, Atsushi Konno, Toshihiko Yamasaki + 1 more2026-03-13💻 cs

Follow the Saliency: Supervised Saliency for Retrieval-augmented Dense Video Captioning

이 논문은 기존 검색 기반 밀도 비디오 캡셔닝의 한계를 극복하기 위해, DVC 지상 진실 주석을 기반으로 추가 주석 없이 학습된 하이라이트 감지 모듈을 통해 프레임 수준의 중요도 (saliency) 를 지도 학습하고, 이를 검색 및 캡션 생성에 통합하여 시간적 일관성을 높인 STaRC 프레임워크를 제안하며 YouCook2 와 ViTT 벤치마크에서 최첨단 성능을 달성함을 보여줍니다.

Seung hee Choi, MinJu Jeon, Hyunwoo Oh + 2 more2026-03-13💻 cs

SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization

이 논문은 인간 동작 데이터를 로봇의 구조와 역학에 맞춰 보정하는 스키레톤 정렬 기법과 점진적 운동역학 궤적 최적화를 결합하여, 다양한 휴머노이드 로봇에 적용 가능한 자연스럽고 물리적으로 일관된 모션 참조를 생성하는 SPARK 프레임워크를 제안합니다.

Hanwen Wang, Qiayuan Liao, Bike Zhang + 3 more2026-03-13💻 cs

ActiveFreq: Integrating Active Learning and Frequency Domain Analysis for Interactive Segmentation

이 논문은 활성 학습과 주파수 영역 분석을 통합하여 사용자의 개입을 최소화하면서도 의료 이미지 분할의 정확도를 극대화하는 새로운 프레임워크인 ActiveFreq 를 제안하고, 이를 통해 기존 방법 대비 분할 성능과 효율성을 크게 향상시켰음을 ISIC-2017 및 OAI-ZIB 데이터셋 실험을 통해 입증합니다.

Lijun Guo, Qian Zhou, Zidi Shi + 2 more2026-03-13💻 cs

Prediction of Grade, Gender, and Academic Performance of Children and Teenagers from Handwriting Using the Sigma-Lognormal Model

이 논문은 일본 학생들의 손글씨 운동 데이터를 시그마 - 로그정규 모델 등 다양한 특징 추출 기법과 머신러닝 모델을 활용해 분석한 결과, 손글씨 역학이 학년, 성별, 학업 성취도 예측에 유의미한 정보를 담고 있으며 특히 학년 예측에 효과적임을 입증했습니다.

Adrian Iste, Kazuki Nishizawa, Chisa Tanaka + 4 more2026-03-13💻 cs