MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

该论文提出了面向移动胎儿超声分析的“选择性排斥知识蒸馏”方法,通过解构对比蒸馏并引入排斥机制,成功训练出仅 1140 万参数的轻量级模型,其在零-shot 生物测量有效性和脑切面分类性能上均超越了 3 亿参数的教师模型,并能在 iPhone 16 Pro 上实现 1.6 毫秒的实时推理。

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

SAIL: Similarity-Aware Guidance and Inter-Caption Augmentation-based Learning for Weakly-Supervised Dense Video Captioning

本文提出了 SAIL 框架,通过跨模态对齐构建语义感知掩码以优化弱监督稠密视频描述中的事件定位,并引入基于大语言模型的跨掩码增强策略生成合成 caption 以缓解标注稀疏问题,从而在 ActivityNet Captions 和 YouCook2 数据集上实现了最先进的性能。

Ye-Chan Kim, SeungJu Cha, Si-Woo Kim + 3 more2026-03-06🤖 cs.AI