Revolutionizing Mixed Precision Quantization: Towards Training-free Automatic Proxy Discovery via Large Language Models

本文提出了一种名为 TAP 的大语言模型驱动的训练免自动代理发现框架,通过结合进化搜索策略与基于直接偏好优化(DPO)的轻量级策略控制器,无需人工专家干预或模型训练即可为混合精度量化自动发现优越的代理,从而在主流基准测试中实现了最先进的性能。

Haidong Kang, Jun Du, Lihong Lin2026-03-06💻 cs

Rolling Sink: Bridging Limited-Horizon Training and Open-Ended Testing in Autoregressive Video Diffusion

该论文针对自回归视频扩散模型在训练时长受限导致长视频生成出现视觉退化问题,提出了一种无需重新训练的"Rolling Sink"方法,通过优化自回归缓存机制,成功实现了在仅基于 5 秒片段训练的基础上,生成长达 30 分钟且保持主体一致、色彩稳定、结构连贯及运动平滑的超长时间视频。

Haodong Li, Shaoteng Liu, Zhe Lin + 1 more2026-03-06💻 cs

Pailitao-VL: Unified Embedding and Reranker for Real-Time Multi-Modal Industrial Search

本文提出了 Pailitao-VL,一种专为高精度实时工业搜索设计的统一多模态检索系统,通过引入基于绝对 ID 识别的嵌入范式及对比校准的列表式重排序策略,有效解决了现有方案在检索粒度、环境噪声鲁棒性及效率性能平衡方面的关键挑战,并在阿里巴巴电商平台上实现了业界领先的性能与显著的业务价值。

Lei Chen, Chen Ju, Xu Chen + 13 more2026-03-06💻 cs