MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

该论文提出了名为 MUTEX 的框架,通过结合 XLM-RoBERTa 与条件随机场(CRF)层,利用首个手动标注的乌尔都语词级毒性片段数据集,成功实现了在社交媒体等多源数据上具有 60% F1 分数的细粒度毒性检测,有效解决了乌尔都语代码切换和形态变化带来的挑战。

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

该论文提出了一种针对推测解码中草稿模型的字表剪枝方法,通过将字表选择建模为在最小覆盖率约束下平衡覆盖率与架构感知延迟的约束优化问题,利用树状贝叶斯优化高效探索帕累托前沿,从而在显著减小字表规模(最高达 97%)的同时提升了特定领域及通用任务的推理吞吐量并降低了延迟。

Ofir Ben Shoham2026-03-06🤖 cs.AI