CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

本文提出了 CacheSolidarity 系统,通过动态监控并选择性隔离可疑的跨租户前缀缓存共享,在有效防御大语言模型多租户服务中自动前缀缓存(APC)引发的时序侧信道攻击的同时,避免了现有防御方案因完全隔离用户而导致的性能损失,实现了高达 70% 的缓存复用率提升和 30% 的推理延迟降低。

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

该论文通过对比蒙特卡洛 Dropout 与共形预测两种方法在 Fashion-MNIST 数据集上的表现,指出尽管 H-CNN VGG16 精度更高但存在过度自信问题,而 GoogLeNet 校准性更优且共形预测能提供统计保证的预测集,从而强调了在深度学习系统中超越准确率、重视可靠性与不确定性评估的重要性。

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

该论文提出了一种名为 Sign-Prioritized FL (SP-FL) 的新型无线联邦学习框架,通过优先传输梯度符号并基于数据包与设备层面的重要性差异进行分层资源分配,有效解决了无线资源受限下的通信不可靠问题,显著提升了模型训练精度。

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

针对数据稀缺的 NPU 内核合成领域,本文提出了名为 EvoKernel 的自进化智能体框架,通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程,显著提升了大模型在特定硬件生态中的代码正确率与执行效率。

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG