Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference
Die Arbeit analysiert erstmals die Privatsphärenrisiken des KV-Cache bei LLM-Inferenz, demonstriert durch drei Angriffsvektoren die Rekonstruktion sensibler Eingaben und stellt mit KV-Cloak eine leichte, effiziente Verteidigung vor, die diese Angriffe ohne Genauigkeitsverlust oder nennenswerte Leistungseinbußen abwehrt.