XStreamVGGT: Extremely Memory-Efficient Streaming Vision Geometry Grounded Transformer with KV Cache Compression
XStreamVGGT ist ein tuning-freier Ansatz, der durch eine Kombination aus effizientem Pruning und dimensionsadaptiver Quantisierung den KV-Cache komprimiert, um die Speichereffizienz und Inferenzgeschwindigkeit von StreamVGGT für skalierbare Streaming-3D-Anwendungen drastisch zu verbessern, ohne dabei die Leistung signifikant zu beeinträchtigen.