CurveStream: Boosting Streaming Video Understanding in MLLMs via Curvature-Aware Hierarchical Visual Memory Management
Das Paper stellt CurveStream vor, ein training-freies Framework, das durch curvature-basierte, hierarchische Speicherverwaltung die Streaming-Video-Verständnisfähigkeiten von Multimodalen Large Language Models ohne Out-of-Memory-Probleme signifikant verbessert und neue State-of-the-Art-Ergebnisse erzielt.