Efficient Long-Horizon GUI Agents via Training-Free KV Cache Compression
O artigo propõe o ST-Lite, um framework de compressão de cache KV sem treinamento que, ao explorar a esparsidade uniforme e as dependências espaço-trajetória específicas de agentes de GUI, alcança uma aceleração de decodificação de 2,45x mantendo o desempenho com apenas 10-20% do orçamento de cache.