SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications
O SwiftEmbed é um sistema de inferência em Rust que utiliza a busca estática de tokens para oferecer embeddings de texto ultra-rápidos com latência de 1,12 ms e 50.000 requisições por segundo, sendo ideal para aplicações em tempo real que priorizam a velocidade em detrimento da precisão em tarefas complexas de classificação.