TigerVector: Supporting Vector Search in Graph Databases for Advanced RAGs

Il paper presenta TigerVector, un sistema integrato nel database nativo MPP TigerGraph che unisce ricerca vettoriale e query su grafi per abilitare RAG avanzati, offrendo prestazioni superiori rispetto ad altre soluzioni specializzate.

Shige Liu, Zhifang Zeng, Li Chen, Adil Ainihaer, Arun Ramasami, Songting Chen, Yu Xu, Mingxi Wu, Jianguo Wang

Pubblicato 2026-03-05
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Ecco una spiegazione del paper su TigerVector, raccontata come se fosse una storia, usando metafore semplici e quotidiane.

🦁 La Storia di TigerVector: Il Super-Eroe che unisce Memoria e Relazioni

Immagina di avere due tipi di biblioteche diverse nel tuo cervello:

  1. La Biblioteca delle Relazioni (Grafico): Qui sai che "Mario" è amico di "Luigi", che "Luigi" ha comprato una "Pizza" e che la "Pizza" è stata mangiata a "Roma". Sai chi è con chi e dove.
  2. La Biblioteca dei Significati (Vettori): Qui non ci sono nomi, ma "sensazioni". Sai che la parola "cane" suona simile a "cucciolotto" e che "auto" è vicina a "macchina", anche se le parole sono diverse. Questa biblioteca è ottima per trovare cose che sembrano simili, anche se non sono identiche.

Il Problema:
Fino a poco tempo fa, se volevi fare una domanda complessa a un'intelligenza artificiale (come un Chatbot), dovevi usare due biblioteche separate.

  • Se chiedevi "Chi ha scritto recensioni positive su questo ristorante?", dovevi consultare la biblioteca delle relazioni.
  • Se chiedevi "Cerca recensioni che parlano di 'cibo delizioso'", dovevi consultare la biblioteca dei significati.

Il problema è che tenere due biblioteche separate è lento, costoso e crea confusione. È come se dovessi correre da un edificio all'altro ogni volta che vuoi un'informazione. Inoltre, spesso le due biblioteche non si parlano bene: la biblioteca dei significati non capisce che "Mario" è l'autore della recensione, e quella delle relazioni non capisce che "delizioso" è simile a "buonissimo".

La Soluzione: TigerVector
Gli autori di questo paper hanno creato TigerVector, un sistema che fonde queste due biblioteche in un unico edificio magico. Immagina di costruire un unico palazzo enorme dove ogni stanza (un "nodo" del grafico) ha due cassetti:

  1. Un cassetto per i dati normali (nome, età, indirizzo).
  2. Un cassetto speciale per i "significati" (le rappresentazioni matematiche del testo o delle immagini).

🛠️ Come funziona? (Le Metafore)

Ecco i trucchi principali che TigerVector usa per essere così veloce:

1. Il Cassetto Separato (Storage Decoupled)

Immagina che i dati normali siano libri di carta leggeri, mentre i "significati" (i vettori) siano pesanti blocchi di marmo. Se li metti tutti insieme nello stesso scaffale, lo scaffale si piega e diventa lento da cercare.
TigerVector dice: "Ok, teniamo i libri leggeri sugli scaffali normali, ma per i blocchi di marmo (i vettori), costruiamo un magazzino speciale accanto, collegato direttamente alla stanza."
In questo modo, quando cerchi un significato, non devi spostare i libri pesanti; vai direttamente nel magazzino specializzato. Questo rende la ricerca velocissima.

2. La Squadra di Pompieri (MPP - Massively Parallel Processing)

Quando devi cercare un libro in una biblioteca gigante, un solo bibliotecario ci metterebbe ore. TigerVector usa una squadra di centinaia di pompieri (processori) che lavorano tutti insieme.
Invece di cercare in tutto il palazzo, dividono il palazzo in piccoli pezzi. Ogni pompiere controlla il suo pezzo in parallelo. Se cerchi "cane", 100 pompieri cercano contemporaneamente in 100 stanze diverse e si riuniscono subito con i risultati. È come avere 100 persone che leggono 100 pagine diverse dello stesso libro allo stesso tempo.

3. Il Linguaggio Unico (GSQL)

Prima, per usare le due biblioteche, dovevi parlare due lingue diverse (una per i grafici, una per i vettori). Con TigerVector, tutto si fa con una sola lingua, chiamata GSQL.
È come se potessi dire al bibliotecario: "Dammi tutti i libri scritti da Mario (grafico) che parlano di 'avventura' (significato), e poi dimmi chi sono i suoi amici che hanno letto la stessa cosa."
Il sistema capisce tutto in un colpo solo, senza farti correre avanti e indietro.

4. Aggiornamenti in Tempo Reale (Aggiornamenti Atomici)

Se cambi un dato (es. Mario cambia il suo nome), il sistema aggiorna tutto istantaneamente e in modo sicuro. Non succede che tu veda il nome vecchio mentre il vettore è già nuovo. È come se aggiornassi il tuo profilo social: il nome e la foto cambiano nello stesso millisecondo, per tutti.

🏆 I Risultati: Chi vince la gara?

Gli autori hanno fatto delle gare (esperimenti) contro i migliori concorrenti:

  • Contro Neo4j e Amazon Neptune: Questi sono come biblioteche tradizionali che hanno aggiunto un piccolo reparto "significati" in fretta e furia. TigerVector è stato molto più veloce (fino a 5 volte più veloce) e ha trovato risultati più precisi.
  • Contro Milvus: Milvus è una biblioteca specializzata solo nei significati, molto veloce ma che non capisce le relazioni. Sorprendentemente, TigerVector è stato quasi veloce quanto Milvus, pur facendo anche il lavoro di capire le relazioni!

💡 Perché è importante per il futuro? (RAG Avanzato)

Oggi usiamo l'Intelligenza Artificiale (come ChatGPT) per rispondere alle domande. Per farlo bene, l'AI deve "guardare" i tuoi dati.

  • Se usi solo la ricerca per significato, l'AI potrebbe confondersi.
  • Se usi TigerVector, l'AI può dire: "Ho trovato questo documento che parla di 'pandemia' (ricerca per significato), e so che è stato scritto dal Dottor Rossi (ricerca per relazione), che a sua volta ha lavorato con l'Organizzazione Mondiale della Sanità."

Questo permette di creare risposte molto più intelligenti, precise e utili, riducendo gli errori e i costi.

In sintesi

TigerVector è come un super-architetto che ha ristrutturato una vecchia biblioteca trasformandola in un moderno centro polifunzionale. Non devi più correre tra edifici diversi per trovare informazioni. Tutto è lì, ordinato, veloce e collegato. Che tu stia cercando un amico, un libro o un concetto astratto, TigerVector lo trova per te in un batter d'occhio.