TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas
Het paper introduceert TRUST-SQL, een tool-geïntegreerd multi-turn reinforcement learning-framework dat agents in staat stelt om effectief tekst-naar-SQL-query's te genereren in onbekende schema-omgevingen door middel van een geautomatiseerd vierfasenprotocol en een innovatieve Dual-Track GRPO-strategie, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van bestaande methoden.