VSearcher: Long-Horizon Multimodal Search Agent via Reinforcement Learning
Il paper presenta VSearcher, un agente di ricerca multimodale addestrato tramite apprendimento per rinforzo che trasforma modelli statici in sistemi capaci di eseguire ricerche complesse e multi-turno sul web, integrando testo, immagini e navigazione, e che supera le prestazioni di modelli proprietari su benchmark dedicati.