Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

Il paper presenta GFM-Retriever, un nuovo approccio che utilizza modelli grafici fondazionali pre-addestrati e un selettore di sottografi basato sul principio del collo di bottiglia dell'informazione per recuperare in modo efficiente e cross-dominio sottografi minimi e sufficienti, migliorando così il ragionamento e la generazione di risposte nel GraphRAG.

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin LiTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Il paper presenta Dial, un sistema NL2SQL basato sulla conoscenza che supera le limitazioni dei metodi esistenti nel gestire diversi dialetti SQL attraverso una pianificazione logica consapevole del dialetto, una base di conoscenza gerarchica e un ciclo di verifica semantica, dimostrando miglioramenti significativi nell'accuratezza e nella copertura delle funzionalità su un nuovo benchmark multi-database.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

Il paper introduce SeDa, un sistema unificato che aggrega oltre 7,6 milioni di dataset da più di 200 piattaforme per abilitare la scoperta, l'annotazione semantica e la navigazione contestuale basata su entità, superando i limiti delle attuali soluzioni di ricerca in termini di copertura, tempestività e tracciabilità.

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng FanTue, 10 Ma💻 cs

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

Il paper presenta GP-Tree, un indice spaziale in memoria che combina celle di griglia adattive con una struttura ad albero di prefissi per superare i limiti delle approssimazioni tradizionali, offrendo una precisione di filtraggio superiore e prestazioni di query fino a un ordine di grandezza migliori rispetto agli indici spaziali esistenti.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

Il paper presenta SynPlanResearch-R1, un framework che migliora le prestazioni degli agenti di ricerca web sintetizzando traiettorie di utilizzo degli strumenti che incoraggiano un'esplorazione più profonda durante il fine-tuning supervisionato, ottenendo risultati superiori rispetto alle tecniche attuali su diversi benchmark.

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo ShangTue, 10 Ma💬 cs.CL

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

Il paper introduce UIS-Digger, un nuovo framework multi-agente e il benchmark UIS-QA per affrontare la sfida della ricerca di informazioni non indicizzate, dimostrando che un approccio proattivo di navigazione e analisi dei file può superare le prestazioni di modelli LLM più grandi su questo compito specifico.

Chang Liu, Chuqiao Kuang, Tianyi Zhuang, Yuxin Cheng, Huichi Zhou, Xiaoguang Li, Lifeng ShangTue, 10 Ma💻 cs

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Il paper introduce SPD-RAG, un framework gerarchico multi-agente che migliora la qualità e la scalabilità della risposta a domande complesse su documenti multipli delegando l'elaborazione a agenti dedicati per documento e sintetizzando i risultati tramite un coordinatore, ottenendo prestazioni superiori rispetto ai metodi RAG tradizionali con costi API ridotti.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda AkpinarTue, 10 Ma💬 cs.CL