cs.DB articoli | Gist.Science

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

Il paper propone R4-CGQA, un framework basato sul recupero di informazioni che potenzia i modelli Vision Language Model per la valutazione della qualità delle immagini di computer grafica, affrontando la carenza di dataset descrittivi e migliorando la capacità di fornire spiegazioni testuali accurate attraverso l'analisi di sei dimensioni percettive chiave.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi LinThu, 12 Ma💻 cs

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Il paper presenta un nuovo framework per agenti basati su LLM che estrae automaticamente lezioni dalle traiettorie di esecuzione e le utilizza come memoria contestuale per migliorare le prestazioni future, ottenendo significativi aumenti nel completamento di compiti complessi.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

Il paper presenta ExBI, un sistema innovativo basato su un modello di ipergrafi che supera i limiti dei sistemi di Business Intelligence tradizionali consentendo l'evoluzione dinamica dello schema e il riutilizzo delle viste, ottenendo accelerazioni significative (fino a 230 volte) rispetto a database esistenti come Neo4j e MySQL mantenendo un'accuratezza analitica elevata.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Il paper presenta EvoSchema, un benchmark completo che introduce una nuova tassonomia di evoluzione degli schemi per valutare e migliorare la robustezza dei modelli Text-to-SQL contro i cambiamenti reali dei database, rivelando che le perturbazioni a livello di tabella hanno un impatto maggiore rispetto a quelle a livello di colonna e dimostrando che l'addestramento su schemi perturbati genera sistemi più resilienti.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao LiThu, 12 Ma💬 cs.CL

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

Il paper presenta Pneuma-Seeker, un sistema basato sulla reificazione relazionale che allinea gli agenti AI al lavoro umano su dati relazionali trasformando le esigenze informative in schemi concreti e iterativamente raffinati, superando le limitazioni dei modelli linguistici tradizionali e garantendo maggiore accuratezza, trasparenza e fiducia.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Questo articolo presenta un nuovo framework basato su ipercubi di dati compressi ad albero all'interno del sistema Polytope, progettato per superare i limiti dei modelli tradizionali e abilitare un'estrazione efficiente e flessibile delle caratteristiche da dataset di scienze della Terra irregolari e complessi.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin SchultzThu, 12 Ma💻 cs

Poisson Sampling over Acyclic Joins

Il paper introduce un algoritmo quasi instance-ottimale per il campionamento di Poisson su join aciclici, basato su un indice ad accesso casuale che evita la materializzazione del risultato e che, nelle sperimentazioni, supera le prestazioni degli approcci tradizionali sia per il campionamento che per l'elaborazione classica dei join.

Liese Bekkers, Frank Neven, Lorrens Pantelis, Stijn VansummerenThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Il paper propone HCT-QA, un nuovo benchmark completo per la risposta alle domande su tabelle complesse e orientate all'uomo (HCT), che include migliaia di esempi reali e sintetici per valutare e migliorare le prestazioni di modelli linguistici e visivi.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Il paper introduce KramaBench, un benchmark composto da 104 sfide curate manualmente per valutare le capacità end-to-end dei sistemi di intelligenza artificiale nell'orchestrare pipeline complesse per l'estrazione di insight da data lake, rivelando che le attuali soluzioni agentiche faticano a produrre flussi di lavoro funzionanti nonostante la loro efficacia in singoli compiti isolati.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Questo articolo introduce nuove metriche per valutare l'efficacia degli agenti LLM nel generare SQL su grandi dataset ("Text-to-Big SQL"), dimostrando che le metriche tradizionali sono insufficienti per catturare costi, latenza e impatti legati alla scalabilità nei flussi di lavoro reali.

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

Il sistema SLER rivoluziona la scoperta di regole di riscrittura delle query combinando l'enumerazione di modelli standardizzati con un approccio di apprendimento per il ranking, permettendo di generare in modo scalabile un archivio di oltre un milione di regole per l'ottimizzazione delle prestazioni dei database.

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

Questo articolo propone un framework formale, un'architettura e algoritmi per la costruzione e la manutenzione incrementale di una vista RDF materializzata (RDB2RDF) che consente di integrare e rendere accessibili le fonti dati relazionali legacy all'interno di un Knowledge Graph aziendale.

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

Towards Neural Graph Data Management

Il paper introduce NGDBench, un benchmark unificato che valuta le capacità dei modelli neurali nella gestione di dati grafici strutturati supportando l'intero linguaggio di query Cypher, rivelando significative limitazioni negli attuali LLM e metodi RAG nel ragionamento strutturato e nella robustezza al rumore.

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu SongMon, 09 Ma🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Questo articolo esamina come i rapidi progressi dell'IA, in particolare i modelli fondazionali, stiano ridefinendo le interazioni uomo-dati e l'analisi visiva, evidenziando le nuove sfide legate all'incertezza e alla scalabilità e proponendo un approccio centrato sull'umano che integri principi cognitivi e percettivi per superare i limiti dei paradigmi esistenti.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun YuMon, 09 Ma🤖 cs.AI

Space-efficient B-tree Implementation for Memory-Constrained Flash Embedded Devices

Questo lavoro presenta e valuta sperimentalmente varianti di B-tree ottimizzate per dispositivi embedded con vincoli di memoria, dimostrando che l'implementazione di ottimizzazioni specifiche per l'archiviazione flash consente un'indicizzazione efficiente anche su dispositivi di piccole dimensioni per applicazioni IoT.

Nadir Ould-Khessal, Scott Fazackerley, Ramon LawrenceMon, 09 Ma💻 cs

Querying with Conflicts of Interest

Questo lavoro propone un nuovo framework formale e algoritmi efficienti per rilevare, analizzare e riformulare query in contesti dove le fonti di dati forniscono risposte parziali a causa di conflitti di interesse con gli utenti, dimostrando sperimentalmente la possibilità di estrarre informazioni rilevanti da grandi dataset.

Nischal Aryal, Arash Termehchy, Marianne WinslettMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Il paper presenta OMEGA, un metodo di ricerca appresa top-K generalizzabile a diverse dimensioni K che, addestrato principalmente su K=1 con caratteristiche basate su traiettorie e un procedimento di raffinamento dinamico, supera i metodi esistenti offrendo minore latenza e costi di pre-elaborazione ridotti senza compromettere l'accuratezza.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

Tag-specific Regret Minimization Problem in Outdoor Advertising

Questo articolo presenta il problema di ottimizzazione combinatoria TRMOA per la minimizzazione del rimorso nella pubblicità outdoor, dimostrando la sua intrattabilità e proponendo algoritmi greedy e di ricerca locale validati su dati reali per allocare in modo efficiente gli spazi pubblicitari.

Dildar Ali, Abishek Salaria, Ansh Jasrotia, Suman BanerjeeMon, 09 Ma💻 cs

Numerical benchmark for damage identification in Structural Health Monitoring

Questo articolo presenta un dataset numerico open-source e il relativo framework concettuale per la validazione di strategie di monitoraggio della salute strutturale, simulando misurazioni dinamiche e statiche su una trave d'acciaio che includono variabilità ambientali, danni, rumore e guasti dei sensori.

Francesca Marafini, Giacomo Zini, Alberto Barontini, Nuno Mendes, Alice Cicirello, Michele Betti, Gianni BartoliFri, 13 Ma⚡ eess

The Case for Cardinality Lower Bounds

Il paper introduce xBound, il primo framework teorico per il calcolo di limiti inferiori provabili sulla cardinalità delle join, che risolve il critico problema della sottostima nelle stime degli ottimizzatori di database, garantendo significativi miglioramenti delle prestazioni in ambienti di produzione come Microsoft Fabric Data Warehouse.

Mihail Stoian, Tiemo Bang, Hangdong Zhao + 3 more2026-03-06🔢 math

← Precedente Successivo →