Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

Le papier présente Pneuma-Seeker, un système qui aligne les agents d'IA sur les besoins humains en matière de données relationnelles en représentant l'intention de l'utilisateur sous forme de schéma relationnel évolutif et en l'affinant itérativement pour générer des réponses précises et inspectables, surpassant ainsi les approches basées sur les LLM traditionnels.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

Ce papier présente HCT-QA, un nouveau benchmark complet pour l'évaluation des modèles de question-réponse sur des tableaux centrés sur l'humain (HCT) aux structures complexes, incluant un vaste ensemble de données réelles et synthétiques ainsi que des résultats d'expérimentation démontrant l'efficacité du fine-tuning.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Ce papier présente KramaBench, un benchmark composé de 104 défis réels sur des lacs de données, qui révèle que les systèmes d'IA actuels, bien que capables de générer des pipelines plausibles, échouent encore majoritairement à produire des pipelines de bout en bout fonctionnels, n'atteignant qu'une précision de 55 % dans ce contexte complexe.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

Le système SLER présente une approche évolutive pour la découverte de règles de réécriture de requêtes en combinant l'énumération de modèles standardisés et un apprentissage par classement, permettant de générer une bibliothèque de plus d'un million de règles et de gérer des plans de requêtes complexes jusqu'à une profondeur de niveau canal.

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

Cet article propose un cadre formel, ainsi qu'une architecture et des algorithmes, pour construire et maintenir de manière incrémentale une vue RDB2RDF matérialisée, permettant ainsi d'intégrer et d'accéder sémantiquement aux sources de données relationnelles héritées au sein des graphes de connaissances d'entreprise.

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Cet article examine comment l'avancement rapide de l'IA, notamment les modèles de fondation, transforme l'interaction humain-données en introduisant de nouveaux défis liés à l'incertitude et à l'échelle, et propose de redéfinir les paradigmes d'interaction en intégrant des principes cognitifs et perceptuels pour bâtir des systèmes d'analyse de données centrés sur l'humain.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun YuMon, 09 Ma🤖 cs.AI

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Le papier présente OMEGA, une méthode de recherche apprise généralisable à n'importe quel K qui, en s'entraînant uniquement sur K=1 et en utilisant un raffinement dynamique, surpasse les méthodes existantes en termes de latence et de temps de prétraitement tout en maintenant une haute précision pour des requêtes multi-K.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

Numerical benchmark for damage identification in Structural Health Monitoring

Cet article présente un jeu de données numérique open source et reproductible pour le suivi de l'intégrité structurelle, générant des mesures dynamiques et statiques simulées sur une poutre en acier afin d'inclure des variations environnementales, des dommages et des bruits, offrant ainsi une ressource précieuse pour valider de nouvelles stratégies de détection de dommages.

Francesca Marafini, Giacomo Zini, Alberto Barontini, Nuno Mendes, Alice Cicirello, Michele Betti, Gianni BartoliFri, 13 Ma⚡ eess