Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Este artigo apresenta o \texttt{EinSum}, uma notação de soma de Einstein adaptada para computação tensorial-relacional que permite a reescrita automática de cálculos para executar componentes intensivos em kernels numéricos eficientes enquanto gerencia a esparsidade por meio de sistemas relacionais.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

O artigo apresenta o DataFactory, um framework colaborativo multi-agente que supera as limitações de modelos de linguagem únicos na Resposta a Perguntas sobre Tabelas (TableQA) através da orquestração especializada de agentes, transformação automática de dados em grafos de conhecimento e estratégias de engenharia de contexto, resultando em ganhos significativos de precisão e robustez em benchmarks padrão.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Este artigo avalia a eficácia prática do ajuste de índices impulsionado por modelos de linguagem de grande escala (LLM) em comparação com o Database Tuning Advisor (DTA) da Microsoft, concluindo que, embora os LLMs apresentem alta variabilidade e desafios de integração, eles têm o potencial de identificar configurações superiores e oferecer insights valiosos como uma técnica complementar.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

GeoBenchr: An Application-Centric Benchmarking Suite for Spatiotemporal Database Platforms

O artigo apresenta o GeoBenchr, uma suíte de benchmarking de código aberto e centrada em aplicações para plataformas de dados espaço-temporais, projetada para avaliar de forma abrangente o desempenho, a escalabilidade e a configuração de sistemas em cenários do mundo real, como rastreamento de ciclistas, aviação e marítimo.

Tim C. Rese, Nils Japke, Diana Baumann, Natalie Carl, David BermbachWed, 11 Ma💻 cs

Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

Este trabalho apresenta um Agente Gerativo Neuro-Simbólico que supera as limitações de alucinações físicas em modelos de linguagem ao atuar como supervisor cognitivo capaz de validar, podar e completar autonomamente mecanismos físicos, como demonstrado na correção de previsões de falha catastrófica em arenito de baixa permeabilidade ao identificar corretamente o regime drenado e o mecanismo de dissipação faltante.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong HuangWed, 11 Ma💻 cs

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

O artigo apresenta o MMTU, um benchmark em larga escala com mais de 28 mil questões em 25 tarefas do mundo real, projetado para avaliar de forma abrangente a capacidade de modelos de linguagem de entender, raciocinar e manipular tabelas em nível especializado, revelando que mesmo os modelos mais avançados atuais enfrentam desafios significativos nessa área.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. JagadishTue, 10 Ma🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

Este trabalho apresenta o TableEG, um framework que utiliza modelos de linguagem grandes (LLMs) ajustados para gerar erros sintéticos autênticos em tabelas, preenchendo a lacuna entre dados reais e sintéticos e estabelecendo um benchmark robusto para a avaliação de técnicas de detecção e correção de erros.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin TongTue, 10 Ma🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

O artigo apresenta o SDFed, um framework de aprendizado federado heterogêneo para modelos de visão e linguagem que supera as limitações de métodos existentes ao permitir prompts locais de comprimento variável e empregar refinamento de subespaço e controle de divergência para alinhar efetivamente os conhecimentos locais e globais em ambientes com dados e recursos desiguais.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi YinTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Este artigo apresenta o PAG (Projection-Augmented Graph), um novo framework de busca aproximada de vizinhos mais próximos que integra técnicas de projeção a índices gráficos para atender a seis demandas críticas de aplicações de IA moderna, oferecendo desempenho de consulta significativamente superior ao HNSW, indexação rápida, baixo uso de memória e robustez em alta dimensionalidade.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

Este artigo apresenta um estudo abrangente que demonstra que a esparsificação de grafos pode ser uma etapa de pré-processamento leve e prática para acelerar significativamente o treinamento e a inferência de Redes Neurais em Grafos (GNNs) em escala, mantendo ou até mesmo melhorando a precisão nas tarefas de classificação de nós.

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki KalavriTue, 10 Ma🤖 cs.LG