cs.DB 件の論文 | Gist.Science

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

本論文は、没入型コンピュータグラフィックス（CG）の品質評価における課題を解決するため、6 つの知覚次元に基づく大規模データセットと質問応答ベンチマークを構築し、視覚的に類似した画像の説明を検索して生成に活用する「R4-CGQA」という検索拡張生成フレームワークを提案し、既存の視覚言語モデルの CG 品質評価性能を大幅に向上させることを示しています。

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi LinThu, 12 Ma💻 cs

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

この論文は、LLM ベースのエージェントが実行軌跡から戦略や失敗回復などの構造化された学習を自動抽出し、適応的なメモリ検索を通じて将来のタスク遂行能力を大幅に向上させる新しいフレームワークを提案しています。

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

この論文は、動的なスキーマ進化とマテリアライズドビューの再利用を可能にするハイパーグラフデータモデルとサンプリングベースの推定アルゴリズムを導入した「ExBI」というシステムを提案し、大規模な探索的ビジネスインテリジェンスワークフローにおいて既存システムを大幅に凌駕する高速性と高い精度を実現したことを示しています。

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

本論文は、データベーススキーマの進化がテキストから SQL への変換モデルの性能に与える影響を評価・改善するための包括的なベンチマーク「EvoSchema」を提案し、スキーマ変更の多様なタイプをシミュレートすることでモデルの堅牢性を向上させる道筋を示しています。

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao LiThu, 12 Ma💬 cs.CL

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

本論文は、LLM の曖昧な指示による誤答を解消し、信頼性と検査可能性を高めるため、ユーザーの情報ニーズを関係スキーマとして再具体化（リリアイフィケーション）し、それを基に実行可能なプログラムを生成する AI エージェント「Pneuma-Seeker」を提案し、その有効性を示したものである。

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

この論文は、地球科学の複雑なデータ構造を効率的に表現・処理するために、圧縮木構造に基づく一般化されたデータハイパーキューと、それを活用した特徴抽出システムを提案し、大規模な異種データセットへのスケーラブルかつユーザー中心のアクセスを実現する統合フレームワークを構築するものである。

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin SchultzThu, 12 Ma💻 cs

Poisson Sampling over Acyclic Joins

この論文は、非一様確率に基づくポアソンサンプリングをアサイクリック結合に対して実行する際、大規模な結合結果を完全に物化することなく、ほぼインスタンス最適で実用的なアルゴリズムを提案し、従来のサンプリング手法やヤナカキスの結合処理アルゴリズムを凌駕する性能を実証するものである。

Liese Bekkers, Frank Neven, Lorrens Pantelis, Stijn VansummerenThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

本論文は、PDF や Web ページなどに埋め込まれた複雑な構造を持つ人間中心の表（HCT）に対する自然言語での質問応答を評価するための大規模ベンチマーク「HCT-QA」を提案し、その構成と 25 種類の LLM および 9 種類の VLM による性能評価、ファインチューニングによる大幅な精度向上を実証しています。

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

本論文は、データレイクから洞察を得るための複雑なデータ処理パイプラインの設計と実行を評価する新しいベンチマーク「KramaBench」を提案し、現在の AI システムが個々のタスクや草案の生成では一定の成果を収めるものの、実用的なエンドツーエンドのパイプラインを構築する能力には依然として大きな課題があることを明らかにしています。

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

この論文は、大規模データ環境におけるテキストから SQL への変換（Text-to-Big SQL）を評価する際、従来のベンチマークでは見落とされていたコストやレイテンシなどのスケーラビリティ課題を克服するため、実行効率やデータ規模の影響を正確に反映する新規評価指標を提案し、最先端の LLM エージェントを対象とした包括的な評価を通じてその有効性を示しています。

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

本論文は、標準化されたテンプレート列挙と学習によるランキング手法を組み合わせることで、大規模な検索空間と冗長性を克服し、100 万を超える最適化ルールの発見を可能にするスケーラブルなシステム「SLER」を提案するものである。

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

本論文は、レガシーなリレーショナルデータをエンタープライズ知識グラフで利用可能にするためのマテリアライズされた RDB2RDF ビューの構築と、データベース更新に応じたインクリメンタルな維持を行うための形式フレームワーク、アーキテクチャ、およびアルゴリズムを提案するものである。

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

← 前へ次へ →

cs.DB

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

A Hypergraph-Based Framework for Exploratory Business Intelligence

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Poisson Sampling over Acyclic Joins

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

Towards Neural Graph Data Management

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Space-efficient B-tree Implementation for Memory-Constrained Flash Embedded Devices

Querying with Conflicts of Interest

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Tag-specific Regret Minimization Problem in Outdoor Advertising

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

Knowledge Distillation with Structured Chain-of-Thought for Text-to-SQL