R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

本論文は、没入型コンピュータグラフィックス(CG)の品質評価における課題を解決するため、6 つの知覚次元に基づく大規模データセットと質問応答ベンチマークを構築し、視覚的に類似した画像の説明を検索して生成に活用する「R4-CGQA」という検索拡張生成フレームワークを提案し、既存の視覚言語モデルの CG 品質評価性能を大幅に向上させることを示しています。

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi LinThu, 12 Ma💻 cs

A Hypergraph-Based Framework for Exploratory Business Intelligence

この論文は、動的なスキーマ進化とマテリアライズドビューの再利用を可能にするハイパーグラフデータモデルとサンプリングベースの推定アルゴリズムを導入した「ExBI」というシステムを提案し、大規模な探索的ビジネスインテリジェンスワークフローにおいて既存システムを大幅に凌駕する高速性と高い精度を実現したことを示しています。

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

本論文は、データベーススキーマの進化がテキストから SQL への変換モデルの性能に与える影響を評価・改善するための包括的なベンチマーク「EvoSchema」を提案し、スキーマ変更の多様なタイプをシミュレートすることでモデルの堅牢性を向上させる道筋を示しています。

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao LiThu, 12 Ma💬 cs.CL

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

本論文は、LLM の曖昧な指示による誤答を解消し、信頼性と検査可能性を高めるため、ユーザーの情報ニーズを関係スキーマとして再具体化(リリアイフィケーション)し、それを基に実行可能なプログラムを生成する AI エージェント「Pneuma-Seeker」を提案し、その有効性を示したものである。

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

この論文は、地球科学の複雑なデータ構造を効率的に表現・処理するために、圧縮木構造に基づく一般化されたデータハイパーキューと、それを活用した特徴抽出システムを提案し、大規模な異種データセットへのスケーラブルかつユーザー中心のアクセスを実現する統合フレームワークを構築するものである。

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin SchultzThu, 12 Ma💻 cs

Poisson Sampling over Acyclic Joins

この論文は、非一様確率に基づくポアソンサンプリングをアサイクリック結合に対して実行する際、大規模な結合結果を完全に物化することなく、ほぼインスタンス最適で実用的なアルゴリズムを提案し、従来のサンプリング手法やヤナカキスの結合処理アルゴリズムを凌駕する性能を実証するものである。

Liese Bekkers, Frank Neven, Lorrens Pantelis, Stijn VansummerenThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

本論文は、PDF や Web ページなどに埋め込まれた複雑な構造を持つ人間中心の表(HCT)に対する自然言語での質問応答を評価するための大規模ベンチマーク「HCT-QA」を提案し、その構成と 25 種類の LLM および 9 種類の VLM による性能評価、ファインチューニングによる大幅な精度向上を実証しています。

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

本論文は、データレイクから洞察を得るための複雑なデータ処理パイプラインの設計と実行を評価する新しいベンチマーク「KramaBench」を提案し、現在の AI システムが個々のタスクや草案の生成では一定の成果を収めるものの、実用的なエンドツーエンドのパイプラインを構築する能力には依然として大きな課題があることを明らかにしています。

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

この論文は、大規模データ環境におけるテキストから SQL への変換(Text-to-Big SQL)を評価する際、従来のベンチマークでは見落とされていたコストやレイテンシなどのスケーラビリティ課題を克服するため、実行効率やデータ規模の影響を正確に反映する新規評価指標を提案し、最先端の LLM エージェントを対象とした包括的な評価を通じてその有効性を示しています。

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

本論文は、標準化されたテンプレート列挙と学習によるランキング手法を組み合わせることで、大規模な検索空間と冗長性を克服し、100 万を超える最適化ルールの発見を可能にするスケーラブルなシステム「SLER」を提案するものである。

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

本論文は、レガシーなリレーショナルデータをエンタープライズ知識グラフで利用可能にするためのマテリアライズされた RDB2RDF ビューの構築と、データベース更新に応じたインクリメンタルな維持を行うための形式フレームワーク、アーキテクチャ、およびアルゴリズムを提案するものである。

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

Towards Neural Graph Data Management

この論文は、金融や医療など 5 つの分野にまたがり、複雑な Cypher クエリや現実的なノイズ注入を含む包括的なベンチマーク「NGDBench」を提案し、現在の LLM や RAG 手法が構造化されたグラフデータの管理において構造的推論やノイズ耐性の面で重大な限界を抱えていることを明らかにしています。

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu SongMon, 09 Ma🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

本論文は、大規模な非構造化データや基盤モデルの普及に伴う不確実性やスケーラビリティの課題に直面する AI 時代における人間・データ相互作用の現状を分析し、従来の効率性指標を超えて認知・知覚・デザイン原則を統合した新しい人間中心の分析システム構築の方向性を示唆しています。

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun YuMon, 09 Ma🤖 cs.AI

Querying with Conflicts of Interest

この論文は、データソースと利用者の間に利益相反が存在し意図的なバイアスが加えられる環境におけるクエリ処理のための新しい形式的枠組みを提案し、バイアスの検出やクエリ再構築による有用な情報抽出を可能にする効率的なアルゴリズムを考案し、実データを用いた実験でその有効性を示しています。

Nischal Aryal, Arash Termehchy, Marianne WinslettMon, 09 Ma💻 cs

Efficient Vector Search in the Wild: One Model for Multi-K Queries

本論文は、異なる K 値に対するクエリに高い精度と性能を維持しつつ前処理コストを大幅に削減する、K 汎化可能なベクトル検索手法「OMEGA」を提案し、既存の学習型検索手法と比較して平均レイテンシを 6〜33% 削減できることを示しています。

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo ChenMon, 09 Ma🤖 cs.LG

Tag-specific Regret Minimization Problem in Outdoor Advertising

本論文は、屋外広告におけるタグ割り当てを最適化する「タグ固有の後悔最小化問題(TRMOA)」を定式化し、その NP 困難性と近似不可能性を示した上で、公平性を考慮したラウンドロビン法やランダム化貪欲法、局所探索法などのアルゴリズムを提案し、実データを用いた実験でその有効性を検証したものである。

Dildar Ali, Abishek Salaria, Ansh Jasrotia, Suman BanerjeeMon, 09 Ma💻 cs

CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

この論文は、LLM の知識更新やハルシネーション問題を解決するため、チャンクの相関関係を考慮したモンテカルロ木探索、非単調な有用性の評価、およびクエリごとの適応的設定を可能にする学習型コスト制約検索最適化フレームワーク「CARROT」を提案し、既存手法を最大 30% 上回る性能向上を実証したものである。

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei LiFri, 13 Ma💬 cs.CL

Knowledge Distillation with Structured Chain-of-Thought for Text-to-SQL

この論文は、大規模言語モデルの推論を構造化された実行計画(クエリ実行計画)という形式化された青写真として小規模言語モデルに知識蒸留する「Struct-SQL」を提案し、非構造化の思考連鎖を用いた従来手法と比較して構文エラーを大幅に削減し、Text-to-SQL の精度を 8.1% 向上させることを実証しています。

Khushboo Thaker, Yony BreslerFri, 13 Ma💬 cs.CL