cs.DB 편의 논문 | Gist.Science

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

이 논문은 CG 이미지 품질 평가의 한계를 해결하기 위해 6 가지 지각 차원을 기반으로 한 대규모 데이터셋과 질의응답 벤치마크를 구축하고, 시각적으로 유사한 이미지의 설명을 검색하여 증강 생성하는 R4-CGQA 프레임워크를 제안함으로써 비전 언어 모델의 CG 품질 평가 성능을 크게 향상시켰습니다.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi LinThu, 12 Ma💻 cs

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

이 논문은 에이전트 실행 궤적을 분석하여 성공 패턴, 오류 복구, 최적화 방안을 추출하고 이를 맥락에 맞는 메모리로 재구성함으로써 에이전트의 자기 개선 능력을 획기적으로 향상시키는 새로운 프레임워크를 제안합니다.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

이 논문은 동적 스키마 진화와 재사용 가능한 뷰를 지원하며 샘플링 기반 알고리즘을 통해 계산 병목 현상을 해결함으로써 기존 시스템 대비 월등한 속도와 높은 정확도를 제공하는 탐색형 비즈니스 인텔리전스 시스템 'ExBI'를 제안합니다.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

이 논문은 실제 세계의 스키마 진화에 대비하여 텍스트 -SQL 시스템의 견고성을 평가하고 향상시키기 위해 열 가지 교란 유형을 포함하는 포괄적인 벤치마크인 EvoSchema 를 제안하고, 이를 통해 테이블 수준의 변경이 모델 성능에 더 큰 영향을 미치며 다양한 스키마 설계로 훈련된 모델이 더 뛰어난 견고성을 보임을 입증합니다.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao LiThu, 12 Ma💬 cs.CL

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

이 논문은 LLM 기반 에이전트가 자연어 요청을 직접 처리하는 대신 사용자의 정보 요구를 점진적으로 구체화하는 '관계적 재구현 (relational reification)' 스키마로 표현하고 이를 기반으로 정확한 답변을 생성하는 Pneuma-Seeker 시스템을 제안하여, 다양한 도메인에서 기존 기법보다 높은 정확도와 신뢰성을 입증했습니다.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

이 논문은 불규칙하고 분기된 지구 시스템 데이터를 효율적으로 표현하고 특징을 추출하기 위해 압축 트리 구조 기반의 일반화된 데이터 하이퍼큐브를 제안하고, 이를 통해 기존 데이터큐브 모델의 한계를 극복하는 확장 가능하고 사용자 중심의 접근 체계를 제시합니다.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin SchultzThu, 12 Ma💻 cs

Poisson Sampling over Acyclic Joins

이 논문은 비균일 확률로 조인 결과를 표본화하는 '포아송 샘플링' 문제를 해결하기 위해, 조인 결과를 완전히 물리화하지 않고도 무작위 접근이 가능한 인덱스를 구축하여 거의 인스턴스 최적의 성능을 달성하는 알고리즘을 제안하고, 이를 실제 데이터로 실험하여 기존 방법보다 월등히 우수함을 입증했습니다.

Liese Bekkers, Frank Neven, Lorrens Pantelis, Stijn VansummerenThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

이 논문은 복잡한 구조와 의미를 가진 인간 중심 테이블 (HCT) 에 대한 자연어 질문 답변을 평가하기 위한 대규모 벤치마크인 HCT-QA 를 제안하고, 다양한 LLM 과 VLM 의 성능을 분석하며 파인튜닝을 통한 성능 향상 가능성을 입증합니다.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

이 논문은 데이터 레이크의 복잡하고 불완전한 데이터에서 통찰력을 도출하는 전 과정을 평가하기 위해 고안된 'KramaBench' 벤치마크를 소개하고, 현재 AI 에이전트 시스템이 개별 데이터 작업은 수행할 수 있으나 이를 통합한 종단간 (end-to-end) 파이프라인을 성공적으로 구축하는 데는 여전히 큰 한계가 있음을 보여줍니다.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

이 논문은 대규모 데이터 환경에서 기존 Text-to-SQL 평가 지표의 한계를 지적하고, 실행 효율성, 비용, 데이터 규모 영향을 종합적으로 반영하는 새로운 'Text-to-Big SQL' 평가 지표와 LLM 에이전트에 대한 통찰을 제시합니다.

Germán T. Eizaguirre, Lars Tissen, Marc Sánchez-ArtigasMon, 09 Ma💬 cs.CL

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

이 논문은 표준화된 템플릿 열거와 학습 기반 랭킹을 결합하여 검색 공간을 대폭 축소하고 100 만 개 이상의 자동 생성된 재작성 규칙을 확보함으로써 복잡한 쿼리 최적화를 가능하게 하는 확장성 있는 시스템 SLER 을 제안합니다.

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

이 논문은 기업 지식 그래프를 통해 레거시 관계형 데이터 소스에 대한 RDF 뷰를 구축하고, 이를 물리화하여 성능을 개선함과 동시에 관계형 데이터베이스의 업데이트를 반영하기 위한 증분 유지보수 프레임워크, 아키텍처 및 알고리즘을 제안합니다.

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

← 이전 다음 →

cs.DB

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

A Hypergraph-Based Framework for Exploratory Business Intelligence

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Poisson Sampling over Acyclic Joins

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

Both Ends Count! Just How Good are LLM Agents at "Text-to-Big SQL"?

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

Towards Neural Graph Data Management

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Space-efficient B-tree Implementation for Memory-Constrained Flash Embedded Devices

Querying with Conflicts of Interest

Efficient Vector Search in the Wild: One Model for Multi-K Queries

Tag-specific Regret Minimization Problem in Outdoor Advertising

Numerical benchmark for damage identification in Structural Health Monitoring

The Case for Cardinality Lower Bounds