R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

이 논문은 CG 이미지 품질 평가의 한계를 해결하기 위해 6 가지 지각 차원을 기반으로 한 대규모 데이터셋과 질의응답 벤치마크를 구축하고, 시각적으로 유사한 이미지의 설명을 검색하여 증강 생성하는 R4-CGQA 프레임워크를 제안함으로써 비전 언어 모델의 CG 품질 평가 성능을 크게 향상시켰습니다.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi LinThu, 12 Ma💻 cs

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

이 논문은 실제 세계의 스키마 진화에 대비하여 텍스트 -SQL 시스템의 견고성을 평가하고 향상시키기 위해 열 가지 교란 유형을 포함하는 포괄적인 벤치마크인 EvoSchema 를 제안하고, 이를 통해 테이블 수준의 변경이 모델 성능에 더 큰 영향을 미치며 다양한 스키마 설계로 훈련된 모델이 더 뛰어난 견고성을 보임을 입증합니다.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao LiThu, 12 Ma💬 cs.CL

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

이 논문은 LLM 기반 에이전트가 자연어 요청을 직접 처리하는 대신 사용자의 정보 요구를 점진적으로 구체화하는 '관계적 재구현 (relational reification)' 스키마로 표현하고 이를 기반으로 정확한 답변을 생성하는 Pneuma-Seeker 시스템을 제안하여, 다양한 도메인에서 기존 기법보다 높은 정확도와 신뢰성을 입증했습니다.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro FernandezThu, 12 Ma💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

이 논문은 불규칙하고 분기된 지구 시스템 데이터를 효율적으로 표현하고 특징을 추출하기 위해 압축 트리 구조 기반의 일반화된 데이터 하이퍼큐브를 제안하고, 이를 통해 기존 데이터큐브 모델의 한계를 극복하는 확장 가능하고 사용자 중심의 접근 체계를 제시합니다.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin SchultzThu, 12 Ma💻 cs

Poisson Sampling over Acyclic Joins

이 논문은 비균일 확률로 조인 결과를 표본화하는 '포아송 샘플링' 문제를 해결하기 위해, 조인 결과를 완전히 물리화하지 않고도 무작위 접근이 가능한 인덱스를 구축하여 거의 인스턴스 최적의 성능을 달성하는 알고리즘을 제안하고, 이를 실제 데이터로 실험하여 기존 방법보다 월등히 우수함을 입증했습니다.

Liese Bekkers, Frank Neven, Lorrens Pantelis, Stijn VansummerenThu, 12 Ma💻 cs

HCT-QA: A Benchmark for Question Answering on Human-Centric Tables

이 논문은 복잡한 구조와 의미를 가진 인간 중심 테이블 (HCT) 에 대한 자연어 질문 답변을 평가하기 위한 대규모 벤치마크인 HCT-QA 를 제안하고, 다양한 LLM 과 VLM 의 성능을 분석하며 파인튜닝을 통한 성능 향상 가능성을 입증합니다.

Mohammad S. Ahmad, Zan A. Naeem, Michaël Aupetit, Ahmed Elmagarmid, Mohamed Eltabakh, Xiaosong Ma, Mourad Ouzzani, Chaoyi Ruan, Hani Al-SayehMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

이 논문은 데이터 레이크의 복잡하고 불완전한 데이터에서 통찰력을 도출하는 전 과정을 평가하기 위해 고안된 'KramaBench' 벤치마크를 소개하고, 현재 AI 에이전트 시스템이 개별 데이터 작업은 수행할 수 있으나 이를 통합한 종단간 (end-to-end) 파이프라인을 성공적으로 구축하는 데는 여전히 큰 한계가 있음을 보여줍니다.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

Efficient Query Rewrite Rule Discovery via Standardized Enumeration and Learning-to-Rank(extend)

이 논문은 표준화된 템플릿 열거와 학습 기반 랭킹을 결합하여 검색 공간을 대폭 축소하고 100 만 개 이상의 자동 생성된 재작성 규칙을 확보함으로써 복잡한 쿼리 최적화를 가능하게 하는 확장성 있는 시스템 SLER 을 제안합니다.

Yuan Zhang, Yuxing Chen, Yuekun Yu, Jinbin Huang, Rui Mao, Anqun Pan, Lixiong Zheng, Jianbin QinMon, 09 Ma💻 cs

Publication and Maintenance of Relational Data in Enterprise Knowledge Graphs (Revised Version)

이 논문은 기업 지식 그래프를 통해 레거시 관계형 데이터 소스에 대한 RDF 뷰를 구축하고, 이를 물리화하여 성능을 개선함과 동시에 관계형 데이터베이스의 업데이트를 반영하기 위한 증분 유지보수 프레임워크, 아키텍처 및 알고리즘을 제안합니다.

Vânia Maria Ponte Vidal (Departamento de Computação, UFC, Fortaleza, Brazil), Valéria Magalhães Pequeno (TechLab, Departamento de Ciências e Tecnologias, UAL, Lisboa, Portugal), Marco Antonio Casanova (Instituto Tecgraf, Puc-Rio, Rio de Janeiro, Brazil), Narciso Arruda (Departamento de Computação, UFC, Fortaleza, Brazil), Carlos Brito (Departamento de Computação, UFC, Fortaleza, Brazil)Mon, 09 Ma💻 cs

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

이 논문은 AI 시대의 대규모 비정형 데이터와 생성형 모델의 등장으로 인해 발생하는 인간 - 데이터 상호작용의 새로운 도전과제를 분석하고, 기존 효율성 중심의 패러다임을 넘어 인지 및 지각 원리를 통합한 인간 중심의 데이터 분석 시스템 구축을 위한 연구 방향을 제시합니다.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun YuMon, 09 Ma🤖 cs.AI

Numerical benchmark for damage identification in Structural Health Monitoring

이 논문은 환경 및 운영 조건 변화, 손상 유형, 측정 노이즈, 센서 고장 등 실제 상황을 반영한 가상의 구조물 건강 모니터링 (SHM) 데이터셋과 그 생성 프레임워크를 공개하여, 데이터 접근성 부족으로 인한 SHM 기술 발전의 걸림돌을 해소하고 연구의 재현성과 접근성을 높이는 것을 목표로 합니다.

Francesca Marafini, Giacomo Zini, Alberto Barontini, Nuno Mendes, Alice Cicirello, Michele Betti, Gianni BartoliFri, 13 Ma⚡ eess

The Case for Cardinality Lower Bounds

이 논문은 클라우드 규모의 데이터 웨어하우스에서 발생하는 치명적인 카디널리티 과소추정 문제를 해결하기 위해, 경량화된 기본 테이블 통계만으로도 조인 크기의 하한을 수학적으로 보장하는 새로운 프레임워크인 xBound 를 제안하고 이를 통해 실제 환경에서 최대 20.1 배의 쿼리 속도 향상을 달성했음을 보여줍니다.

Mihail Stoian, Tiemo Bang, Hangdong Zhao + 3 more2026-03-06🔢 math