cs.DB 편의 논문 | Gist.Science

Modeling Concurrency Control as a Learnable Function

이 논문은 베이지안 최적화와 그래프 축소 탐색 알고리즘을 결합하여 다양한 워크로드에서 기존 최첨단 동시성 제어 알고리즘들보다 높은 처리량과 빠른 최적화 속도를 보이는 새로운 학습 기반 동시성 제어 알고리즘인 NeurCC 를 제안합니다.

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

OptBench: An Interactive Workbench for AI/ML-SQL Co-Optimization[Extended Demonstration Proposal]

이 논문은 SQL 과 AI/ML 연산이 혼합된 하이브리드 쿼리를 위한 최적화 기법을 투명하고 공정한 방식으로 구축, 벤치마크 및 시각화할 수 있는 대화형 워크벤치 'OptBench'를 제안합니다.

Jaykumar Tandel, Douglas Oscarson, Jia ZouWed, 11 Ma💻 cs

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

이 논문은 대규모 희소 텐서 계산을 위해 관계형 시스템의 희소성 처리 능력과 고성능 수치 커널을 결합하여, 기존 에인슈타인 합계 표기법을 자동으로 'EinSum'으로 변환하는 방법을 제시합니다.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

Nezha: A Key-Value Separated Distributed Store with Optimized Raft Integration

이 논문은 합의 프로토콜과 저장 엔진 간의 중복 지속성 작업으로 인한 I/O 오버헤드를 해결하기 위해 키 - 값 분리 아키텍처와 Raft 를 혁신적으로 통합하여 읽기 및 쓰기 성능을 대폭 향상시킨 분산 키 - 값 저장소 'Nezha'를 제안합니다.

Yangyang Wang, Yucong Dong, Ziqian Cheng, Zichen XuWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

이 논문은 기존 대규모 언어 모델의 한계를 극복하고 복잡한 테이블 질의응답의 정확성을 획기적으로 향상시키기 위해, 데이터 리더와 전문 에이전트 팀 간의 협업 및 자동화된 지식 그래프 변환을 가능하게 하는 'DataFactory'라는 다중 에이전트 프레임워크를 제안합니다.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

이 논문은 대규모 언어 모델 (LLM) 기반 인덱스 튜닝이 Microsoft 의 Database Tuning Advisor(DTA) 보다 일관성은 낮지만 특정 경우 더 우수한 성능을 보일 수 있음을 입증하면서도, 생산 환경 적용을 위한 높은 변동성과 검증 비용 등의 과제를 제시합니다.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

The Virtuous Cycle: AI-Powered Vector Search and Vector Search-Augmented AI

이 논문은 AI 가 벡터 검색의 성능을 향상시키고, 벡터 검색이 RAG 를 통해 LLM 의 한계를 보완하는 상호 선순환 관계를 형성하며, 이를 통해 지능형 정보 시스템의 새로운 연구 영역을 개척하는 최신 연구 동향과 미래 과제를 종합적으로 다룹니다.

Jiuqi Wei, Quanqing Xu, Chuanhui YangWed, 11 Ma💻 cs

GeoBenchr: An Application-Centric Benchmarking Suite for Spatiotemporal Database Platforms

이 논문은 사이클링, 항공, 해상 추적 등 다양한 실제 응용 분야의 워크로드를 반영하여 시공간 데이터베이스 플랫폼의 성능을 종합적으로 평가할 수 있는 오픈소스 애플리케이션 중심 벤치마크 스위트인 'GeoBenchr'를 제안합니다.

Tim C. Rese, Nils Japke, Diana Baumann, Natalie Carl, David BermbachWed, 11 Ma💻 cs

No Cliques Allowed: The Next Step Towards BDD/FC Conjecture

이 논문은 유한 유도 깊이 규칙 집합 (bdd) 에서 생성된 보편 모델이 루프 쿼리를 유도하지 않는 한 임의의 큰 토너먼트를 포함할 수 없음을 증명함으로써, bdd 규칙 집합의 유한 통제 가능성 (fc) 추측에 대한 반례의 가능성을 축소했습니다.

Lucas Larroque, Piotr Ostropolski-Nalewaja, Michaël ThomazoWed, 11 Ma💻 cs

Local Stability of Rankings

이 논문은 랭킹의 안정성을 평가하는 새로운 개념인 '국소 안정성 (local stability)'을 제안하고, 이를 효율적으로 계산하기 위한 샘플링 기반 근사 알고리즘과 밀집 영역 탐지 알고리즘을 개발하여 실험을 통해 유효성을 입증했습니다.

Felix S. Campbell, Yuval MoskovitchWed, 11 Ma💻 cs

Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

이 논문은 물리적 가정이 누락된 문헌 기반 시뮬레이션에서 발생하는 물리적 환각을 해결하기 위해, 차원 분석을 통해 시스템의 물리적 regimes 를 자동으로 식별하고 누락된 메커니즘을 추론하여 보완하는 신경 - 심볼릭 생성 에이전트를 제안함으로써 과학적 발견에서 AI 가 단순한 코딩 도구를 넘어 이론적 가정을 검증하고 수정할 수 있는 인식적 파트너로 진화할 수 있음을 보여줍니다.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong HuangWed, 11 Ma💻 cs

Expressive Power of Property Graph Constraint Languages

이 논문은 GQL 표준 개정을 위한 PG-Keys 언어의 표현력을 Graph Functional Dependencies(GFD) 및 Graph Generating Dependencies(GGD) 와 비교 분석하기 위해 통합 프레임워크를 제시하고, 완전하고 엄격한 표현력 위계 구조를 확립하여 PG-Keys 의 고유한 표현 능력을 규명합니다.

Stefania Dumbrava, Nadime Francis, Victor Marsault, Steven SaillyWed, 11 Ma💻 cs

How to Write to SSDs

이 논문은 데이터베이스 시스템이 SSD 의 성능을 극대화하고 수명을 연장하기 위해 '제자리 쓰기 (in-place)' 대신 '제자리 밖 쓰기 (out-of-place)' 전략을 도입하고 이를 LeanStore 에 적용하여 쓰기 증폭을 획기적으로 줄이고 처리량을 크게 향상시켰음을 보여줍니다.

Bohyun Lee, Tobias Ziegler, Viktor LeisWed, 11 Ma💻 cs

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

이 논문은 기존 협업 학습 벤치마크가 간과한 실제 데이터 실리 (silos) 의 복잡성을 반영하기 위해, 10 만 개의 실세계 관계형 데이터베이스와 1700 만 개의 연결 관계로 구성된 대규모 벤치마크 'WikiDBGraph'를 제안하고 이를 통해 기존 협업 학습 방법의 한계를 평가하며 실용적 배포를 위한 방향성을 제시합니다.

Zhaomin Wu, Ziyang Wang, Bingsheng HeTue, 10 Ma🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

이 논문은 전문가 수준의 테이블 이해, 추론, 조작 능력을 포괄적으로 평가하기 위해 25 가지 실제 태스크와 28,000 개 이상의 질문으로 구성된 대규모 벤치마크인 MMTU 를 소개하고, 최신 선두 모델들조차 이 작업에서 상당한 개선의 여지가 있음을 보여줍니다.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. JagadishTue, 10 Ma🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

이 논문은 대규모 언어 모델을 활용한 테이블 파인튜닝 전략과 삼중항 표현을 통해 실제 오류 분포를 충실히 반영하는 'TableEG' 프레임워크를 제안하여, 기존 합성 오류 생성의 한계를 극복하고 데이터 정제 기술의 실용적인 벤치마킹을 가능하게 합니다.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin TongTue, 10 Ma🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

이 논문은 데이터 분포와 시스템 자원의 이질성으로 인한 로컬 - 글로벌 간극을 해결하기 위해, 고정된 길이의 글로벌 프롬프트와 각 클라이언트의 특성에 맞춘 가변 길이 로컬 프롬프트를 결합하고 서브스페이스 정제 및 발산 제어 전략을 도입한 이질적 연합 프롬프트 학습 프레임워크인 SDFed 를 제안합니다.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi YinTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

이 논문은 현대 AI 애플리케이션의 다양한 요구사항을 충족하기 위해 투영 기법을 그래프 인덱스에 통합하여 기존 방법보다 5 배 빠른 검색 속도와 우수한 성능을 제공하는 새로운 근사 최근접 이웃 검색 프레임워크인 '투영 증강 그래프 (PAG)'를 제안합니다.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

The Fifth Graph Normal Form (5GNF): A Trait-Based Framework for Metadata Normalization in Property Graphs

이 논문은 속성 그래프의 메타데이터 중복과 의미 불일치 문제를 해결하기 위해, 반복되는 메타데이터를 표준화된 '트릿 (Trait)' 노드로 추출하여 연결하는 제 5 그래프 정규형 (5GNF) 프레임워크를 제안하고, 이를 Neo4j 와 Northwind 데이터셋을 통해 검증했습니다.

Yahya Sa'd, Vojtech Merunka, Renzo AnglesTue, 10 Ma💻 cs

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

이 논문은 대규모 그래프에서 GNN 파이프라인의 병목 현상을 해결하기 위해 그래프 희석 (sparsification) 이 정확도 유지 또는 향상을 보장하면서 학습 및 추론 속도를 획기적으로 개선할 수 있음을 체계적인 실험을 통해 입증합니다.

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki KalavriTue, 10 Ma🤖 cs.LG