LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

이 논문은 대규모 복잡한 데이터베이스에서 외래 키 누락을 탐지하기 위해 검색 공간 폭발, 모호한 추론, 국소적 예측의 불일치라는 세 가지 핵심 과제를 해결하는 최초의 완전 자동화 멀티 에이전트 프레임워크인 LLM-FK 를 제안하며, 이를 통해 기존 방법론 대비 정밀도를 크게 향상시키고 검색 공간을 획기적으로 축소하는 성과를 입증했습니다.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan WangTue, 10 Ma💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

이 논문은 복잡한 데이터 구조와 규제 요구사항이 있는 신용협동조합 환경에서 자연어 질의를 통해 실행 가능한 인사이트를 제공할 수 있도록, 기존 스키마에서 의미론적 지식 그래프를 자동 추론하고 LLM 을 통합하여 안전한 온프레미스 검색 플랫폼인 'Tursio'를 제안합니다.

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh JindalTue, 10 Ma💻 cs

Enhancing OLAP Resilience at LinkedIn

이 논문은 링크드인이 Apache Pinot 에서 개발한 쿼리 워크로드 격리, 영향 없는 리밸런싱, 유지보수 존 인식, 적응형 서버 선택 등의 메커니즘을 통해 대규모 실시간 OLAP 시스템의 내결함성과 SLA 준수를 보장하는 종합적인 복원력 프레임워크를 제시합니다.

Praveen Chaganlal, Jia Guo, Vivek Vaidyanathan, Dino Occhialini, Sonam Mandal, Subbu Subramaniam, Siddharth Teotia, Tianqi Li, Xiaxuan Gao, Florence ZhangTue, 10 Ma💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

이 논문은 이기종 데이터베이스 시스템의 각기 다른 SQL 문법과 제약 조건을 고려하여 자연어에서 실행 가능한 SQL 쿼리를 생성하는 지식 기반 프레임워크 'Dial'을 제안하고, 논리적 쿼리 계획, 계층적 지식 베이스, 실행 기반 디버깅 루프를 통해 기존 방법론 대비 번역 정확도와 기능 커버리지를 크게 향상시켰음을 보여줍니다.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

이 논문은 관계형 데이터베이스의 불균형 문제를 해결하기 위해 이웃 메시지 조절을 위한 관계별 게이트 제어기와 관계 일관성을 유지하는 과표본화 합성기를 도입한 'Rel-MOSS'를 제안하고, 다양한 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi ZhangTue, 10 Ma🤖 cs.LG

Decomposition-Driven Multi-Table Retrieval and Reasoning for Numerical Question Answering

이 논문은 대규모 테이블 컬렉션에서의 복잡한 관계와 정확한 답변 생성을 위해 테이블 관계 그래프, 질문 분해 및 커버리지 인식 검색, 하위 질문 기반 추론을 통합한 DMRAL 프레임워크를 제안하고, 기존 방법 대비 검색 및 답변 정확도를 크게 향상시켰음을 보여줍니다.

Feng Luo, Hai Lan, Hui Luo, Zhifeng Bao, Xiaoli Wang, J. Shane Culpepper, Shazia SadiqTue, 10 Ma💻 cs

Samyama: A Unified Graph-Vector Database with In-Database Optimization, Agentic Enrichment, and Hardware Acceleration

이 논문은 Rust 로 구현된 Samyama 를 통해 그래프, 벡터, 최적화 워크로드를 단일 엔진으로 통합하고 인-데이터베이스 최적화, 에이전트 기반 확장, 하드웨어 가속을 지원하여 상용 하드웨어에서도 고성능을 달성하는 새로운 데이터 아키텍처를 제시합니다.

Madhulatha Mandarapu, Sandeep KunkunuruTue, 10 Ma💻 cs

LLM-Driven Online Aggregation for Unstructured Text Analytics

이 논문은 대규모 언어 모델 (LLM) 기반 텍스트 분석의 실시간 응답성을 향상시키기 위해, 전체 데이터 처리를 기다리지 않고 점진적 출력을 제공하는 온라인 집계 프레임워크 OLLA 와 의미적 층화 샘플링 기법을 제안하고, 이를 통해 기존 방식 대비 1.6 배에서 38 배까지의 속도 향상을 달성했음을 보여줍니다.

Chao Hui, Weizheng Lu, Yanjie Gao, Lingfeng Xiong, Yunhai Wang, Yueguo ChenTue, 10 Ma💻 cs

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

이 논문은 기존 방법의 한계를 극복하기 위해 시공간 데이터의 시간과 공간 차원을 모두 압축하는 'STemDist'라는 새로운 데이터 증류 기법을 제안하여, 기존 방법 대비 훈련 속도를 최대 6 배, 메모리 효율을 최대 8 배 향상시키면서 예측 오차를 최대 12% 까지 낮추는 성과를 입증했습니다.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung ShinThu, 12 Ma🤖 cs.LG