DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

이 논문은 기존 대규모 언어 모델의 한계를 극복하고 복잡한 테이블 질의응답의 정확성을 획기적으로 향상시키기 위해, 데이터 리더와 전문 에이전트 팀 간의 협업 및 자동화된 지식 그래프 변환을 가능하게 하는 'DataFactory'라는 다중 에이전트 프레임워크를 제안합니다.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

이 논문은 대규모 언어 모델 (LLM) 기반 인덱스 튜닝이 Microsoft 의 Database Tuning Advisor(DTA) 보다 일관성은 낮지만 특정 경우 더 우수한 성능을 보일 수 있음을 입증하면서도, 생산 환경 적용을 위한 높은 변동성과 검증 비용 등의 과제를 제시합니다.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

이 논문은 물리적 가정이 누락된 문헌 기반 시뮬레이션에서 발생하는 물리적 환각을 해결하기 위해, 차원 분석을 통해 시스템의 물리적 regimes 를 자동으로 식별하고 누락된 메커니즘을 추론하여 보완하는 신경 - 심볼릭 생성 에이전트를 제안함으로써 과학적 발견에서 AI 가 단순한 코딩 도구를 넘어 이론적 가정을 검증하고 수정할 수 있는 인식적 파트너로 진화할 수 있음을 보여줍니다.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong HuangWed, 11 Ma💻 cs

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

이 논문은 기존 협업 학습 벤치마크가 간과한 실제 데이터 실리 (silos) 의 복잡성을 반영하기 위해, 10 만 개의 실세계 관계형 데이터베이스와 1700 만 개의 연결 관계로 구성된 대규모 벤치마크 'WikiDBGraph'를 제안하고 이를 통해 기존 협업 학습 방법의 한계를 평가하며 실용적 배포를 위한 방향성을 제시합니다.

Zhaomin Wu, Ziyang Wang, Bingsheng HeTue, 10 Ma🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

이 논문은 전문가 수준의 테이블 이해, 추론, 조작 능력을 포괄적으로 평가하기 위해 25 가지 실제 태스크와 28,000 개 이상의 질문으로 구성된 대규모 벤치마크인 MMTU 를 소개하고, 최신 선두 모델들조차 이 작업에서 상당한 개선의 여지가 있음을 보여줍니다.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. JagadishTue, 10 Ma🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

이 논문은 대규모 언어 모델을 활용한 테이블 파인튜닝 전략과 삼중항 표현을 통해 실제 오류 분포를 충실히 반영하는 'TableEG' 프레임워크를 제안하여, 기존 합성 오류 생성의 한계를 극복하고 데이터 정제 기술의 실용적인 벤치마킹을 가능하게 합니다.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin TongTue, 10 Ma🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

이 논문은 데이터 분포와 시스템 자원의 이질성으로 인한 로컬 - 글로벌 간극을 해결하기 위해, 고정된 길이의 글로벌 프롬프트와 각 클라이언트의 특성에 맞춘 가변 길이 로컬 프롬프트를 결합하고 서브스페이스 정제 및 발산 제어 전략을 도입한 이질적 연합 프롬프트 학습 프레임워크인 SDFed 를 제안합니다.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi YinTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

이 논문은 현대 AI 애플리케이션의 다양한 요구사항을 충족하기 위해 투영 기법을 그래프 인덱스에 통합하여 기존 방법보다 5 배 빠른 검색 속도와 우수한 성능을 제공하는 새로운 근사 최근접 이웃 검색 프레임워크인 '투영 증강 그래프 (PAG)'를 제안합니다.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

The Fifth Graph Normal Form (5GNF): A Trait-Based Framework for Metadata Normalization in Property Graphs

이 논문은 속성 그래프의 메타데이터 중복과 의미 불일치 문제를 해결하기 위해, 반복되는 메타데이터를 표준화된 '트릿 (Trait)' 노드로 추출하여 연결하는 제 5 그래프 정규형 (5GNF) 프레임워크를 제안하고, 이를 Neo4j 와 Northwind 데이터셋을 통해 검증했습니다.

Yahya Sa'd, Vojtech Merunka, Renzo AnglesTue, 10 Ma💻 cs