PANDAExpress: a Simpler and Faster PANDA Algorithm
이 논문은 기존 PANDA 알고리즘의 실행 시간 복잡도 내 숨겨진 인자를 제거하여 최적의 성능을 달성하면서도 모든 일반성을 유지하는, 새로운 확률적 부등식과 동적 하이퍼평면 분할 기법을 기반으로 한 더 간단하고 빠른 'PANDAExpress' 알고리즘을 제안합니다.
87 편의 논문
이 논문은 기존 PANDA 알고리즘의 실행 시간 복잡도 내 숨겨진 인자를 제거하여 최적의 성능을 달성하면서도 모든 일반성을 유지하는, 새로운 확률적 부등식과 동적 하이퍼평면 분할 기법을 기반으로 한 더 간단하고 빠른 'PANDAExpress' 알고리즘을 제안합니다.
이 논문은 대규모 동적 그래프에서 기존 Leiden 알고리즘의 비효율적인 전체 재계산을 해결하고, 계층적 증분 트리 구조를 활용한 새로운 HIT-Leiden 알고리즘을 제안하여 기존 방법 대비 최대 5 개 차수의 속도 향상과 동등한 커뮤니티 품질을 달성함을 보여줍니다.
이 논문은 현대 예측 모델의 구조적 국소성을 활용하여 데이터 가치 평가에 필요한 재학습 횟수를 최소화하는 최적의 재사용 알고리즘 (LSMR) 과 그 확장 버전 (LSMR-A) 을 제안함으로써, 기존 전역적 Shapley 값 계산의 비효율성을 해결하고 높은 정확도를 유지하며 계산 비용을 대폭 절감하는 방법을 제시합니다.
이 논문은 기존 텍스트 -SQL 정제 방식의 한계를 극복하기 위해 구조적 특징과 전용 오류 토큰을 활용하여 명시적 및 암시적 오류를 정밀하게 모델링하고 이를 기반으로 SQL 을 개선하는 'ErrorLLM' 프레임워크를 제안합니다.
이 논문은 데이터베이스 엔진과 AI 를 통합한 'AIxDB' 시스템이 직면한 쿼리 최적화, 실행 스케줄링, 분산 처리, 트랜잭션 관리 및 보안 등의 과제를 논의하고, 이를 해결하기 위한 설계 방안과 초기 성능 결과를 제시합니다.
이 논문은 구조적 인과 모델을 기반으로 한 합성 데이터를 통해 사전 학습된 최초의 관계형 기초 모델인 RDB-PFN 을 제안하여, 실제 데이터의 부족 문제를 해결하고 소수의 예시만으로 다양한 관계형 예측 작업에서 뛰어난 성능을 발휘하는 인-컨텍스트 학습 능력을 입증했습니다.
이 논문은 생성된 SQL 과 정답 SQL 간의 차이를 찾기 위해 제약 조건 마이닝 파이프라인을 도입하여 더 현실적인 차등 데이터베이스를 생성하고 표준 평가 방식이 놓치는 오류를 효율적으로 발견하는 오픈소스 도구 SpotIt+ 를 제안합니다.