Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records

该论文介绍了一种名为 `cad_processor.py` 的确定性预处理工作流,它通过处理临时学术数据库导出文件来计算生均成本,并利用基于年度极值与中位数的模糊分带法将成本划分为低、中、高三档,从而为预算与治理决策提供可复现、可审计且具备可解释性的数据支持。

Shane Lee, Stella Ng2026-03-06🤖 cs.AI

Bala-Join: An Adaptive Hash Join for Balancing Communication and Computation in Geo-Distributed SQL Databases

本文针对地理分布式 SQL 数据库在广域网环境下处理倾斜数据时分布式哈希连接性能下降的问题,提出了一种名为 Bala-Join 的自适应算法,通过结合平衡分区与部分复制(BPPR)策略、分布式在线倾斜键检测器以及低开销的异步拉取同步机制(ASAP),有效平衡了通信与计算负载,从而将吞吐量提升了 25% 至 61%。

Wenlong Song, Hui Li, Bingying Zhai + 5 more2026-03-06💻 cs