Implicit Biases in Refereeing: Lessons from NBA Referees
该研究利用 NBA 比赛数据重新审视了裁判的隐性偏见,发现主客场偏见(尤其是季后赛中)存在但随疫情有所减弱,特定球员确实受益于裁判判罚,但未发现针对特定球员、球队或种族的负面偏见。
96 篇论文
该研究利用 NBA 比赛数据重新审视了裁判的隐性偏见,发现主客场偏见(尤其是季后赛中)存在但随疫情有所减弱,特定球员确实受益于裁判判罚,但未发现针对特定球员、球队或种族的负面偏见。
该论文利用持久同调和见证复形方法评估冷却中心覆盖中的地理缺口,并通过在四个城市将其与热脆弱性指数进行对比,揭示了从拓扑和人口统计双重视角识别热相关死亡风险区域的互补价值。
该论文提出了一种基于无监督学习的双阶段框架,利用未标记的故障数据联合识别深空栖息地中的潜在故障模式并筛选关键传感器,从而在缺乏先验知识的情况下实现更准确的剩余寿命预测。
该论文提出了一种扩展的嵌套误差回归模型,通过引入高效估计算法和针对异质性数据的参数自助法,实现了在小样本区域贫困指标估计中更低的偏差与误差,并有效解决了高维参数下的计算瓶颈及样本外区域预测问题。
该论文提出了一种基于伪观测值的一次性联邦学习框架,通过可再生广义估计方程和去偏校正技术,在严格保护隐私的前提下实现了多中心时间 - 事件数据的灵活建模,有效克服了比例风险假设限制并解决了站点异质性问题。
本文介绍了名为 DESA 的 R 语言软件包,该工具利用小学生缺勤数据对流感等传染病进行建模、预警及评估,并支持社区级疫情模拟,旨在提升公共卫生部门对季节性流行病的早期发现能力。
该论文通过实证研究揭示,生成式搜索中的引用可见性具有显著的非确定性波动,因此主张摒弃单一测量点估计,转而采用统计框架将引用指标视为分布估计量并报告不确定性区间,以避免对域名表现产生误导性解读。
本文提出了一种基于移动窗口贝叶斯广义加性模型与高斯 copula 的 BMW-GAM 方法,用于对极端天气事件下关键能源系统面临的复合风险进行可解释的不确定性量化分析。
AgroDesign 是一个基于 Python 的统计推断框架,通过将实验设计作为核心规范,自动将结构化农业试验(如随机区组、裂区及多环境试验)转化为有效的线性模型,从而消除手动建模的主观性并确保统计推断的准确性与可重复性。
该论文提出了一种基于新型准似然比统计量(MM-test)和 Knockoff 程序的非参数空间可变基因筛选方法,该方法利用空间距离等辅助信息,在控制错误发现率的同时,能够高效处理二维及三维空间转录组数据,并在理论与实证层面均展现出优于现有方法的性能。
该论文提出了一种基于“惊奇度”(surprisal)及其尾部概率的统一定义框架,通过结合经验估计与极值理论,将复杂数据的异常检测转化为对惊奇度分布上尾的估计,从而在模型误设情况下有效识别包括低密度间隙中的“内点”异常。
本文介绍了 CERES,这是一个首个集概率性、开放性、持续运行、机器可读及承诺公开前瞻性验证于一体的自动化急性粮食不安全早期预警系统,它通过融合多源数据每周为 43 个高风险国家生成 90 天后的危机、紧急和饥荒阶段概率预测。
该论文通过将分层分解先验框架适配于潜在高斯物种分布模型,实现了对环境、空间和 temporal 过程方差贡献的直接透明控制,并在 NOAA 底层鱼类数据实证中证明了该方法在保持预测性能的同时显著提升了方差归因的可解释性与先验敏感性分析的透明度。
该研究通过分析两项大型肺癌筛查队列的纵向低剂量 CT 数据,证实了胸膜肺纤维弹性增生(PPFE)的影像学进展与全因死亡率及呼吸系统不良临床结局的独立关联,表明定量评估 PPFE 进展可作为筛查人群中识别高危个体的潜在影像学生物标志物。
本文从分布稳定性角度研究了稀疏精度矩阵估计器,推导了其在真实数据与“污染”数据分布差异下的显式局部 Lipschitz 界,并给出了协方差矩阵及其特征值估计的类似结果。
本文揭示了恶意审计对象如何利用最优传输等数学策略,从原本不公平的数据分布中构造出既满足公平性指标又看似具有代表性的样本以制造“公平假象”,并提出了基于分布距离统计检验的防御机制来识别此类操纵攻击。
该论文通过对比实验发现,基于多重插补(MICE)的方法在生成用于保险费率厘定的高质量合成数据方面,不仅能有效保留原始数据的分布特征和变量间关系,且相比变分自编码器和生成对抗网络等深度生成模型具有更低的实现复杂度。
该研究利用贝叶斯推断和广义极值回归模型,基于五个 CMIP6 模型分析了 2025 至 2125 年间全球五个沙漠区域极端气温的变化,发现随着气候强迫情景的加剧,所有沙漠区域的年极端最高气温均呈现显著上升趋势,而年极端最低气温虽呈类似趋势但显著性较弱。
该研究利用贝叶斯结构时间序列因果推断方法,证实了印度尼西亚莫罗瓦利工业园区镍加工设施的扩张导致周边海域水体透明度显著下降,揭示了该国矿产下游化政策中此前未被量化的海洋环境代价。
本文提出了一种基于逆概率加权与自适应狄利克雷核的非参数密度估计方法,用于处理缺失数据下的单纯形成分数据,该方法不仅具备优良的大样本性质,且在模拟与 NHANES 白细胞数据应用中表现优于基于对数比变换的传统方法。