想象一下,你正试图在一个非常嘈杂的房间里听清一声完美而轻柔的耳语。这本质上就是科学家们在搜寻一种名为“无中微子双贝塔衰变”的罕见事件时所做的事情。他们使用由纯锗晶体制成的极其灵敏的“麦克风”(探测器)来捕捉这些耳语。
然而,房间里充满了其他噪音:
- “坏”噪音:有时,伽马射线(一种辐射)会在房间内多次反弹后才停止。这就像有人在房间的不同角落拍手。科学家们想要忽略这些。
- “入侵者”噪音:有时,α粒子(微小、沉重的放射性颗粒)直接落在麦克风的表面上。这就像有人用手指直接敲击麦克风。它们产生的声音与科学家们正在搜寻的“耳语”非常相似,可能会诱骗他们误以为发现了什么,而实际上并没有。
问题
通常,为了教会计算机忽略“坏噪音”(伽马射线),科学家们会向它展示成千上万个此类声音的样本。但对于“入侵者噪音”(α粒子),这里有一个棘手之处:在实际实验中,这些入侵者极为罕见,数量不足以教会计算机它们长什么样。
这篇论文提出的核心问题是:我们能否仅通过向计算机展示“坏噪音”(伽马射线),而从不展示任何真实的“入侵者”,就教会它识别“入侵者”?
实验
研究人员搭建了一个高科技锗探测器(一种“BEGe"型探测器),并进行了两项操作:
- 训练:他们用伽马射线(使用钍源)轰击探测器,以训练两种不同的计算机程序(一种“多层感知机”和一种“投影似然”分类器),使其学会区分单次反弹(好的)和多次反弹(坏的)。
- 测试:随后,他们将一个钋源(一种α发射体)直接放置在探测器表面。这产生了数千个“入侵者”事件。他们向计算机提问:“嘿,你已经从伽马射线中学到了东西。现在你能识别并剔除这些α粒子吗?”
结果
计算机程序在这方面的表现令人惊讶地出色。
- “智能”过滤器:最佳方法是一种人工神经网络(称为多层感知机,MLP),它就像一个超级聪明的门卫。
- 保留好的:它保留了超过 80% 的“耳语”(即看起来像他们想要寻找的信号的单点伽马事件)。
- 剔除坏的:它剔除了超过 80% 的“拍手声”(即多点伽马事件)。
- 踢走入侵者:最重要的是,它以极高的效率剔除了α粒子。它过滤掉了超过27,000个α粒子,才让一个漏网。
类比
将探测器想象成一台安全摄像头。
- 伽马射线就像人们穿过一扇门;有时一个人穿过(好的),有时一群人一起穿过(坏的)。摄像头学会了识别这些人群。
- α粒子就像有人试图从门旁边的窗户爬进来。
- 这篇论文表明,通过学会识别门边的“人群”,摄像头也学会了识别窗边的“攀爬者”,即使它在训练过程中从未见过攀爬者。
结论
该论文得出结论:你不需要一个庞大的罕见“入侵者”样本库来教会你的探测器如何剔除它们。只需在更常见的“坏噪音”(伽马射线)上训练系统,机器学习算法自然也会学会识别“入侵者”(α粒子)。
这对于未来的实验(如文中提到的 LEGEND 项目)来说是一个巨大的胜利,因为这意味着他们可以构建更纯净、更灵敏的探测器,而无需等待数年去收集足够多的罕见α事件来训练其软件。这种“智能过滤器”开箱即用,仅需利用他们已有的数据即可。
技术摘要:BEGe 型高纯锗探测器中用于α事件剔除的脉冲形状甄别
问题陈述
高纯锗(HPGe)探测器是稀有事件搜索的核心,特别是针对76Ge中无中微子双β衰变(0νββ)的搜索(例如 LEGEND 实验)。尽管这些探测器提供了卓越的能谱分辨率和固有纯度,但它们仍易受背景事件的影响。一个具体的挑战是剔除由表面污染物(如210Po和226Ra)发射的α粒子。如果这些发射体位于探测器薄的p+接触面上,α粒子可能会在活性体积内沉积其能量的一部分,产生可能模仿Qββ值(2039 keV)附近感兴趣区域(ROI)的信号。
标准的脉冲形状甄别(PSD)技术能够有效区分单点事件(SSE,类信号)与多点事件(MSE,类背景的γ射线)。然而,α事件通常也呈现 SSE 特征,这使得利用基于γ射线的标准 PSD 截断难以将其剔除。此外,在低背景实验中,整个实验寿命内观测到的α事件总数往往过少,无法专门训练用于α剔除的分类器。本研究解决的核心问题是:仅基于高统计量γ射线数据(SSE 与 MSE)训练的 PSD 分类器,是否能够在不需要专门α训练数据的情况下,有效地识别并剔除α事件。
方法论
本研究利用了点接触型宽能区锗(BEGe)探测器。在表面进行了两次测量活动:
- 低统计量(LS): 使用209Po源(约 0.1 Bq),产生约1.36×105个α事件。
- 高统计量(HS): 使用210Po源(约 1 Bq),产生约1.87×106个α事件。
在这两次活动中,将沉积有钋的金箔直接放置在探测器的p+接触面上,以模拟表面污染。使用228Th源的校准运行提供了 PSD 分类器的训练数据。
研究调查了两种机器学习(ML)方法:
- 投影似然(PLK): 一种假设输入特征之间统计独立的朴素贝叶斯分类器。
- 多层感知机(MLP): 一种前馈人工神经网络,包含六个稠密层(维度:64-32-16-8-4-1),隐藏层使用 ReLU 激活函数,输出层使用 sigmoid 激活函数。
输入特征与训练:
- 输入由原始波形的上升沿上的 64 个点组成(当前最大值之前 32 个样本,当前最大值处 1 个样本,当前最大值之后 31 个样本)。
- 训练数据集构建自228Th校准运行,选择特定的能量区域来定义 SSE(双逃逸峰、康普顿边缘)和 MSE(单逃逸峰、全能量峰、多康普顿散射)类别。
- 测试了六种不同的训练配置(TC1–TC6),变化了用于定义 SSE 和 MSE 的具体峰位。
- 使用传统的 A/E(幅度/能量)分类器作为基准。
主要结果
分类器基于三个指标进行评估:SSE 存活率(信号效率)、MSE 剔除率(背景抑制)和α剔除因子。
- γ背景上的性能: 两种机器学习方法均成功分离了 SSE 和 MSE 事件。在双逃逸峰(DEP)上训练的配置通常优于在康普顿边缘(CE)上训练的配置。MLP 实现了>80%的 SSE 存活分数和<20%的 MSE 存活分数,与或超过了 GERDA 和 LEGEND 的先前结果。
- α剔除性能: 至关重要的是,仅基于γ数据训练的分类器表现出剔除α事件的强大能力。
- MLP: 实现了最佳的整体性能。对于 HS 运行(TC2 配置),在保持高信号效率的同时,实现了>2.71×104的α剔除因子(在 90% 置信水平下)。
- PLK: 同样有效,但在剔除因子的下限方面性能略低于 MLP。
- A/E: 传统的 A/E 方法显示出明显较弱的α剔除能力(因子约 54),光谱中仍可见残留的α峰。
- 波形分析: 研究观察到,α事件通常聚集在比信号带更低的 MLP 分数处。然而,一小部分α事件(约占总数的 1%)形成了一个次级簇,更靠近信号带,这可能是由于发生在接触面边缘附近的事件所致。尽管如此,最佳截断值在最大化品质因数(FoM)的同时,抑制了绝大多数α事件。
意义与主张
本文声称,利用仅源自γ事件的训练信息,可以实现 HPGe 探测器鲁棒的脉冲形状甄别。这一发现具有重要意义,因为它为下一代0νββ实验(如 LEGEND)提供了一种实用策略,在这些实验中,由于此类事件的稀有性,无法获得专门的α训练数据。
作者得出结论:
- 没有必要开发单独的、专门的α剔除分类器。
- 单个在γ数据上优化的 PSD 截断,可以同时高效地抑制多点γ背景和表面α背景。
- 对于这种双重目的的剔除,MLP 方法优于 PLK 和传统的 A/E 方法。
研究承认了局限性,包括表面测量条件(较高的μ子背景)和特定的探测器配置(两次活动之间更换了 JFET)。作者建议,在地下重复该实验将进一步降低背景,可能使α剔除因子达到105量级。
每周获取最佳 high-energy experiments 论文。
受到斯坦福、剑桥和法国科学院研究人员的信赖。
请查收邮箱确认订阅。
出了点问题,再试一次?
无垃圾邮件,随时退订。