Semi-Automated Identification of EKG and Trigger Artifacts in EEG Using ICA and Spectral Characteristics

⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一个名为 SENSI-EEG-Preproc-ICA-EKG-Trigger 的新工具，它就像是一个**“大脑信号的大扫除助手”**。

为了让你更容易理解，我们可以把整个研究过程想象成**“在一个嘈杂的派对上寻找并清理特定的噪音”**。

1. 背景：派对上的混乱（EEG 数据）

想象一下，科学家正在研究人脑的活动（EEG，脑电图）。这就像是在一个热闹的派对上，试图听清某个人在说什么。

大脑信号：是派对上你想听的那个“人声”。
干扰噪音：派对上有很多杂音，比如有人心跳声太大（EKG/心脏干扰），或者有人不断按门铃、闪光灯闪烁（DIN/触发器干扰）。这些噪音会混进录音里，让科学家听不清真正的大脑信号。

2. 之前的难题：人工筛选太累人

以前，科学家使用一种叫 ICA（独立成分分析） 的魔法技术，把混合在一起的“人声”和“噪音”拆分成一个个独立的“声音轨道”（就像把混音台里的每一轨声音单独拉出来）。

问题：拆开后，科学家得人工去听几百个轨道，判断哪一个是心跳声，哪一个是门铃声，哪一个是真正的大脑声。
痛点：这就像让你在一千个文件里找两个坏文件，既慢又容易看走眼，而且每个人找的标准还不一样。

3. 新工具：智能“噪音探测器”

作者开发了这个新模块，它就像一个**“智能噪音探测器”**，专门用来快速找出两种特定的“捣乱分子”：

A. 心脏捣乱分子 (EKG)

特征：心跳是有节奏的（咚 - 哒 - 咚 - 哒）。
探测方法：这个工具会像**“听节奏的乐评人”**一样，检查每个声音轨道。如果它发现某个轨道里有非常规律的“心跳节奏”（基频）以及随之而来的“和声”（谐波），它就会立刻标记：“嘿，这个轨道里混进了心跳声！”
比喻：就像在合唱团里，如果有人突然开始打拍子，虽然声音不大，但那个独特的节奏感会让它在一堆歌声中显得格格不入。

B. 门铃捣乱分子 (DIN/触发器)

特征：这是由电脑信号引起的，比如实验开始时电脑发出的“滴”声或闪光信号。它们通常像**“节拍器”**一样，以完全固定的频率重复出现。
探测方法：这个工具会像**“数数的小机器人”**，它知道实验信号是每隔多久响一次。它会检查声音轨道，看有没有在那些特定的时间点出现能量爆发。如果有，它就会标记：“这个轨道被门铃声污染了！”
比喻：就像你在听歌，但每隔 1 秒就有一个刺耳的“滴”声，这个工具能精准地抓住那个“滴”声的规律。

4. 工作流程：人机协作（半自动化）

这个工具最聪明的地方在于，它不直接替科学家做决定，而是充当一个**“精明的筛选员”**：

快速初筛：工具自动扫描所有轨道，根据上面的“节奏”和“规律”打分。
缩小范围：它不会把几百个轨道都推给科学家，而是只挑出最可疑的 3 个嫌疑犯。
人类确认：科学家会看到这三个嫌疑犯的“三证”：
- 头顶地图（声音是从哪里传出来的？）
- 波形图（声音长什么样？）
- 频谱图（声音的频率规律是什么？）
- 科学家看一眼，确认：“是的，这就是噪音，删掉它！”或者“不，这是大脑信号，留着它。”

5. 为什么这很重要？

快：以前要翻几个小时，现在几分钟就能锁定目标。
准：利用数学规律（频率和节奏）来锁定目标，比单纯靠眼睛看更客观。
透明：最后决定权还在人类手里，避免了机器误删重要的大脑信号。

总结

这就好比以前你要在一堆乱糟糟的衣物里（原始数据）手动挑出脏袜子（噪音），现在你有了一个**“智能洗衣助手”。它能先帮你把那些明显有污渍（心跳节奏）或沾了墨水（门铃信号）**的衣服挑出来，放在篮子里。你只需要最后看一眼篮子里的衣服，确认一下，然后按下“清洗”按钮即可。

这个工具让科学家能更专注于研究大脑，而不是把时间浪费在清理噪音上。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《Semi-Automated Identification of EKG and Trigger Artifacts in EEG Using ICA and Spectral Characteristics》（利用 ICA 和频谱特征半自动识别 EEG 中的 EKG 和触发伪影）的详细技术总结。

1. 研究背景与问题 (Problem)

在脑电图（EEG）预处理流程中，独立成分分析（ICA）是去除非神经活动（如眼动、肌肉活动、心脏活动等）的标准步骤。然而，ICA 分解后存在一个长期的瓶颈：人工识别并剔除伪影成分。

主观性与低效性：手动检查大量独立成分（IC）耗时且难以标准化。
特定挑战：
- 心脏伪影（EKG）：心脏活动可能分散在多个成分中，或者出现在方差较低（非主导）的成分中，仅凭肉眼观察高方差成分容易遗漏。
- 触发伪影（Trigger/DIN Artifact）：在 EGI/Net Station 等采集系统中，数字触发信号（TTL 脉冲）可能通过电缆耦合泄漏到 EEG 通道中。这种伪影在时域表现为事件锁定的瞬态，在频域表现为梳状谐波结构。
现有工具的局限：虽然已有工具（如 ICLabel, SASICA）辅助分类，但针对特定类型的 EKG 和触发伪影，缺乏结合特定频谱规则且能保留人工最终决策权的半自动化流程。

2. 方法论 (Methodology)

作者开发了一个名为 SENSI-EEG-Preproc-ICA-EKG-Trigger 的半自动化 MATLAB 模块。该模块的核心逻辑是：基于频谱特征的自动评分排序 + 交互式人工确认。

A. 核心工作流程

输入：经过滤波、坏道处理和 ICA 分解后的数据（ICA 成分的时间序列）。
自动检测与评分：
- 针对特定伪影类型，计算每个成分的频谱特征得分。
- 根据得分对成分进行排序，筛选出少量候选者（通常最多 3 个）。
交互式审查 (Review)：
- 用户通过专用界面审查候选成分。
- 界面同时展示三个视图：头皮拓扑图 (Scalp Topography)、时域活动 (Time-domain)、频域结构 (Frequency-domain)。
- 用户根据综合证据确认或修正分类（保留/剔除）。
输出：生成最终需要剔除的成分列表，用于数据重建。

B. 具体算法细节

1. EKG（心脏）伪影检测 (autoDetectEkg)

原理：心脏活动通常表现为生理频率范围内的基频（0.8-2.0 Hz）及其谐波。
步骤：
- 使用 Welch 方法计算功率谱密度 (PSD)。
- 在生理心率范围内搜索基频 $f_0$ 。
- 计算基频及其后续 $H$ 个谐波的局部信噪比 (Local Harmonic SNR)：即谐波峰值功率与周围邻域基线功率的比值。
- 综合评分：将所有谐波的 SNR 求和，得到复合分数。
- 标准化：使用稳健的中位数/MAD 变换将分数标准化，识别离群值（ $z > 5$ 为强候选， $z > 3$ 为次级候选）。

2. 触发/DIN 伪影检测 (autoDetectDIN)

原理：数字触发信号具有固定的重复周期 $T_{DIN}$ ，在频域产生特定的谐波梳状结构。
步骤：
- 基于已知的触发周期计算基频 $f_0 = 1/T_{DIN}$ 。
- 识别落在分析频带内的所有预期谐波频率。
- 计算谐波能量比：所有预期谐波频带内的总能量与周围基线能量的比值。
- 标准化：对能量比进行 Z-score 标准化，选取高 Z 分数的成分作为候选。

3. 用户界面 (UI)

提供 reviewEkgArtifactUI 和 reviewDINArtifactUI。
界面直观展示候选成分的拓扑图、时域波形和频谱。
红色标记表示建议剔除，绿色表示保留。用户点击即可切换状态，最终确认并保存结果。

3. 主要贡献 (Key Contributions)

专用半自动化模块：首次提供了针对 EKG 和触发（DIN）伪影的专用后 ICA 筛查工具，填补了通用分类器在特定场景下的不足。
频谱驱动的策略：
- 对于 EKG，利用谐波结构而非单纯的时域峰值检测，提高了对非主导成分和波形变异的鲁棒性。
- 对于 DIN，利用已知触发周期的谐波能量集中特性，精准定位数字干扰。
人机协作设计：不追求完全自动化的“黑盒”分类，而是通过自动评分缩小搜索空间，将最终决策权保留给人类专家，平衡了效率与可解释性。
开源生态：
- 发布了完整的 MATLAB 代码库（MIT 许可）。
- 提供了示例数据集（通过 Stanford Digital Repository 下载）。
- 包含详细的用户手册、示例脚本 (example.m) 和文档。

4. 结果与演示 (Results & Illustrative Analysis)

论文通过示例数据展示了模块的实际应用效果：

DIN 检测案例：自动识别出第 113 号成分具有典型的梳状谐波结构和头皮聚焦拓扑（通常在 Pz 附近），确认为触发伪影并剔除；其他候选成分（48 和 5 号）经人工确认被保留。
EKG 检测案例：
- 第 9 号成分显示出清晰的心跳波形和频谱谐波，被确认为 EKG 伪影。
- 第 33 号成分时域波形不明显，但频谱结构与心脏活动一致（可能对应心脏周期的较慢部分），经确认剔除。
- 第 48 号成分证据较弱，经人工判断后保留。
结论：该流程成功将原本需要检查所有成分的工作，缩减为仅审查少量高概率候选者，显著提高了效率，同时通过多视图展示确保了剔除决策的准确性。

5. 意义与局限性 (Significance & Limitations)

意义：

提升可重复性：通过标准化的评分规则和显式的审查界面，减少了人工判断的主观差异。
解决特定痛点：特别解决了心脏伪影可能隐藏在低方差成分中，以及触发伪影难以通过通用分类器识别的问题。
透明性：作为决策支持工具，它让研究人员清楚看到“为什么”某个成分被标记，便于文档记录和复现。

局限性：

依赖前置处理：模块的效果高度依赖于输入数据的质量（滤波、坏道处理、ICA 分解的质量）。如果 ICA 分离效果差，自动评分和人工审查都会失效。
参数适应性：当前的参数设置（如频率范围、窗口长度）是基于示例数据优化的，对于采样率或采集系统差异巨大的数据，可能需要调整。
DIN 检测的特定性：DIN 检测仅适用于已知触发周期且存在数字信号泄漏的场景，通用性不如 EKG 检测。
频谱重叠风险：在稳态诱发电位（SS-EP）实验中，如果刺激频率与触发频率的谐波重叠，可能会误删神经信号。

未来方向：

在更多不同实验室、不同采集硬件和预处理流程的数据集上进行广泛验证。
探索自适应参数选择算法。

总体而言，该论文提出了一种实用、透明且高效的半自动化解决方案，显著优化了 EEG 预处理中针对心脏和触发伪影的清洗流程。