原作者： Glozah, F. N., Maya, E., Guure, C., Sonalkar, S., McAllister, A., Doe, R., Kaire, J., Gaffield, M. E.

发布于 2026-03-17

📖 1 分钟阅读☕ 轻松阅读

原作者： Glozah, F. N., Maya, E., Guure, C., Sonalkar, S., McAllister, A., Doe, R., Kaire, J., Gaffield, M. E.

原始论文根据 CC0 1.0（https://creativecommons.org/publicdomain/zero/1.0/）发布到公有领域。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

这篇研究论文就像是一次**“翻译与测试”的大工程，目的是把一套原本在“西方发达国家”使用的医疗评估工具**，成功“本地化”并适配到加纳的医疗环境中。

为了让你更容易理解，我们可以把这项研究想象成把一套昂贵的“瑞士军刀”带到非洲丛林里，看看它好不好用，以及是否需要改装一下才能切得动当地的木头。

以下是用通俗语言和比喻对这篇论文的解读：

1. 背景：为什么要做这件事？

原来的工具（瑞士军刀）： 研究人员手里有一套现成的问卷（AIM, IAM, FIM），用来评估医生或护士觉得某项医疗工作“好不好接受”（Acceptability）、“合不合适”（Appropriateness）和“能不能做”（Feasibility）。这套工具在欧美国家很好用。
新的环境（非洲丛林）： 在加纳，助产士和护士们正在尝试一种新方法：一边给刚生完宝宝的妈妈做产后避孕咨询，一边使用世界卫生组织（WHO）的手机 APP来辅助判断哪种避孕方式最安全。
问题： 直接把欧美的问卷扔给加纳的护士填，就像给习惯了用砍刀的当地人发一把精密的瑞士军刀。虽然刀还是那把刀，但大家可能觉得手感不对，或者有些词（比如“合适”、“可行”）在加纳的医院里意思不一样。

2. 过程：他们是怎么做的？（两步走）

第一步：听故事（定性研究 - 焦点小组）

研究人员先找了 18 位加纳的助产士和护士，开了三个“聊天会”（焦点小组）。

比喻： 就像厨师在发明新菜前，先问问当地食客：“你们觉得‘好吃’是什么意思？是辣一点好，还是软一点好？”
发现： 护士们说，所谓的“可行（Feasible）”，对他们来说不仅仅是“能做”，而是“在忙得脚不沾地的情况下，不用网也能用，步骤别太繁琐”。所谓的“合适（Appropriateness）”，意味着“能帮我把话讲清楚，别让我在病人面前出丑”。
行动： 根据这些反馈，研究人员把原本生硬的问卷题目，改成了加纳护士们平时说话的口吻，甚至增加了一些新题目，让问卷更接地气。

第二步：大考（定量研究 - 问卷调查）

改好问卷后，研究人员在 3 家医院找了 150 位真正用过那个手机 APP 的护士，让他们填这份**“加纳特制版”**问卷。

比喻： 这就像是一场大考，看看改过后的“瑞士军刀”能不能真的切开加纳的木头，而且切得整齐不整齐。

3. 结果：考得怎么样？

内部一致性（刀锋够不够锋利）：
- 结果显示，这套改过的问卷非常靠谱。护士们的回答很一致，说明大家对这个概念的理解是统一的。就像一把刀，大家摸起来都觉得顺手。
结构验证（刀是不是真的由三部分组成）：
- 研究人员用复杂的数学模型（统计软件）来测试，发现问卷确实分成了三个清晰的板块：接受度、合适度、可行性。
- 关键点： 原本只有 4 道题的“原版”问卷，在加纳水土不服，考分不高。但是，经过**“加纳化改装”**（增加了题目，改了措辞）后的问卷，考分非常高，完美契合当地情况。
预测能力（能不能预判未来）：
- 问卷分高的护士，确实更倾向于说：“我喜欢在这个有咨询和 APP 的地方工作”或者“这个 APP 不会拖慢我的速度”。这说明问卷真的测出了护士们真实的想法。

4. 一个有趣的发现：少即是多？

虽然加长的“改装版”问卷（题目很多）很准确，但研究人员发现，精简版（只保留最核心的几道题）反而在区分不同概念时表现得更完美。

比喻： 就像一把多功能刀，虽然加了 10 个新功能很酷，但有时候只保留最核心的 3 个功能（开瓶、切肉、锯木头），反而最顺手、最好用。
结论： 他们建议，以后在类似的环境下，可以用精简版的问卷，既省时间，又准确。

5. 总结：这对我们意味着什么？

这项研究告诉我们：

不能生搬硬套： 在医疗领域，把西方的评估工具直接搬到发展中国家（如加纳）往往行不通，必须经过**“文化翻译”**。
本地化很重要： 只有让当地医护人员觉得“这说的就是我心里的话”，评估工具才有效。
数字医疗有希望： 加纳的助产士们不仅能接受，而且觉得用手机 APP 辅助避孕咨询是可行且合适的。这为未来在资源匮乏地区推广数字医疗工具打下了信心基础。

一句话总结：
研究人员把一套西方的“医疗体检表”，根据加纳助产士的“方言”和“工作习惯”进行了彻底改造和测试，证明这套**“加纳特制版”体检表**非常精准，能帮我们更好地了解如何在资源有限的地方推广更好的母婴健康服务。

加纳助产士与护士家庭计划干预措施中接受度、适宜性与可行性量表的跨文化适应及心理测量评估：技术总结

1. 研究背景与问题 (Problem)

实施科学（Implementation Science）依赖于对早期实施结果（如接受度、适宜性、可行性）的准确测量。然而，在发达国家开发的测量工具（如 Weiner 等人开发的 AIM、IAM 和 FIM 量表）直接应用于不同卫生系统（特别是中低收入国家）时，往往面临跨文化效度不足的问题。

具体挑战：在产后家庭计划（PPFP）背景下，咨询流程、工作负荷和服务组织的差异意味着未加调整的量表可能无法捕捉到服务提供者的真实体验。
研究缺口：缺乏针对加纳助产士和家庭计划护士在提供一对一咨询及使用世界卫生组织（WHO）医学 eligibility 标准（MEC）移动应用程序（App）时的接受度、适宜性和可行性量表的跨文化适应与心理测量验证。

2. 研究方法 (Methodology)

本研究采用顺序探索性混合方法设计（Sequential Exploratory Mixed Methods Design），分为定性与定量两个阶段。

2.1 研究设置与对象

地点：加纳大阿克拉区和东部地区的六家医院。
对象：助产士和家庭计划护士（排除实习生和轮转护士）。
干预措施：
1. 基于国家指南的一对一产后家庭计划咨询。
2. WHO 医学 eligibility 标准（MEC）移动应用程序（用于指导避孕方法 eligibility 判断）。

2.2 定性阶段（文化适应）

方法：在 3 家医院进行了 3 场焦点小组讨论（FGD），共 18 名参与者。
过程：
- 探索当地语境下对“接受度”、“适宜性”和“可行性”的理解。
- 基于 FGD 发现，对原始量表（AIM, IAM, FIM）进行文化适应和条目修订（例如，将“可行性”具体化为“在正常临床工作中是否可操作”）。
- 由专家（家庭计划研究员及资深提供者）审查修订后的条目，确保清晰度和相关性。
- 产出：形成了扩展版的适应后量表（咨询干预：接受度 12 项、适宜性 7 项、可行性 8 项；MEC App：接受度 13 项、适宜性 7 项、可行性 7 项）。

2.3 定量阶段（心理测量评估）

样本：150 名在 MEC App 试点医院工作的助产士/护士。
工具：使用 REDCap 电子收集数据。
统计分析：
- 信度：Cronbach's $\alpha$ 系数。
- 效度：
  - 探索性因子分析（EFA）与验证性因子分析（CFA/SCFA），使用结构方程模型（SEM）和最大似然估计。
  - 拟合指标： $\chi^2/df$ , CFI, TLI, RMSEA, GFI, NFI, NNFI。
  - 聚合效度（Convergent Validity）：平均方差抽取量（AVE $\ge$ 0.50）、组合信度（CR $\ge$ 0.70）。
  - 区分效度（Discriminant Validity）：比较 AVE 平方根与构念间相关系数。
  - 预测效度（Predictive Validity）：Pearson 相关分析，检验量表得分与提供者偏好（如“是否愿意在有咨询的机构工作”）及效率感知（如"App 是否拖慢工作”）之间的关系。

3. 主要结果 (Key Results)

3.1 信度 (Reliability)

适应后的量表显示出极强的内部一致性。
一对一咨询：接受度 ( $\alpha$ =0.90), 适宜性 ( $\alpha$ =0.82), 可行性 ( $\alpha$ =0.87)。
MEC App：接受度 ( $\alpha$ =0.93), 适宜性 ( $\alpha$ =0.86), 可行性 ( $\alpha$ =0.90)。
这些数值与原始量表的信度相当或略高。

3.2 因子结构与模型拟合 (Factorial Validity)

原始四条目模型：直接应用原始结构导致模型拟合度差（CFI < 0.80, RMSEA > 0.10），表明原始结构无法准确反映加纳提供者的回答模式。
适应后多条目模型：经过修正（如关联误差项）后，模型拟合度显著改善。
- 咨询模型： $\chi^2/df$ =1.62, CFI=0.96, TLI=0.95, RMSEA=0.06。
- App 模型： $\chi^2/df$ =2.04, CFI=0.88, TLI=0.87, RMSEA=0.08。
结果支持接受度、适宜性和可行性作为单维构念的假设。

3.3 效度 (Validity)

预测效度：
- 咨询干预的得分与“偏好在有咨询的机构工作”呈显著正相关。
- MEC App 的得分与“认为 App 会拖慢工作”呈显著负相关。
聚合与区分效度：
- 关键发现：虽然扩展版（多条目）量表信度高，但只有精简版（Abridged versions）（即保留原始核心条目：接受度 4 项、适宜性 3 项、可行性 3 项）在聚合效度和区分效度上表现完美。
- 扩展版中的部分新增条目虽然增加了文化相关性，但在统计上削弱了构念的区分度，导致区分效度未完全达标。

4. 关键贡献 (Key Contributions)

方法论创新：展示了在资源匮乏的中低收入国家（LMIC）背景下，通过“定性探索 + 定量验证”的混合方法对实施结果量表进行跨文化适应的完整流程。
实证证据：提供了 AIM、IAM 和 FIM 量表在加纳助产士群体中评估产后家庭计划及数字健康工具（mHealth）的可靠性和结构效度证据。
测量学启示：
- 证实了跨文化适应对于确保概念等价性至关重要。
- 重要发现：在适应过程中，增加条目以提高文化相关性并不总是能增强心理测量性能。相反，保留原始核心条目的精简版在保持强构念效度（特别是区分效度）方面优于扩展版。这强调了在“情境适应性”与“测量结构稳定性”之间取得平衡的重要性。
实践应用：为加纳及类似环境中的实施科学评估提供了经过验证的工具，支持了对数字健康干预措施（如 MEC App）的评估。

5. 研究意义与局限性 (Significance & Limitations)

意义

实施科学：填补了 LMIC 背景下实施结果测量工具验证的空白，证明了经过适当适应的工具可以跨越文化和卫生系统差异有效使用。
政策与临床：支持在加纳推广产后家庭计划咨询和 MEC App 的使用，因为工具已证明能有效区分提供者的感知差异。
未来方向：为其他生殖健康干预措施在类似环境中的评估提供了可复制的模型。

局限性

样本代表性：仅限加纳特定地区的助产士，结果推广至其他医疗专业人员或地区需谨慎。
方法学限制：
- 未进行正式的认知访谈（Cognitive Interviewing）和定量内容效度指数（CVI）计算。
- 使用同一组样本进行 EFA 和 CFA，缺乏独立的交叉验证样本。
- 未进行重测信度（Test-retest reliability）评估。
- 依赖自我报告数据，可能存在社会期许偏差。
视角单一：仅关注提供者视角，未纳入患者（产妇）的体验。

结论

本研究成功将 AIM、IAM 和 FIM 量表跨文化适应并验证用于加纳的产后家庭计划场景。研究结果表明，虽然扩展版量表具有高信度，但**精简版（保留原始核心条目）**在构念效度（特别是区分效度）上表现更佳。这为在资源受限环境中评估实施结果提供了经过验证的、稳健的测量工具，并强调了在工具适应过程中平衡文化相关性与心理测量严谨性的重要性。

Cultural Adaptation and Psychometric Assessment of Acceptability, Appropriateness, and Feasibility Measures for Family Planning Interventions Among Midwives and Nurses in Ghana