Estimands and the Choice of Non-Inferiority Margin under ICH E9(R1)

Este artículo examina cómo la elección del estimando en ensayos de no inferioridad, particularmente bajo el marco ICH E9(R1), influye críticamente en la determinación del margen de no inferioridad, demostrando mediante simulaciones y ejemplos en gestión de peso que los márgenes históricos deben adaptarse a la estrategia específica de eventos intercurrentes para garantizar la validez de la constancia y la sensibilidad del ensayo.

Tobias Mütze, Helle Lynggaard, Sunita Rehal, Oliver N. Keene, Marian Mitroiu, David Wright

Publicado Thu, 12 Ma
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que quieres abrir una nueva cafetería en tu ciudad. Para tener éxito, necesitas saber si tu café es tan bueno como el de la cafetería más famosa y establecida de la zona. No necesitas que tu café sea mejor que el de ellos, solo necesitas demostrar que no es significativamente peor. A esto se le llama un "ensayo de no inferioridad".

Pero aquí está el problema: ¿Cómo decides qué tan "peor" es aceptable? ¿Es aceptable que tu café tenga un 5% menos de sabor? ¿O un 10%? Esa línea imaginaria que defines como "el límite aceptable" es lo que los científicos llaman margen de no inferioridad.

Este artículo trata sobre cómo dibujar esa línea de manera justa y precisa, especialmente cuando las reglas del juego han cambiado recientemente gracias a una nueva guía internacional (ICH E9(R1)).

Aquí te lo explico con analogías sencillas:

1. El problema de la "Lupa" (El Estimando)

Antes, cuando los científicos querían medir el efecto de un medicamento (o de tu café), simplemente miraban el resultado final promedio. Pero ahora, con las nuevas reglas, debemos definir exactamente qué estamos midiendo y qué hacemos si algo sale mal durante el experimento. A esta definición precisa se le llama estimando.

Imagina que estás midiendo la velocidad de un corredor:

  • Escenario A (Política de tratamiento): Mides la velocidad del corredor tal como fue, incluso si se tropezó, se cayó o tuvo que parar a atarse los zapatos. El resultado incluye todos esos tropiezos.
  • Escenario B (Estrategia hipotética): Mides la velocidad del corredor como si nunca se hubiera tropezado ni se hubiera atado los zapatos. Es decir, "¿qué tan rápido habría corrido si todo hubiera salido perfecto?".

La lección clave del artículo: El margen de no inferioridad (tu límite de "aceptable") depende totalmente de qué lupa estés usando.

  • Si usas la lupa del "Escenario A" (con tropiezos), el margen será uno.
  • Si usas la lupa del "Escenario B" (sin tropiezos), el margen será otro, porque el rendimiento "perfecto" es diferente al rendimiento "real".

El artículo advierte: No puedes usar el mismo margen para dos preguntas diferentes. Sería como comparar la velocidad de un corredor profesional en una pista de atletismo con la velocidad de un corredor amateur en un camino de tierra y esperar que el límite de "aceptable" sea el mismo. ¡No tiene sentido!

2. La Trampa de los "Viajeros del Tiempo" (Datos Históricos)

Para saber si tu nueva cafetería es buena, miras los datos históricos de la cafetería famosa. Pero, ¿qué pasa si esos datos antiguos fueron tomados con reglas diferentes?

El artículo usa dos ejemplos (como dos historias diferentes) para ilustrar esto:

  • Ejemplo 1 (El caso de los datos perfectos): Imagina que la cafetería famosa (el tratamiento de referencia) tiene un registro histórico muy detallado donde saben exactamente qué preguntas hacían y cómo manejaban los tropiezos.

    • El problema: Tu nueva cafetería quiere hacer una pregunta ligeramente diferente (quizás quieres ignorar los tropiezos, mientras que los datos antiguos los incluían).
    • La solución: Tienes que ser muy cuidadoso. No puedes simplemente copiar el margen antiguo. Tienes que calcular un nuevo margen que se ajuste a tu pregunta específica, incluso si eso significa que el margen cambia un poco. Es como ajustar la receta de tu café porque ahora usas una taza diferente, aunque el grano sea el mismo.
  • Ejemplo 2 (El caso de los datos borrosos): Imagina que la cafetería famosa tiene registros antiguos donde no escribieron bien qué hacían cuando alguien se caía. No hay una definición clara.

    • El problema: Tienes que adivinar (con mucha prudencia) qué significaban esos datos antiguos. ¿Incluían los tropiezos o no?
    • La solución: Tienes que revisar viejos diarios, mapas y testimonios (protocolos antiguos, diagramas de flujo) para reconstruir la historia. Tienes que hacer suposiciones transparentes: "Asumimos que en el pasado hacían X, por lo tanto, nuestro margen será Y". Si no haces esto, podrías estar comparando manzanas con naranjas y engañarte a ti mismo.

3. La Analogía de la "Sensibilidad de la Prueba"

El artículo habla de "sensibilidad del ensayo". Imagina que tienes una balanza muy sensible para pesar oro.

  • Si la balanza está calibrada para medir oro puro (datos antiguos), pero tú intentas medir una aleación de oro y cobre (tu nuevo estudio con reglas diferentes), la balanza podría fallar.
  • Si las reglas cambian demasiado (por ejemplo, si en el pasado la gente tomaba un medicamento de rescate y ahora no, o viceversa), la "historia" del medicamento de referencia deja de ser válida para tu nuevo estudio. Es como intentar usar un mapa de la ciudad de hace 50 años para navegar hoy; las calles han cambiado y el mapa ya no sirve.

Conclusión: ¿Qué nos dice esto?

  1. No hay una regla única: No puedes elegir un margen de no inferioridad (el límite de "aceptable") sin primero definir exactamente qué estás preguntando (el estimando).
  2. La historia importa: Para saber si tu nuevo tratamiento es bueno, necesitas mirar los datos antiguos. Pero esos datos antiguos deben haber sido medidos con la misma "lupa" que tú usas hoy. Si no, tienes que ajustar la comparación.
  3. Transparencia total: Si los datos antiguos son confusos (como en el Ejemplo 2), debes ser honesto y decir: "Estamos asumiendo esto porque no tenemos más información". No puedes ocultar las suposiciones.
  4. Colaboración: Los estadísticos y los médicos deben trabajar juntos. Los médicos entienden el "sabor del café" (el contexto clínico) y los estadísticos entienden cómo medirlo sin equivocarse.

En resumen: Este artículo es una guía para evitar que los científicos se equivoquen al comparar tratamientos nuevos con los antiguos. Nos dice que, para que la comparación sea justa, debemos definir muy claramente las reglas del juego antes de empezar, y asegurarnos de que las reglas de hoy sean compatibles con las reglas de ayer. Si no lo hacemos, podríamos aprobar un medicamento que en realidad no es tan bueno como creemos, o rechazar uno que sí lo es.