Jackknife inference with two-way clustering

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que eres un detective tratando de resolver un misterio: ¿Cómo afecta realmente una variable (como el salario mínimo o el clima) a otra (como los ingresos o el desarrollo)?

Para resolverlo, usas una herramienta matemática llamada "regresión". Pero hay un problema: tus datos no son una mezcla homogénea de personas; están agrupados. Tienes grupos de personas por país y por año, o por estado y por industria. A esto los economistas le llaman "agrupamiento en dos direcciones" (two-way clustering).

El problema es que las herramientas tradicionales que usamos para medir la certeza de nuestras conclusiones (los "errores estándar") a menudo fallan cuando los grupos son desiguales, hay muchos grupos vacíos o los datos son complejos. A veces, la herramienta se rompe y te da un error que dice: "No puedo calcular esto" o te da un resultado tan exagerado que parece mentira.

Aquí es donde entra este paper de MacKinnon, Nielsen y Webb. Vamos a explicarlo con analogías sencillas:

1. El Problema: La Balanza Rota

Imagina que tienes una balanza (tu modelo estadístico) para pesar la importancia de una variable.

El método antiguo (CV1): Es como usar una balanza de cocina barata. Si pones muchos objetos pesados en un lado y pocos en el otro, o si los objetos tienen formas raras, la balanza se desequilibra, se vuelve inestable y a veces te dice que el peso es negativo (¡imposible!) o que es infinito. En estadística, esto significa que tu "error estándar" no tiene sentido y tus conclusiones pueden ser falsas.
El síntoma: A veces, la balanza te dice que un efecto es "muy significativo" (¡Eureka!) cuando en realidad es solo ruido. Otras veces, te dice que no puedes calcular nada.

2. La Solución Vieja: "Parches"

Los investigadores anteriores intentaron arreglar la balanza rota de dos formas:

El parche de los "valores negativos": Si la balanza te da un número negativo, simplemente lo cambias por cero o un número muy pequeño. Es como decir: "Bueno, si la balanza está rota, asumamos que pesa un poco". Esto funciona, pero a veces te da resultados engañosamente grandes.
El parche de "ignorar una parte": Decir: "Vamos a ignorar la intersección entre los grupos y solo mirar los grupos grandes". Esto hace que la balanza sea más estable, pero a veces es demasiado conservadora (te dice que nada es importante cuando sí lo es).

3. La Gran Innovación: El "Jackknife" (La Navaja Suiza)

Los autores proponen una nueva herramienta llamada Jackknife de Agrupamiento.

La analogía del "Quitar y Poner": Imagina que tienes un equipo de 100 personas (tus datos) y quieres saber quién es el más fuerte. En lugar de medir a todos juntos, tomas al equipo, le quitas a una persona, mides al resto, anotas el resultado. Luego, le quitas a otra persona (y vuelves a poner la primera), mides de nuevo, y así sucesivamente.
¿Por qué es mejor? Al ver cómo cambia el resultado cuando quitas a cada grupo individualmente, obtienes una medida de la variabilidad mucho más real y robusta. No te fías de la "balanza" estática; te fías de cómo se comporta el sistema cuando lo "torturas" un poco quitando piezas.
En dos dimensiones: Ellos hicieron esto no solo quitando grupos de un lado (países), sino también del otro (años) y de las intersecciones (país-año). Es como tener tres navajas suizas trabajando a la vez para asegurar que la medida sea precisa.

4. El Truco del "Máximo" (Max-SE)

A veces, incluso con la navaja suiza, la balanza sigue siendo inestable. Entonces, proponen una regla de oro muy simple: Elige el error estándar más grande.

Imagina que tienes tres reglas para medir la misma mesa: una de madera, una de metal y una de plástico.
- La de madera te dice: "Mide 1 metro".
- La de metal te dice: "Mide 1.2 metros".
- La de plástico (que está rota) te dice: "Mide 0.5 metros" o "No sé".
La regla de los autores dice: "Si tienes dudas, usa la medida más grande (la más conservadora)". Si la regla de metal dice 1.2, usas 1.2. Esto evita que te ilusiones con resultados falsos. Es mejor ser un poco más cauteloso y decir "no estoy seguro" que decir "¡es un hecho!" cuando no lo es.

5. ¿Qué descubrieron en sus pruebas?

Hicieron miles de simulaciones (como jugar miles de veces a un videojuego con reglas diferentes) y descubrieron:

Los métodos antiguos a menudo mienten: dicen que hay un efecto cuando no lo hay (falsos positivos), especialmente si los grupos son de tamaños muy diferentes o hay muchos grupos vacíos.
Su nuevo método (Jackknife + Regla del Máximo) es mucho más honesto. A veces es un poco más conservador (dice que es menos probable que algo sea importante), pero cuando dice que algo es importante, realmente lo es.
Funciona incluso en casos difíciles: cuando hay pocos grupos, cuando los grupos son desiguales (como tener un estado gigante y otro pequeño) o cuando hay muchos datos faltantes.

6. Ejemplos Reales

El caso de la mosca tsetsé en África: Un estudio famoso decía que el clima para moscas destruía el desarrollo económico. Los autores re-analizaron los datos. Con el método antiguo, el resultado era muy fuerte. Con su nuevo método, la evidencia se debilitó un poco. No desapareció, pero dejó de ser "absolutamente segura". Es como si antes dijeras "¡Es 100% culpa de la mosca!" y ahora digas "Es muy probable, pero hay que tener cuidado".
El salario mínimo en Canadá: Un estudio decía que subir el salario mínimo aumentaba los ingresos. Los autores aplicaron su método y descubrieron que, con los datos reales y los grupos pequeños, la evidencia no era suficiente para afirmar eso con certeza. El método antiguo estaba "gritando" resultados que no se sostenían.

Conclusión

En resumen, este paper nos dice: "No confíes ciegamente en las herramientas estadísticas antiguas cuando tus datos están agrupados de formas complejas. Usa el método de 'quitar y poner' (Jackknife) y, si tienes dudas, elige la opción más conservadora (el error más grande)."

Han creado un software gratuito para Stata (llamado twowayjack) para que cualquier investigador pueda usar esta "navaja suiza" y evitar conclusiones falsas. Es como pasar de usar una brújula oxidada a usar un GPS de alta precisión en un terreno difícil.

Each language version is independently generated for its own context, not a direct translation.

Resumen Técnico: Inferencia Jackknife con Agrupamiento Bidimensional

1. El Problema

En modelos de regresión lineal con datos de sección cruzada o paneles, es común asumir que los errores están agrupados (clustered) en dos dimensiones (por ejemplo, por país y por año, o por industria y región). Aunque los estimadores de varianza robustos al agrupamiento bidimensional (CRVE, por sus siglas en inglés) son ampliamente utilizados, sus propiedades en muestras finitas son deficientes.

Los problemas principales identificados son:

No definida positiva: El estimador estándar de tres términos (propuesto por Cameron, Gelbach y Miller, 2011; Thompson, 2011) a menudo no es una matriz definida positiva en muestras finitas, lo que genera errores estándar indefinidos o estadísticos de prueba negativos.
Sesgo y fiabilidad: Incluso cuando se corrige la definición positiva (mediante descomposición espectral), los estadísticos de prueba pueden ser extremadamente grandes o engañosos. Además, los métodos convencionales (CV1) tienden a sobre-rechazar la hipótesis nula (tamaño de prueba incorrecto) cuando hay heterogeneidad en el tamaño de los grupos o efectos fijos.
Incertidumbre teórica: La teoría asintótica para el agrupamiento bidimensional es reciente, y el comportamiento en muestras finitas está menos comprendido que en el caso de agrupamiento unidimensional.

2. Metodología Propuesta

Los autores proponen una familia de nuevos estimadores basados en el Jackknife de Agrupamiento (Cluster Jackknife) y un procedimiento nuevo para manejar la indefinición de la matriz de varianza.

A. Solución al problema de la matriz no definida positiva (Procedimiento "Max-SE"):
Cuando el estimador de tres términos ( $\hat{V}^{(3)}_1$ ) no es definido positivo, los autores proponen un método simple y robusto:

Calcular tres estadísticos de Wald (o tres errores estándar para una restricción única):
- Basado en el agrupamiento bidimensional completo ( $\hat{V}^{(3)}_1$ ).
- Basado solo en la primera dimensión ( $\hat{V}_G$ ).
- Basado solo en la segunda dimensión ( $\hat{V}_H$ ).
Utilizar el estadístico que corresponda al mayor error estándar (o el menor estadístico de prueba positivo).
- Si $\hat{V}^{(3)}_1$ no es definido positivo, se ignora y se usa el máximo de los otros dos.
- Esto evita estadísticos de prueba negativos o artificialmente grandes, garantizando una inferencia conservadora y válida.

B. Nuevos Estimadores Jackknife Bidimensionales (CV3):
Extienden el estimador Jackknife de agrupamiento (análogo a HC3 en el caso unidimensional) a dos dimensiones. En lugar de usar la varianza de los residuos (CV1), calculan la varianza basándose en las variaciones de los estimadores $\hat{\beta}$ cuando se omite un grupo a la vez.

Se calculan tres componentes Jackknife: $\hat{V}^{JK}_G$ , $\hat{V}^{JK}_H$ y $\hat{V}^{JK}_I$ (para las intersecciones).
El estimador final de tres términos es: $\hat{V}^{(3)}_3 = \hat{V}^{JK}_G + \hat{V}^{JK}_H - \hat{V}^{JK}_I$ .
También se propone un estimador mixto ( $\hat{V}^{(3)}_{3,1}$ ) que combina componentes Jackknife con el estimador CV1 para la intersección, reduciendo costos computacionales cuando el número de intersecciones es muy grande.

C. Consistencia Asintótica:
Los autores demuestran teóricamente (Teorema 1) que bajo supuestos estándar (tamaños de grupos no degenerados, momentos finitos), los estimadores Jackknife bidimensionales son consistentes. A diferencia de los estimadores CV1, los estimadores Jackknife (CV3) no están sesgados hacia abajo, lo que los hace más robustos ante la heterogeneidad en los tamaños de los grupos.

3. Resultados Principales (Simulaciones)

Mediante experimentos de Monte Carlo extensivos, los autores comparan los métodos convencionales (CV1) con los nuevos métodos Jackknife (CV3) bajo diversas condiciones:

Variación en el tamaño de los grupos: Los métodos CV1 sufren severamente (sobre-rechazo) cuando los tamaños de los grupos varían mucho. Los métodos CV3 (especialmente la versión "Max-SE") mantienen un tamaño de prueba muy cercano al nominal (5%).
Correlación intra-grupo baja: Cuando la correlación es muy baja, los métodos de dos términos (CV(2)) y los métodos con corrección espectral (CV(3+)) tienden a sub-rechazar (falta de potencia). Los métodos CV3 Max-SE se comportan mejor.
Número de regresores: A medida que aumenta el número de regresores (especialmente efectos fijos), los métodos CV1 fallan drásticamente. Los métodos CV3 son mucho más robustos.
Intersecciones vacías: En datos empíricos reales, muchas intersecciones de los dos grupos están vacías. Los estimadores Jackknife manejan esto de manera razonable, mientras que los métodos tradicionales pueden volverse inestables.
Efectos Fijos Bidimensionales: En modelos con efectos fijos en ambas dimensiones, la inversión de matrices se vuelve problemática. El enfoque Jackknife, combinado con el uso de inversas generalizadas o la exclusión de efectos fijos específicos, permite una inferencia válida donde otros métodos fallan.

Conclusión de las simulaciones: La combinación del estimador CV3 (Jackknife) con el procedimiento Max-SE ofrece la inferencia más precisa y fiable en la gran mayoría de los escenarios, superando consistentemente a los métodos CV1 convencionales.

4. Aplicaciones Empíricas

Los autores aplican sus métodos a dos casos de estudio reales:

La mosca tsetsé y el desarrollo en África (Alsan, 2015):
- Agrupamiento por provincia cultural y país.
- Los métodos convencionales sugieren significancia estadística fuerte.
- Los métodos Jackknife (CV3 Max-SE) elevan los valores p, indicando que la evidencia es más débil de lo que sugerían los métodos tradicionales, aunque sigue siendo relevante para algunas variables.
Salarios mínimos en Canadá:
- Agrupamiento por año y provincia (pocos grupos: 12 años, 10 provincias).
- Los métodos convencionales indican un efecto significativo del salario mínimo.
- Las simulaciones de "placebo" (regresiones falsas) muestran que los métodos convencionales fallan estrepitosamente (tasas de rechazo del 15% al 89% en lugar del 5%).
- Los métodos Jackknife (CV3 Max-SE) producen tasas de rechazo de placebo cercanas al 5% y valores p no significativos (0.08), sugiriendo que no hay evidencia sólida de un efecto positivo del salario mínimo en este conjunto de datos.

5. Significado y Contribuciones

Solución Práctica: Presentan una solución simple (Max-SE) para el problema persistente de las matrices de varianza no definidas positivas en agrupamiento bidimensional.
Avance Teórico: Establecen la consistencia de los estimadores Jackknife bidimensionales y demuestran su superioridad en muestras finitas frente a los estimadores CV1.
Herramienta de Software: Desarrollan e implementan el paquete de Stata twowayjack, que facilita el cálculo de estos estimadores, proporciona diagnósticos de agrupamiento (como el número efectivo de grupos) y automatiza el procedimiento Max-SE.
Recomendación Empírica: Concluyen que, en la práctica, los investigadores deben abandonar los métodos CV1 estándar para agrupamiento bidimensional y adoptar los estimadores Jackknife (CV3) con el procedimiento Max-SE, especialmente cuando hay efectos fijos, pocos grupos o heterogeneidad en los tamaños de los grupos.

En resumen, el artículo proporciona un marco teórico sólido y herramientas prácticas para realizar inferencias estadísticas válidas en modelos de regresión con agrupamiento bidimensional, corrigiendo las deficiencias graves de los métodos estándar actuales.