
La Fisher Test, conocida también como la prueba exacta de Fisher, es una herramienta fundamental para analizar la asociación entre dos variables categóricas en tablas de contingencia 2×2. Aunque su nombre completa en inglés es «Fisher’s exact test», en la práctica suele referirse como Fisher Test o Prueba exacta de Fisher. Esta guía ofrece una visión clara, con ejemplos prácticos y recomendaciones de uso para investigadores, analistas y estudiantes que buscan entender cuándo y cómo aplicar correctamente esta prueba, además de comparar su uso con enfoques aproximados como la chi-cuadrado.
Qué es la Fisher Test y por qué importa
La Fisher Test es una prueba de independencia que evalúa si hay una asociación entre dos variables categóricas cuando el tamaño de la muestra es pequeño o cuando alguna celda de la tabla de contingencia 2×2 tiene recuentos bajos. A diferencia de pruebas basadas en aproximaciones asintóticas, como la chi-cuadrado, la Fisher Test es exacta: calcula la probabilidad de observar la distribución de recuentos dadas las margenes fijos, sin depender de supuestos grandes de tamaño muestral.
La relevancia de la Fisher Test en investigación científica es notable: en bioestadística, epidemiología, genética y medicina clínica, a menudo se manejan cohortes pequeñas o subgrupos dentro de un estudio. En estos casos, la Puntuación de p obtenida por la Fisher Test proporciona una medida fiable de la evidencia de una asociación entre tratamiento y resultado, o entre exposición y enfermedad, sin recurrir a estimaciones sesgadas por la baja frecuencia de observaciones en celdas específicas.
Fundamentos y formalidad de la prueba exacta de Fisher
La estructura básica de la prueba es una tabla de contingencia 2×2 con los siguientes recuentos:
| Resultado Yes | Resultado No | |
|---|---|---|
| Terapia Yes | a | b |
| Terapia No | c | d |
Las letras a, b, c y d representan los recuentos observados en cada celda. Los margenes de fila y columna se mantienen fijos durante el cálculo bajo la hipótesis nula de independencia.
La probabilidad de obtener una distribución específica de la tabla, dado los margenes fijos, se expresa con una distribución hipergeométrica. De forma compacta, para una tabla con a en la esquina superior izquierda, la probabilidad p de esa configuración es:
p = [(a+b choose a) (c+d choose c)] / (n choose a+c), donde n = a+b+c+d y «choose» denota el coeficiente binomial.
Para obtener el valor p de la Fisher Test en modo bidireccional (two-sided), se suman las probabilidades de todas las tablas cuya probabilidad sea igual o menor que la probabilidad observada. En modos unidireccionales (one-sided) se suman únicamente aquellas tablas que favorecen la dirección de la hipótesis alternativa.
Fisher Test: enfoque paso a paso
- Determinar una tabla 2×2 con recuentos a, b, c, d y calcular los margenes r1=a+b, r2=c+d, c1=a+c, c2=b+d.
- Calcular la probabilidad p de la tabla observada usando la fórmula de la distribución hipergeométrica.
- Generar todas las tablas posibles que respeten los margenes fijos y calcular sus probabilidades.
- Sumar las probabilidades de las tablas con probabilidad menor o igual a la observada para obtener el p-value.
Cuándo usar la Fisher Test
Casos típicos en biología y medicina
La fisher test es especialmente recomendable cuando:
- La muestra es pequeña y/o alguna celda de la tabla 2×2 tiene recuentos menores de 5.
- Se desea evitar la dependencia de aproximaciones asintóticas que podrían fallar con tamaños pequeños.
- Se quiere evaluar la independencia entre un tratamiento y un resultado binario (p. ej., respuesta clínica: sí/no) en grupos pequeños.
Tablas 2×2 y datos discretos
Cuando se trabajan con conteos discretos y márgenes fijos, la Fisher Test ofrece una evaluación exacta de la asociación. En estudios de diagnóstico, genómica o ensayos clínicos con subpoblaciones, la exhaustividad de la Fisher Test es una ventaja frente a aproximaciones que podrían subestimar o sobreestimar la significancia en muestras limitadas.
Diferencias entre la Fisher Test y la chi-cuadrado
La prueba de chi-cuadrado de independencia es popular por su simplicidad y por funcionar bien con grandes tamaños muestrales. Sin embargo, sus supuestos incluyen recuentos esperados razonablemente grandes en cada celda (usualmente al menos 5). En tablas 2×2 con frecuencias bajas, la prueba de chi-cuadrado puede producir p-values sesgados, lo que podría conducir a conclusiones erróneas.
La Fisher Test, al ser exacta, no depende de esa aproximación. Por ello, cuando se dispone de una muestra pequeña o de celdas con recuentos bajos, la Fisher Test es la opción preferente para evitar errores de inferencia.
Interpretación de resultados de la Fisher Test
La interpretación se centra en el p-value obtenido y en el tamaño del efecto. Un p-value bajo (habitualmente < 0.05) indica evidencia suficiente para rechazar la hipótesis nula de independencia entre las variables, sugiriendo una asociación entre la variable de exposición y la variable de resultado. Sin embargo, el p-value no cuantifica la magnitud del efecto por sí solo.
Para entender la magnitud del efecto, suele acompañarse la Fisher Test con medidas como la odds ratio (OR). En un análisis 2×2, OR = (a*d)/(b*c). Un OR grande sugiere una asociación fuerte entre la exposición y el resultado (en el caso de una celda de interés), mientras que un OR cercano a 1 indica independencia o una asociación débil.
Ejemplo práctico: si una tabla tiene a=8, b=2, c=1, d=9, la OR sería 36, lo que indica una asociación considerable entre la exposición y el resultado. La Fisher Test confirmaría si esa asociación es estadísticamente significativa dada la distribución observada y sus margenes.
Ejemplo práctico: interpretación paso a paso
Consideremos una tabla 2×2 con los siguientes recuentos:
| Resultado Yes | Resultado No | |
|---|---|---|
| Terapia Yes | 8 | 2 |
| Terapia No | 1 | 9 |
Margenes: r1 = 10 (Terapia Yes), r2 = 10 (Terapia No); c1 = 9 (Resultado Yes), c2 = 11 (Resultado No); n = 20.
Probabilidad de la tabla observada bajo la hipótesis nula se obtiene con p = [(a+b choose a) (c+d choose c)] / (n choose a+c) = [(10 choose 8) (10 choose 1)] / (20 choose 9) = (45 * 10) / 167960 ≈ 0.0027. En modo two-sided, la Fisher Test sumará las probabilidades de todas las tablas con probabilidad menor o igual a 0.0027 para obtener el p-value final. En este caso, el p-value será cercano a 0.003, sugiriendo evidencia significativa de una asociación entre la terapia y el resultado.
Interpretación: existe una asociación significativa entre la terapia administrada y el resultado observado, con un tamaño del efecto grande (OR ~ 36). Es importante considerar el contexto clínico y la plausibilidad biológica al interpretar estos resultados.
Fisher Test: supuestos, alternativas y recomendaciones
Supuestos básicos
- La tabla 2×2 está condicionada por los márgenes fijos (las sumas de filas y columnas se consideran constantes).
- Los datos son recuentos discretos de eventos observados en cada celda.
- Las observaciones son independientes entre sí.
Cuándo elegir alternativas
- Si la muestra es grande y todas las celdas cumplen con recuentos esperados altos, la prueba de chi-cuadrado puede ser una alternativa rápida y fácil.
- En diseños complejos (más de dos grupos o tablas mayores), pueden requerirse pruebas exactas o modelos de regresión que manejen tablas mayores.
- Si la dirección de la hipótesis es muy específica, se puede considerar una prueba de una cola (one-sided) en la Fisher Test.
Herramientas y recursos para realizar la Fisher Test
La Fisher Test está implementada en múltiples lenguajes y herramientas estadísticas. A continuación, ejemplos prácticos para realizarla en software comunes:
- R: usar
fisher.testcon una matriz 2×2. - Python: usar
scipy.stats.fisher_exactpara tablas 2×2, con opciones de alternative como ‘two-sided’, ‘less’ o ‘greater’. - Excel: no tiene una función directa para Fisher Test; se pueden calcular p-values mediante funciones de distribución hipergeométrica o complementos estadísticos.
- SPSS/SAS: ofrecen procedimientos para tablas de contingencia y pueden ejecutarse tests exactos en módulos avanzados o con sintaxis específica.
Ejemplos de implementación:
En R, para la tabla de ejemplo anterior:
m <- matrix(c(8, 2, 1, 9), nrow = 2, byrow = TRUE)
fisher.test(m)
En Python, usando scipy:
from scipy.stats import fisher_exact
table = [[8, 2], [1, 9]]
oddsratio, pvalue = fisher_exact(table, alternative='two-sided')
Interpretación y reporte de resultados
Al comunicar los resultados de la Fisher Test en un informe o artículo científico, es útil incluir:
- La tabla de contingencia 2×2 con los recuentos observados (a, b, c, d).
- La margenes de fila y columna y el tamaño de la muestra total.
- El p-value obtenido y la decisión de acceptar o rechazar la hipótesis nula.
- La medida de efecto asociada, como el odds ratio y su intervalo de confianza, si está disponible.
- Notas sobre si la prueba fue una-sided o two-sided y la justificación del enfoque.
Un informe claro podría verse así: “Se encontró una asociación significativa entre la intervención y el resultado (Fisher Test, p = 0.003). El odds ratio fue 36 (IC 95%: 4.1–320, aproximación), sugiriendo un fuerte efecto de la intervención sobre el resultado.”
Ventajas y limitaciones de la Fisher Test
- Ventajas:
- Proporciona p-values exactos sin depender de tamaños de muestra grandes.
- Funciona bien para tablas 2×2 con recuentos bajos y márgenes fijos.
- Limitaciones:
- La complejidad computacional crece con tablas más grandes, pero para 2×2 es prácticamente instantánea con herramientas modernas.
- En ausencia de una diferencia real, el p-value puede ser difícil de interpretar cuando los márgenes son muy desbalanceados.
Conclusión: cuándo y cómo aplicar la Fisher Test de manera eficaz
La Fisher Test es una herramienta poderosa y exacta para evaluar asociaciones en tablas 2×2 cuando el tamaño de la muestra es pequeño o cuando hay celdas con recuentos bajos. Al aprovechar su propiedad de exactitud, los investigadores pueden evitar las distorsiones que a veces introducen las pruebas basadas en aproximaciones. En el ecosistema de análisis moderno, la Fisher Test se integra de forma natural en R, Python y otras plataformas, permitiendo un flujo de trabajo ágil desde la exploración de datos hasta la interpretación de resultados y su reporte en publicaciones científicas.
Recuerde siempre complementar la Fisher Test con una evaluación del tamaño del efecto (odds ratio u otras medidas) y con una lectura crítica del diseño del estudio, ya que la interpretación estadística debe enmarcarse en la biología o la pregunta de investigación. Con estas pautas, la fisher test y su versión correcta en inglés, Fisher’s exact test, pueden convertirse en una parte estable de su caja de herramientas analítica, brindando conclusiones rigurosas y replicables.
Recursos prácticos para profundizar
- Guías rápidas de interpretación de la Fisher Test para tablas 2×2.
- Ejercicios con datos simulados para practicar la obtención de p-values exactos.
- Comparativas entre Fisher Test y pruebas asintóticas en escenarios de diferentes tamaños de muestra.
Explorar estas ideas y practicar con conjuntos de datos reales permitirá dominar la fisher test, entender su alcance y comunicar resultados con claridad y rigor.