No, no es un número telefónico local. Los números que aparecen en el titular representan el intervalo de muertes (entre 793 y 8,459) en toda la isla de Puerto Rico (identificado con el código de área 939) relacionados estadísticamente con el huracán María.
El estudio Mortality in Puerto Rico after Hurricane María, elaborado por un grupo de investigadores de la Universidad de Harvard apoyados por académicos de la Universidad Carlos Albizu, levantó reacciones volátiles en cuanto a las muertes que ocurrieron a partir del 20 de septiembre de 2017.
El estudio, publicado el 29 de mayo de 2018 en el New England Journal of Medicine, fijó nuevamente la vista de la prensa internacional en la Isla. El estimado de 4,645 muertes fue un número ofensivo para muchos sectores del país, particularmente dentro de las esferas gubernamentales.
Las críticas, burlas, sospechas y ofensas férreas hacia personas e instituciones afloraron rápidamente en la prensa local y redes sociales. Su conclusión “This house-hold based survey suggests that the number of excess deaths related to Hurricane Maria in Puerto Rico is more than 70 times the oficial estimate” (página 1) dejó claro la naturaleza y extensión del estudio. Sin embargo, esto quedó opacado dentro de la discusión político-partidista que permea y define todo el diario vivir de Puerto Rico.
Dos semanas más tarde, los datos oficiales del Gobierno de Puerto Rico validaron éste escenario estadístico. Más allá del dolor personal o la indignación colectiva, debemos aprovechar ésta experiencia para aprender y entender. Teóricamente, esto es parte de la degastada resiliencia que hemos escuchado continuamente en los pasados nueve meses. El manejo de las estadísticas es parte de los asuntos que debemos familiarizarnos. No son mágicas y su manejo no es exclusivo. Todos aplicamos principios estadísticos en lo que hacemos y pensamos diariamente.
En este momento es pertinente exponer algunos elementos básicos que están presentes en el estudio Mortality in Puerto Rico after Hurricane María. Para comenzar, no existe una forma universal para investigar. Las disciplinas que son denominadas como “ciencias” enfrentan cambios continuos en la forma de obtener información y crear conocimiento bajo el enfoque empírico. Independientemente de las vertientes que existen dentro de la investigación científica, el manejo cuantitativo es fundamental.
Sin embargo, existen dos tipos de razonamientos cuantitativos; el matemático y el estadístico. Este último se utiliza en investigaciones en donde existe desconocimiento, incertidumbre, información incompleta o simplemente no hay exactitud. En la estadística se estima, mientras que en las matemáticas se calcula. Son razonamientos diferentes, pero forman parte del andamiaje de crear conocimiento científico. Ambos son aceptados por la comunidad científica contemporánea. En el caso particular de los datos después del huracán María, los trabajos para cuantificar mortandad se basan en razonamiento estadístico.
Existen dos recorridos investigativos para trabajar estadísticamente; deductivo e inductivo. En el método inductivo se intenta entender toda una población mediante una muestra. La mirada deductiva surge del conocimiento de la población para poder entender un grupo en particular (por ésta razón, los censos poblacionales son importantes en las ciencias sociales). El método inductivo, para ser válido, tiene que ser representativo de todos los casos que aspira representar o “universo”.
En estadísticas, el concepto “universo” se refiere a la totalidad del espacio estadístico de la variable que se está considerando. El mismo puede ser finito o infinito. En el caso de Puerto Rico, la población total en la Isla constituye un “universo finito” (tiene límites cuantificables). Los trabajos que incluyen entrevistar a todo el “universo estadístico” tienden a ser costosos e irrealizables dentro de un corto periodo. Esta es la fase más crítica en el diseño metodológico. Por esta razón, en las investigaciones se opta por obtener una muestra representativa bien tomada. Hay cuatro formas básicas de muestrear una población; muestreo aleatorio, muestreo sistemático, muestreo estratificado y muestreo por conglomerados.
La segunda pregunta que aflora en todo diseño de una investigación estadística es el tamaño de la muestra. Para determinarlo es importante establecer el nivel de precisión o magnitud del error(E).
Si el valor E es pequeño, se implica que el estudio está dispuesto a tolerar un error pequeño en el estimado; si el valor E es grande, el nivel de precisión deseado es menor. Esta decisión está atada a la disponibilidad de recursos y tiempo para realizar la investigación. Generalmente, entre más grande es la muestra, mayor precisión y menor el error estándar del estimado.
Generalmente, dentro de las ciencias sociales, es necesario conocer la distribución muestral de la media y utilizar un nivel de confianza de 95%. La ecuación básica E = en donde Z es 1.96 (2 desviaciones estándar para un 95% de confianza), es la desviación estándar y n es el tamaño de la muestra deseada. Invirtiendo la ecuación, n=[(Z/E)]2. Esto demuestra que el tamaño de la muestra a ser obtenida dependerá del nivel de confianza deseado y por ende, mientras más grande es Z, más grande será n. Entre mayor precisión se desea, menor será E y, por tanto, también sería n. Finalmente, entre mayor variabilidad en la población, mayor será y, por tanto, mayor será n.
Los libros de estadística básica contienen tablas y gráficos con los tamaños de muestras necesarios para diferentes niveles de confianza.
En el caso particular del estudio sobre la mortandad por el huracán María, se diseñó un método de muestreo aleatorio. Es la forma más sencilla y son diseñadas bajo el principio básico de que todos los componentes del “universo estadístico” tienen la misma probabilidad (P) de ser seleccionado. Para esta tarea se utilizaron algoritmos o un mapa digital con puntos (lugares) en todas las regiones pobladas.
Posteriormente se seleccionaron varios puntos al azar dentro del mapa. Teóricamente, cada lugar tenía la misma probabilidad de ser seleccionado, lo que valida el principio de representatividad de la muestra. Existen muchas maneras para realizar ésta tarea y mantener los principios de representatividad de todo el universo estadístico. Para el estudio se utilizó la variable censal de household (hogares).
Inicialmente, se seleccionaron 3,299 hogares para realizar la encuesta. De éstos, se reportaron 38 muertos en tres meses después del huracán. Una gran cantidad de las muertes (23) reportadas no estaban, según la opinión de los encuestados, relacionadas con el evento. Desde este escenario es que comienza la estadística inferencial.
Uno de los grandes retos del razonamiento estadístico es la construcción de relaciones entre variables. Muchos estudios utilizan correlaciones (r) como el método de explicar comportamientos entre eventos. Sin embargo, las correlaciones (Pearson o Spearman) son asociaciones estadísticas que no demarcan causa y efecto mejor conocido como variables dependientes (Y) y variables independientes (X).
Inclusive, la posibilidad de explicar, estadísticamente, un elemento de causalidad descansa en los modelos de regresión. En éste último, siempre existirá un margen de no poder explicar la relación causal entre variables. Las correlaciones y regresiones comúnmente utilizadas en las estadísticas siempre dejan un margen a la discusión sobre las verdaderas relaciones de causa y efecto entre variables. Esto aplica en la relación entre la mortandad y el huracán María. Es solo una relación estadística frente a un evento de poca información y mucha incertidumbre.
En la estadística inferencial existen dos formas de construir estimados; por punto o por intervalo. Los estadísticos utilizaron estimación por intervalo para describir el “universo” estadístico con la muestra realizada (n=3299). Una de las formulas más comunes para estimar por intervalo es en donde es el error estándar del estimado y 1.96 corresponde a la región crítica de la curva normal usando .05 y una prueba de dos colas. En el caso particular de la mortandad generada por María, el intervalo fue estimado entre 793 y 8,458.
Las interpretaciones sobre los estimados se basan, hasta el momento, en lecturas erráticas. Hay que hacer notar que el valor de 4,645 es un valor promedio entre los intervalos. Sin embargo, la lectura del estadístico debe mantenerse entre los intervalos y no se debe utilizar el valor central entre éstos. Por consiguiente, se debió utilizar “793-8,458” en vez de “4,645”.
Todo trabajo estadístico está abierto a cambios y ajustes en los supuestos utilizados. La verdadera evaluación del 793-8,458 debe comenzar por una mirada a la descripción de la selección de la muestra. Los investigadores deben, como parte de sus tareas técnicas, explicar detalladamente la construcción de la muestra, pues es la raíz de todo el árbol investigativo.
Posteriormente, hay que explicar las razones del tamaño de la muestra. En ésta última, los argumentos de tiempo y dinero son comúnmente utilizados para explicar el tamaño de n.
Por último, hay que dejar claro, en el caso de estimaciones, si las mismas son puntales o intervalos y las razones para utilizar una estimación sobre la otra. La ausencia o la falta de discusión de un memorial explicativo de las decisiones técnicas elevó los argumentos, con crisoles de la política partidista colonial, sobre la mortandad a partir del huracán María.
Todos tenemos inquietudes y hemos asumido posiciones en cuanto a la mortandad generadas por María. Lamentablemente, nunca tendremos un valor exacto. Para unos, el estimado 4,645 es demasiado para ser omitido y para otros es extremadamente exagerado. No es un estimado neutro. Al final, los intervalos de todos los estudios estadísticos van a coincidir y se validarán unos a otros. Infaliblemente, los intervalos mínimos serán más allá de las 64 muertes oficiales.
Mirar a los eventos del 20 de septiembre como punto de partida, puede ser válido estadísticamente pero no se adapta a la realidad que vivimos en la Isla durante esa fecha. Todo análisis sobre daños debe incorporar el huracán Irma ocurrido semanas antes de María. Días antes de María 855,000 clientes de las Autoridad de Energía Eléctrica (AEE) no tenían servicio y 250,000 abonados de la Autoridad de Acueductos y Alcantarillados (AAA) no tenían agua. Entre 25 y 30 municipios estaban en proceso de ser declarados “zonas de desastre”
Irma debilitó al país. Muchos de los recursos locales fueron destinados a las Antillas Menores semanas antes que fueran necesarios en Puerto Rico. La limitada ayuda externa quedó diluida en el Caribe y el sur de los Estados Unidos (particularmente en Texas y Florida).
Muchas muertes asociadas a la falta de servicios, infraestructura, equipo y materiales pudieron ser resultado de ésta fragmentación. El 939 (Puerto Rico) y el estimado de muertes (793-8,458) son un producto estadístico asociado con dos sistemas naturales y una respuesta gubernamental fraccionada en varias frentes de intervención.
El Caribe es una región de probabilidades, alto grado de incertidumbre con grandes márgenes de error. La probabilidad (P) de enfrentar nuevamente un huracán o sistema de huracanes es mayor que la llegada de la estadidad, independencia o cualquier otra fórmula genuina de descolonización. ¿Qué vamos hacer? ¿Cómo nos vamos a organizar? ¿Seguir opinando por las redes sociales? ¿Huir de la isla? ¿Exigir una solución omnipotente? ¿Seguiremos jugando en la política partidista local? ¿Esperar que alguien haga algo?…. es solo una probabilidad.