Errores y aciertos de los gráficos que mostró Alberto Fernández
- El Presidente anunció el último viernes en conferencia de prensa la extensión del aislamiento social, preventivo y obligatorio hasta el 26 de abril.
- Su discurso fue respaldado por una serie de gráficos que generaron confusión y críticas. En esta nota, analizamos la información presentada desde la perspectiva de un bioestadístico.
- Si bien resulta destacable el uso de datos y visualizaciones en una comunicación del Presidente a la cuidadanía, es imprescindible que los mismos sean generados con el máximo nivel de rigurosidad.
El presidente de la Nación, Alberto Fernández, anunció el último viernes en conferencia de prensa la extensión del aislamiento social, preventivo y obligatorio hasta el 26 de abril. Su discurso fue respaldado por una serie de gráficos que generaron confusión y críticas. En esta nota, analizamos la información presentada desde la perspectiva de un bioestadístico.
El primer gráfico que mostró Fernández corresponde a casos confirmados, recuperados y fallecidos por la enfermedad COVID-19. El eje horizontal representa los días desde el primer caso (el día 0 corresponde al 3 de marzo) y el eje vertical corresponde al número de casos confirmados. Cada curva representa el total de casos acumulados a la fecha. Es importante resaltar que se visualizan los casos confirmados de coronavirus, mientras que el número total de casos podría ser mayor.
A primera vista, llama la atención que la fuente utilizada para construir el gráfico no son los datos oficiales del Ministerio de Salud de la Nación, sino que parecería ser que provienen de la página Worldmeters.info. Esto se puede ver porque el día 25 (que corresponde al 27 de marzo) se repite el valor del día anterior (589 casos), mientras que el reporte diario oficial del Ministerio de Salud de ese día indica que se acumulaban 690 casos confirmados. La elección de utilizar Worldmeters como fuente puede deberse a que en esa web se pueden descargar también los datos de otros países. De todos modos, no deja de ser llamativo que el Gobierno nacional no utilice sus propios datos.
El segundo gráfico que fue exhibido por el Presidente corresponde al tiempo de duplicación de casos en días, señalando que mientras al 20 de marzo los casos se duplicaban cada 3,33 días, la cuarentena obligatoria permitió desacelerar la propagación del virus y se necesitaron 10,29 días para que los casos se dupliquen al número de casos del 7 de abril. No está claro cómo se calcularon estos números, dado que los mismos pueden derivarse de modelos estadísticos complejos o de la observación empírica. Por ejemplo, una forma de calcular este número es observando que al 17 de marzo había 79 casos y que pasaron exactamente 3 días para que se dupliquen a 158 el 20 de marzo (el gráfico indica 3,33). Utilizando este método, se obtiene que el tiempo de duplicación para el último dia reportado en el gráfico se encuentra entre 8 y 9 días y no 10,29, como indicó Fernández (de 820 casos al 29 de marzo a 1715 el 7 de abril). Considerando los últimos datos disponibles al momento de esta nota (2208 casos al 12 de abril), sí se observan más de 10 días para la duplicación de los casos (1054 casos al 31 de marzo).
Fernández también mostró un gráfico con proyecciones iniciales y valores actuales sobre el avance de la COVID-19 en la Argentina. Si bien esta figura parece simple a primera vista (la línea amarilla muestra los casos acumulados que se proyectaban para cada día y la línea violeta, los casos confirmados), el modelo epidemiológico que se utiliza para realizar proyecciones puede resultar muy complejo dependiendo de diferentes supuestos. Para ponerlo en perspectiva con los datos mostrados anteriormente, haber tenido 45.044 casos al 10 de abril como muestra el gráfico hubiera sido equivalente a duplicar los casos cada 2,4 días desde el primer caso confirmado, más incluso de lo que señaló el Presidente cuando se refirió a 3 días.
Además, debido a que la línea de proyecciones no supera los 150 mil casos, la comparación de este gráfico se vería mejor si el eje vertical llegara solo hasta ese número y no a 400 mil. Por otro lado, la línea horizontal no tiene sentido que esté presente en el gráfico ya que no brinda ninguna información adicional y puede generar confusión.
En la presentación también se comparó el caso argentino con otros países como Brasil, España, Italia y los Estados Unidos. Tal como muestra el gráfico, es necesario establecer un punto de comparación (día 0), el cual se estableció como el día del primer caso confirmado en cada país. Esto quiere decir que, por ejemplo, mientras que el día 1 en la línea de la Argentina corresponde al 4 de marzo, el día 1 para los Estados Unidos corresponde al día 21 de enero.
Un punto a criticar de este gráfico es que, mientras que las líneas correspondientes a la Argentina y Brasil muestran toda la evolución hasta el último día disponible, ésto no ocurre para España, Italia y Estados Unidos. Por ejemplo, si bien la etiqueta de los Estados Unidos indica 495.802 casos, que era el total al momento de la publicación del gráfico, la curva llega al valor 19.367 y esto está indicado con un formato diferente. El hecho de que las curvas de estos 3 países sean parciales debería haberse indicado en el gráfico agregando una flecha, o bien se podría haber mostrado la totalidad de la curvas.
Además, resulta confuso que las curvas de los Estados Unidos, España y Brasil lleguen todas casi al mismo nivel, cuando existen grandes diferencias en el número de casos confirmados en cada país.
Por otro lado, dado que los primeros casos suelen ser aislados y probablemente bien contenidos, muchos de los gráficos publicados para comparaciones entre países toman como día 0 el primer día en el que hay 100 casos confirmados o más. Si tomamos esta definición, entonces observamos que en la Argentina se confirmaron menos casos que en los otros países mencionados. Sin embargo, en el gráfico presentado por Fernández pareciera que la Argentina sigue una trayectoria de casos confirmados por arriba de España y los Estados Unidos.
Debido a las grandes diferencias que hay en los casos confirmados de cada país, el gráfico que muestra esta comparación también se beneficiaría usando una escala logarítmica en el eje vertical (en esta escala los valores 100, 1.000, 10.000 y 100.000 están separados por la misma distancia, por lo que ‘pegar un salto’ de un valor de referencia a otro indica que los casos se han multiplicado por 10). Como muestra la siguiente modificación al gráfico anterior, la ventaja de este nueva figura es que permite comparar la velocidad del crecimiento de los casos confirmados.
También se hicieron comparaciones entre países en cuanto a los fallecimientos por la COVID-19. Este gráfico tiene las mismas falencias que el gráfico de casos confirmados, debido a la elección del día 0 y a que las curvas son parciales. En este caso, la curva de los Estados Unidos con 18.430 fallecimientos termina cerca del nivel en el que se encuentra la Argentina con 82 fallecimientos.
Una mejor representación del gráfico anterior puede verse abajo, donde se utiliza como día 0 el día en el que cada país tiene al menos 5 fallecimientos. En el mismo se observa que la Argentina tiene un menor número de fallecimientos con respecto a los demás países si consideramos la etapa de la pandemia en la que se encuentra.
Si bien resulta destacable el uso de datos y visualizaciones en una comunicación del Presidente a la cuidadanía, es imprescindible que los mismos sean generados con el máximo nivel de rigurosidad, ya que podrían ser determinantes para la toma de decisiones en la lucha contra esta pandemia.
Si querés estar mejor informado sobre la pandemia, entrá al Especial Coronavirus.
* Nicolás Ballarini es doctor en Bioestadística por la Universidad de Medicina de Viena (Austria), máster en Bioestadística (University of North Carolina at Chapel Hill, EE.UU.) y licenciado en Estadística (Universidad Nacional de Rosario). Actualmente trabaja en investigación clínica.
Fecha de publicación original: 13/04/2020
Comentarios
Valoramos mucho la opinión de nuestra comunidad de lectores y siempre estamos a favor del debate y del intercambio. Por eso es importante para nosotros generar un espacio de respeto y cuidado, por lo que por favor tené en cuenta que no publicaremos comentarios con insultos, agresiones o mensajes de odio, desinformaciones que pudieran resultar peligrosas para otros, información personal, o promoción o venta de productos.
Muchas gracias