*Lecciones de Edward Tufte (II parte): La epidemia de cólera en Londres de 1854 y los orígenes de la epidemiología

En una entrada pasada  extraje algunas recomendaciones del libro Visual Explanations de Edward Tuftte y les prometí continuar con la tarea, para seguir enriqueciéndonos. Como siempre, les advierto que es una presentación muy superficial del tema, si desean profundizar, lo conveniente es que acudan directamente a la fuente.

El segundo capítulo del libro se ocupa de analizar detalladamente dos casos en el que la realización de una visualización fue parte de un proceso determinante para resolver asuntos de vida o muerte. En primer término se trata del minucioso trabajo de investigación del médico inglés John Snow y que concluyó con el control de una agresiva epidemia de cólera en Londres en 1854. El segundo caso se refiere al proceso de análisis de las condiciones climáticas para el lanzamiento del transbordador Challenger en 1986 y cuyo desenlace es tristemente célebre.

Con esta metodología de análisis de casos (uno exitoso y uno fallido) Tufte evalúa la calidad del proceso utilizado para la evaluación y presentación de los datos cuantitativos detrás de ellos. En esta entrada me referiré únicamente al primero de ellos.

Snow no fue elegido aleatoriamente para ayudar a controlar la epidemia, años de investigación relacionada lo facultaban para este trascendental encargo, esta trayectoria fue la que respaldó la elaboración de su teoría y su posterior confirmación.

La investigación se realizo a partir de los datos obtenidos de la oficina general de registro sobre las muertes acaecidas (fecha y lugar del deceso) y las que posteriormente trazó en un mapa, revelando la estrecha relación entre el surgimiento de la enfermedad y una fuente de agua ubicada en Broad Street. El mapa muestra que las muertes ocurrieron todas en un radio cercano a la fuente y que aún las que no cumplieron con esta condición, ayudaron a confirmar la teoría como veremos más adelante. (El siguiente video detalle con claridad el procedimiento de analisis que siguió Snow)

The guardian no se quedo atrás y nos trae una visualización nítida e interactiva de los mapas de Snow en este artículo:

John Snow’s cholera map of London recreated

Aunque pueda parecer hoy en día un análisis sencillo, debemos ser conscientes del contexto, y de la evolución de la epidemiología para ese entonces, la bacteria vibrio cholerae solo se descubrió hasta 1886 y gracias al camino trazado por Snow.

Tufte se pregunta ¿Cómo hizo Snow para resolver este misterio? En primer lugar elaboró una teoría que ofrecía una explicación causal acerca de cómo se produjo la dispersión de la enfermedad, para eso se apoyó en análisis médicos, observación empírica y por supuesto datos, detectando así la correlación entre variables. A continuación el detalle de sus aciertos:

1. Ubicó los datos en un contexto pertinente para evaluar causalidad: La lista de los nombres de las victimas describían las circunstancias y el deceso en orden cronológico, lo que permitió a su vez realizar gráficos de series de tiempo. Sin embargo el análisis de la variable tiempo no era suficiente para satisfacer la hipótesis causal y se limitaba al reporte de las malas noticias diarias. Por lo tanto decidió elaborar una representación gráfica (espacial) que incluyera las dos variables: ubicación de las muertes y ubicación de las distintas fuentes de agua. El mapa mostró con claridad una zona con muchas muertes alrededor de la fuente de Broad street y comparativamente reveló otras zonas sin muertes a pesar de tener fuentes de agua cercanas.

2. Hizo comparaciones cuantitativas: La pregunta fundamental en análisis estadístico es ¿Comparado con qué? por lo tanto investigar a las víctimas del cólera es solo una parte de la búsqueda de evidencia. Para entender completamente la causa de la evidencia también es preciso analizar a aquellos que escaparon de la enfermedad. En el mapa se observa muy cerca de la fuente contaminada, una fábrica de cerveza y a Snow le pareció sospechoso que no tuviera ninguna muerte reportada desde ese lugar  por lo que llamó al propietario del lugar a preguntarle, este le contestó que los trabajadores tenían permitido beber una cierta cantidad de licor de malta y estaba casi seguro que ninguno de ellos había tomado agua de la fuente (Saved by the beer bromea con razón Tufte). Y fue así como estudiar las circunstancias de los que no se contagiaron con cólera fortaleció la evidencia que respaldó finalmente la teoría.

3. Consideró explicaciones alternativas y casos contrarios: Esta es quizás la parte mas difícil para los investigadores, enfrentar los desafíos a sus conclusiones. Sin embargo la credibilidad de una investigación depende justamente de eso, de evaluar toda la evidencia, incluso la que no respalda la teoría que se propone. Era necesario explicar las muertes producidas lejos de la fuente de agua, tarea que concluyó que aunque se tratara de gente que no vivía cerca del fuente, trabajaba o transitaba en algún momento del día por la zona, poniéndose en contacto con el foco infeccioso. Los datos que, al principio parecieron salirse de la lógica causal, terminaron aportando una evidencia poderosa, gracias a una minuciosa consideración.  

4. Evaluó la posibilidad de existencia de errores en los datos: Comentarios complementarios del mapa revelan posibles errores en los datos contenidos, gente que fue trasladada y murió en el hospital, las muertes no reportadas, y otros semejantes. Frente a esta deficiencia, esas muertes no fueron incluidas en el mapa, aunque si se incluyeron en las tablas. Por otro lado, cada elección otorga ventajas y desventajas. El mapa de Snow contenía falencias: las tasas de decesos no se muestran y tampoco la relación con la variable poblacional (zonas más o menos pobladas). Ahora mucho tiempo después sabemos que lo ideal es que el mapa hubiera mostrado estas dos variables, sin embargo Snow solucionó esta carencia en el texto de su reporte donde incluyó aclaraciones al respecto. En este punto se pone de relieve la importancia de la elección del diseño de una visualización, de la naturaleza de sus variables (tiempo, espacio, cantidad) y de la forma correcta para representarlas. Un error en esta etapa del proceso puede echar por borda todo el trabajo de pesquisa realizado hasta el momento.  Con algunos ejemplos Tufte demuestra como ciertas agregaciones temporales distorsionan los datos y por ende las conclusiones. Como dato de color presenta una infografía de cómo los seguidores de lo que él llama Pop Journalism hubieran presentado el trabajo de Snow:

 popjournalism2

La investigación de Snow ha sido piedra angular para estadísticos, epidemiólogos e investigadores. En la zona donde antes estuvo la fuente infectada hay un bar con su nombre e incluso descubrí un corto “Snow” que relata su historia, pero es gracias a Tufte y a su contextualización que podemos sacar algunas conclusiones para el tema que nos interesa:

*Snow tenía una teoría y debía confirmarla, el criterio para visualizar fue entonces el de confirmación sobre estos criterios remitirse a esta entrada.

*Los datos deben cotejarse: las preguntas a cómo, cuándo, dónde y por quién se obtuvo la información deben aplicarse siempre, aún cuando contraríe la evidencia a favor.

*Recordar la pregunta clave ¿comparado con qué? si no somos capaces de otorgar marcos comparativos, fallamos en la contextualización y en el objetivo.

*La elección de un determinado tipo de gráfico puede comprometer el trabajo de investigación: para estos casos conviene probar distintos tipos y elegir la que guarde mayor fidelidad con las conclusiones.

* La visualización no es un fin en sí mismo, hace parte de un proceso de múltiples etapas y su objetivo es ampliar el conocimiento sobre una cuestión y coadyuvar el proceso de comunicarla.

Espero que esta entrada les sea de utilidad, la idea es hacer pequeñas contribuciones a la teoría de la visualización, sobre todo en castellano donde cuesta aún conseguir material relacionado. Si estos temas te resultan de interés, te invito a suscribirte al blog en el menú inferior e intercambiar opiniones al respecto.

Mas entradas sobre Visualización 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s