*Overview Project. No todos los datos son números.

Uno de los proyectos que mas me gustó en Hacks Hackers Buenos Aires fue Overview Project, una herramienta de libre acceso, que ayuda a periodistas a encontrar historias en grandes cantidades de información a través de la exploración visual de los mismos. Overview produce visualizaciones de grupos de documentos y permite búsquedas a partir de nombres y keywords, favoreciendo así establecer relaciones entre temas, personas, lugares y otros datos.  

 

En las visualizaciones cada documento es un punto, los documentos con similitudes se agrupan produciendo clústers, en primera instancia  los puntos son grises y se van coloreando a medida que se aplican tags en el proceso de exploración.  Es posible también hacer click en los documentos individuales o seleccionar una sección de documentos para ver que tienen en común. Así entonces, un grupo de documentos puede indicar que estos fueron escritos por la misma persona, hablan del mismo tópico, o provienen del mismo lugar. En otras palabras, con Overview se produce una representación visual de la categorización en torno a los criterios de búsqueda.

Para utilizar Overview es preciso tener Git instalado que está disponible para Windows y para Mac. También es necesario contar con Ruby y Java. Estos requerimientos son más familiares para los usuarios de Linux, pero las buenas noticias son que en el pasado Hacks Hackers, el líder del proyecto Jonathan Stray anunció que estaba muy cerca el lanzamiento de Overview ejecutable desde el browser.

En cuanto a los documentos se pueden utilizar los 3 datasets que ofrece el programa de muestra (1500 comunicados de prensa del senador de New Jersey Robert Menéndez, 4.500 páginas OCR’d de incidentes Iraq-contratistas y los llamados Caracas-cables, aproximadamente 7000 cables de wikileaks que se originan o mencionan la ciudad de Caracas) o usar los documentos propios ( formatos pdf y/o txt).

Visualización con Overview de Iraq Wikileaks Versión para ampliar

Dentro de las cosas a destacar de Overview está el hecho de insistir en la idea de que no todos los datos son números, y que a partir del análisis de textos también se pueden hacer grandes descubrimientos haciendo uso de la “metáfora” que produce las imágenes. En mi opinión es una herramienta que va más allá del simple placer estético que produce la visualización y revela patrones, dimensiones y relaciones que podemos estar actualmente ignorando.   

Si te interesa saber más sobre Overview, aquí algunos links relacionados:

Overview the Project

Documento sobre la discusión en torno a la Visualización de Wikileaks

Reporte Técnico en colaboración con University of British Columbia

Video de introducción

Mas entradas sobre Visualización 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s