Paso a paso nos adentramos en el proceso de analizar datos

PROCESAMIENTO DE DATOS

Los datos pueden brindarnos más que información, nos ayudan a prevenir y evaluar diferentes escenarios. Eso lo sabemos, pero cuando hablamos de Big Data pareciese que muchos no saben por dónde empezar. Grandes cantidades de datos requieren, al igual que las pequeñas cantidades, un proceso y manejo ordenado que se debe seguir.

Un ejemplo interesante del paso a paso de los datos viene de la industria de retail de farmacias en los Estados Unidos. La reconocida cadena Walgreens tiene un mapa interactivo de datos sobre la influenza en todo el país, y esta herramienta se alimenta de datos de la compra de los medicamentos y prescripciones médicas recibidas.

Con el mapa no solo el comercio tiene herramientas para gestionar compras de productos y desarrollar ofertas según temporadas de alza de gripes, estos datos le sirven a médicos e investigadores para contrastar su información y estudios con lo que realmente está pasando en una muestra de pacientes real.  Si bien es cierto este no es el uso para el cual se desarrolló, vale destacar que es de acceso abierto y muestra el histórico de datos desde que se implementó la herramienta que utiliza tanto inteligencia artificial como Big Data para la gestión eficiente de los datos.

Paso a paso

Veamos más de cerca el paso a paso de la gestión de datos. ¿Por qué y para qué se recogen los datos? Es la primera pregunta que debe responder quien desee hacer uso de esta herramienta. Ciertamente, los datos están allí, pero, más allá de registrar transacciones y movimientos de usuarios, hay que saber cuál es el problema a resolver, la necesidad, ese es el punto de partida que no podemos obviar. 

Luego de establecer y consensuar con los interesados el problema es necesario establecer los recursos y mecanismos de recolección de los datos. Este paso implica todos los lineamientos y parámetros de medición que se utilizarán, y claro, el proceso de colección de inicio a fin.  Se le conoce usualmente como diseño de la gestión de colección de datos.

Anonimizar es fundamental en todo proceso de recolección de datos que implican personas.

Ya tiene los datos, ahora ¿qué hacer con ellos? Es la pregunta que responde el paso de limpieza y homogenización de estos datos. Los especialistas destacan que es necesario asegurarse, desde las primeras etapas, que los datos tengan valor (“si la data que entra no es la adecuada, la información que sale no lo será.”) y que respondan a los criterios establecidos; por ello, es necesario volver a limpiar datos para asegurar su calidad.

Exploración de los datos: Algunos le llaman muestreo, que consiste en tomar aleatoriamente datos y revisarlos desde la perspectiva del problema, para corroborar que esté funcionando correctamente.

El análisis de datos se hace contrastándola con la hipótesis y las preguntas que se pretenden resolver. Las soluciones tecnológicas brindan la data según se requiera, es data estructurada que supone contener información de valor, es aquí donde es necesario contar con analistas de datos que conozcan el mercado, el producto o servicio y que sobre manera sean capaces de comprender a las personas (En Silicon Valley, en Tokio y otras latitudes donde los datos son moneda de cambio, se contratan sociólogos, psicólogos conductivistas, humanistas con formación tecnológica para hacer esta gestión.)

¿Aquí concluye la gestión? Expertos en análisis de datos establecen que es necesario pasar por un proceso que a continuación enumeramos

  1. Analizar con profundidad qué quieren decir esos datos (información transformada en insigths), desde la perspectiva del mercado, de los usuarios, de la competencia, del entorno sin sesgarse.
  2. Observar la información y compararla con el comportamiento que está sugiriendo.
  3. Razonar con detenimiento, desde diversos criterios y puntos de vista los datos.
  4. Empatizar con la comunidad de la que provienen los datos/centrase en el cliente.
  5. Sugerir posibles respuestas y decantarse por la que tengan mayor sustento tanto estadístico como cualitativo.

Gestionar datos es más que pedirle a un programa que recopile y presente información ordenada, hay que comprender lo que implica su análisis y su gestión en el contexto en el que esos datos son funcionales.

Los datos facilitan la comprensión de los consumidores y ayudan a responder la interrogante más grande que tienen los empresarios: ¿qué desean los clientes?