El análisis de datos es una tarea compleja, pero todos somos analistas de datos en cierta medida. ¿Recuerdas la vez que abriste un archivo de Excel y comparaste dos opciones para comprar una nueva computadora portátil? ¿O cuando observaste el mercado de valores para entender hacia dónde nos dirigimos? Felicidades, eres un analista de datos. Sin embargo, el análisis es una habilidad que se perfecciona con años de trabajo arduo. Afortunadamente, existen formas de facilitar el proceso. En este artículo, exploraremos las etapas del análisis de datos según Google y cómo pueden ayudar en la toma de decisiones y la resolución de problemas.
Etapa 1: Hacer preguntas - Comprender el problema
Siempre es importante comprender cuál es el problema o la pregunta. Hacer suposiciones o no comprender completamente el problema puede llevar a conclusiones equivocadas y acciones incorrectas. Identificar el problema es una de las tareas más difíciles. Como dijo Albert Einstein:
si tuviera una hora para resolver un problema, pasaría 55 minutos pensando en el problema y 5 minutos pensando en soluciones .
¿Qué puede ayudar a identificar el problema? Estas acciones pueden ser útiles:
- Expresar claramente el problema. Esta será tu base. Si el problema cambia con el tiempo, es natural. Cuanto más sepamos, más sabios seremos. Todas las declaraciones de problemas deben ser medibles, claras y concisas.
- Intentar ver el panorama completo. Retrocede y observa toda la situación en contexto. Aquí es donde el contexto es crucial, ya que diferentes configuraciones pueden dar diferentes significados.
- No navegar en solitario y asegurarse de entender completamente las expectativas de los colaboradores. Esto significa involucrar a las personas, conocer sus opiniones e intereses. Una vez que eso esté claro, también es importante comunicar de manera abierta y directa lo que se espera de ellos.
Preguntas para hacer:
- ¿Qué problemas plantean las partes interesadas? ¿Cómo se pueden resolver las preguntas de las partes interesadas? (esto implica ingeniería inversa) ¿El problema declarado es realmente la causa raíz del problema?
Etapa 2: Preparación - ¿Qué necesito?
Una vez que se comprende el problema, se puede pensar en cómo resolverlo. Es hora de decidir qué datos deben recopilarse para responder a las preguntas y cómo organizarlos para que sean útiles. Se deben tener en cuenta los siguientes aspectos:
- ¿Qué métricas medir? (* Las métricas son medidas cuantitativas). Al responder esta pregunta, es posible que también se deban responder subpreguntas (por ejemplo, ¿nuestro tiempo de llegada al mercado es competitivo para el producto X? Si no lo es, ¿qué mejoras en el proceso ayudarían?).
- ¿Qué factores deben tenerse en cuenta?
- ¿Dónde se encuentran los datos (archivos, base de datos, sistemas externos, sistemas internos)?
- Si los datos se moverán, ¿cómo se almacenarán y qué medidas de seguridad son necesarias para proteger esos datos?
Preguntas para hacerse en esta etapa:
- ¿Qué necesito descubrir para resolver este problema? ¿Qué ayudaría a medir el resultado de cualquier cambio en el área problemática? ¿Qué investigación se necesita? ¿Dónde se encuentra la información?
Etapa 3: Procesamiento - ¡Hazlo utilizable!
Cuando comenzamos a utilizar los datos, es posible que sean una combinación de diferentes fuentes o que no sean de la más alta calidad. Un proceso conocido como limpieza de datos consiste en corregir o eliminar datos incorrectos, dañados, con formato incorrecto, duplicados o incompletos dentro de un conjunto de datos. Lo que buscamos es obtener datos limpios. Existen muchas herramientas, teorías y métodos para esto, pero mantengámonos en lo básico. La limpieza de datos no requiere herramientas o palabras sofisticadas, un simple programa de hojas de cálculo (sí, Excel) será suficiente. Aunque personalmente prefiero otras opciones (¡Pandas!👌). Durante esta etapa, uno puede:
- Usar herramientas adecuadas para encontrar datos incorrectos e incompletos.
- Eliminar inconsistencias en los datos. A veces puede haber entradas duplicadas.
- Uno de los aspectos más importantes a tener en cuenta es identificar si los datos están sesgados. Es decir, si los datos no representan de manera adecuada a la población o fenómeno de estudio, nuestro problema que intentamos resolver.
Preguntas para hacerse en esta etapa:
- ¿Es confiable la fuente de datos y la calidad de los datos es alta? ¿Qué errores o inexactitudes podrían ocurrir en el conjunto de datos dado? ¿Cuál es la mejor respuesta posible al problema que se está resolviendo? ¿Cómo limpiar los datos para que la información sea más consistente? (por ejemplo, reemplazar valores con valores promedio, etc.)
Etapa 4: Análisis - ¡Cuéntame la historia!
El siguiente paso es sacar conclusiones basadas en los datos confiables. El análisis de datos es una habilidad que lleva tiempo dominar, pero con el tiempo los patrones comenzarán a emerger más rápido y los métodos utilizados se desarrollarán. El concepto principal es pensar de manera analítica sobre los datos, ser crítico y ser creativo. Puede haber necesidad de ordenar y formatear los datos para facilitar su procesamiento, crear una tabla dinámica o crear gráficos impresionantes. Recuerda que es una historia que debe desarrollarse. El procesamiento adicional puede incluir:
- Realizar diferentes cálculos para obtener métricas adicionales.
- Combinar atributos adicionales de datos de diversas fuentes para obtener una historia más completa.
- Crear diferentes vistas de los datos, como tablas con resultados, filtrar y pivotarlos.
- ¡Visualízalo si es posible! Los gráficos dicen más que mil palabras.
Preguntas para hacerse en esta etapa:
- ¿Qué historia me cuentan mis datos? ¿Por qué no se puede hacer? ¿X (por ejemplo, tiempo, dinero, mano de obra o experiencia) nos permitirá resolver el problema? ¿Cómo me ayudarán mis datos a resolver este problema? ¿Quién necesita el producto o servicio de mi empresa? ¿Qué tipo de persona es más probable que lo use?
Etapa 5: Compartir - Obtener diferentes perspectivas
Una cosa importante a recordar es que, sin importar lo que hagamos, todos estamos sesgados. Por lo tanto, como siguiente paso, es importante obtener opiniones adicionales sobre los hallazgos. Esto ayudará significativamente a mejorar los resultados y garantizar que se hayan tenido en cuenta los aspectos principales. Como hay muchas formas de compartir los hallazgos, cada persona tiene sus preferencias y cada empresa también. Sin embargo, muchos estudios aseguran que con visualizaciones claras y atractivas de los resultados del análisis, la historia se comprende mejor. Las herramientas no importan realmente aquí, puede ser Tableau, Excel o incluso papel y lápiz. Pero aprovecha esta oportunidad para mostrar a las partes interesadas cómo se resolvió su problema. Compartir ayudará en:
- Tomar mejores decisiones. Los comentarios ayudarán a responder las preguntas que inicialmente no se consideraron.
- Tomar decisiones más informadas. Los comentarios no serán solo críticas, sino también sugerencias e información adicional sobre el tema.
- Mejorar el resultado general. Desde un punto de vista, la decisión probablemente será más informada y mejor, pero también la transparencia garantizará que haya más apoyo a los hallazgos.
Preguntas para hacerse en esta etapa:
- ¿Cómo puedo hacer que lo que presento a las partes interesadas sea interesante y fácil de entender? ¿Qué me ayudaría a entender esto si fuera el oyente? ¿Qué hace que una visualización de datos sea buena?
Etapa 6: Actuar - ¡Conocemos el problema, resolvámoslo!
Ninguna conclusión del análisis debe quedarse olvidada en un estante. En su lugar, se deben tomar medidas. Tomar los resultados y, según la declaración del problema, se pueden hacer recomendaciones para acciones futuras. Y una vez que las recomendaciones estén listas, ¡se puede tomar la decisión real! No necesariamente el conductor del análisis es quien toma la decisión, también puede significar proporcionar a los tomadores de decisiones (partes interesadas) recomendaciones basadas en los hallazgos para que puedan tomar decisiones basadas en datos. Pero la clave aquí son las decisiones basadas en datos.
Preguntas para hacerse en esta etapa:
- ¿Cómo se puede utilizar el feedback recibido durante la fase de compartir (etapa 5) para satisfacer las necesidades y expectativas de las partes interesadas? ¿Qué posibles soluciones podría haber para el problema planteado? ¿Vale la pena resolver este problema? (Sí, también es un resultado potencial)
¡Y listo!
Estas son las seis etapas que Google ha delineado para el análisis de datos. Y realmente ayudan a estructurar el pensamiento al realizar análisis de datos. Para definir un pensamiento estructurado, en realidad es descomponer el proceso (de análisis de datos) en partes más pequeñas y manejables. Según los empleados de Google, este proceso implica cuatro actividades básicas:
- Reconocer el problema o la situación actual.
- Organizar la información disponible.
- Revelar brechas y oportunidades.
- Identificar tus opciones.
¡Ahora ve y toma decisiones basadas en datos!
Si quieres conocer otras notas parecidas a Etapas análisis datos en inteligencia artificial puedes visitar la categoría Inteligencia.
