🔍 ¿Qué es la Ciencia de Datos?
La ciencia de datos es una disciplina que combina programación, estadística y conocimiento del dominio para extraer valor a partir de datos. Es como mezclar el pensamiento analítico con herramientas técnicas para responder preguntas, encontrar patrones y tomar decisiones informadas.
En otras palabras: es convertir datos en información útil y accionable.
🧰 ¿Qué herramientas se usan?
Las más comunes (y que voy usando) son:
-
Python (mi principal lenguaje)
-
Pandas para manipulación de datos
-
Matplotlib / Seaborn / Plotly para visualización
-
scikit-learn para modelos de machine learning
-
Jupyter / Google Colab para explorar ideas rápido
-
SQL para consultar bases de datos
-
A veces algo de R, pero mi enfoque es Python
📌 ¿Qué pasos suele tener un proyecto de Data Science?
-
Entender el problema
-
Recolectar los datos
-
Exploración y limpieza
-
Análisis y visualización
-
Modelado (machine learning si aplica)
-
Interpretación de resultados
-
Comunicación o puesta en producción
No todos los proyectos requieren ML. A veces solo necesitás visualizar, explicar y listo.
💡 ¿Por qué me interesa?
Porque me gusta resolver cosas, automatizar, y entender cómo funcionan los datos detrás de lo que vemos. Además, siento que es una herramienta poderosa para tomar decisiones en cualquier área: negocios, salud, juegos, apps, todo genera datos.
Este espacio (devcubo.com) lo voy a usar para dejar mis apuntes, ejemplos y experimentos. Es mi forma de aprender, repasar, y tal vez ayudar a alguien más que ande en el mismo camino.