Cómo convertirse en científico de datos
Una guía clara (y humana) para empezar sin perderte
Una de las cosas que más valoro del mundo de la inteligencia artificial y la ciencia de datos es que, aunque a veces parezca un camino solitario, en realidad se avanza mejor en compañía. Aprendemos más —y más rápido— cuando compartimos lo que sabemos, cuando leemos a otros, cuando hacemos comunidad. Por eso hoy me hace especial ilusión presentaros a
, autor de DataBites, una de las pocas newsletters que consumo de forma regular. No solo porque explica conceptos complejos con una claridad envidiable, sino porque comparte sin postureo lo que de verdad implica crecer en este mundo. Si alguna vez has pensado en dedicarte a la ciencia de datos, o simplemente quieres ver cómo alguien construyó su carrera desde cero, este post es para ti. Gracias, Josep, por pasarte por The Learning Curve y regalarnos esta historia.Buenas! 👋🏻
Soy Josep, y tengo el placer de compartir este artículo para The Learning Curve junto a Dani.
Para quienes no me conocéis, actualmente trabajo como científico de datos freelance en proyectos de la Unión Europea, colaboro como redactor técnico para medios estadounidenses y soy profesor asociado en la Universidad de Navarra (campus Madrid).
Si te pica la curiosidad y quieres saber un poco más sobre cómo fui construyendo mi marca personal, puedes leerlo [aquí]. Y si te interesa seguir aprendiendo sobre ciencia de datos de forma clara y práctica, puedes encontrarme también en mi newsletter en DataBites.tech (en inglés).
Pero vamos a lo importante.
Si estás leyendo esto, probablemente ya lo sospechas: la ciencia de datos es un campo fascinante… y a la vez abrumador. Con tantos lenguajes, herramientas y caminos posibles, es fácil no saber por dónde empezar.
Por eso, una de las preguntas que más me hacen es:
¿Cómo se llega a ser científico de datos?
Este artículo es mi intento de responderla con claridad. No te voy a prometer atajos mágicos, pero sí una hoja de ruta realista, paso a paso, para entender qué hace un científico de datos, qué habilidades necesitas y cómo podrías empezar tú, incluso si partes desde cero.
Así que empezamos con la primera pregunta que debes tener en la cabeza…
¿Qué es realmente un científico de datos?
Un científico de datos es alguien que convierte datos en decisiones. Pero eso puede tomar muchas formas:
Automatizar procesos con modelos de machine learning
Limpiar y explorar datos con SQL y Python
Comunicar hallazgos mediante visualizaciones
Participar en productos que impactan en el negocio
Y lo importante es esto: no todos hacen todo.
Algunos perfiles son más técnicos, otros más analíticos, y otros funcionan como puente entre equipos.
Hay espacio para diferentes talentos y trayectorias.
¿Por qué convertirse en científico de datos?
Es una profesión con impacto, demanda creciente y un entorno en el que se aprende constantemente.
Aunque tener un título universitario puede ayudar (en informática, matemáticas, estadística o ingeniería), no es imprescindible.
Muchos profesionales llegan desde caminos no convencionales, combinando…
Curiosidad
Autoaprendizaje
Proyectos personales
Formación online.
La clave no es de dónde vienes, sino qué sabes hacer.
Dominar lenguajes como Python, R o SQL puede abrirte muchas puertas.
Y si quieres demostrar tu nivel, existen certificaciones reconocidas que te lo permiten.
Así que, ahora que ya estás convencido… vamos a ver cuales son las habilidades necesarias para ser un científico de datos.
Las habilidades que necesitas
La ciencia de datos combina conocimientos técnicos con habilidades más humanas. Ambas son igual de importantes.
Habilidades técnicas
Python y R: tus lenguajes base para análisis, visualización y modelos.
Estadística y matemáticas: para entender qué dicen (realmente) los datos.
SQL y NoSQL: para acceder, combinar y preparar la información.
Visualización de datos: porque lo que no se ve, no se entiende.
Machine Learning: modelos predictivos y automatización de decisiones.
Deep Learning y NLP: para trabajar con texto, imágenes o grandes volúmenes.
Big Data: cuando los datos no caben en tu portátil.
Computación en la nube: porque hoy se trabaja en entornos distribuidos.
Habilidades humanas
Comunicación clara: saber explicar tus hallazgos es tan importante como encontrarlos.
Storytelling con datos: dar contexto y narrativa a lo que descubres.
Pensamiento crítico: cuestionar, validar y no dar nada por hecho.
Visión de negocio: saber conectar tus análisis con decisiones reales.
Resolución de problemas: con creatividad y método.
Trabajo en equipo: porque los proyectos siempre son colectivos.
¿Por dónde empezar?
Aquí tienes una hoja de ruta dividida en 8 pasos, que puedes adaptar según tu contexto:
1. Aprende a programar
Si quieres trabajar con datos, necesitas programar. No se trata de ser ingeniero de software, pero sí de entender cómo manipular datos con código. Los tres lenguajes esenciales son:
SQL: para acceder a los datos
Python: para transformarlos, analizarlos y modelarlos
R: una alternativa muy potente en estadística y visualización
Mi consejo práctico: Empieza por SQL. Es el lenguaje más estable y demandado, y tiene una curva de aprendizaje muy razonable. Uno de mis recursos favoritos es SQLShortReads, una plataforma con una excelente base introductoria.
También publiqué hace un tiempo un curso introductorio a SQL en mi newsletter DataBites, y en las próximas semanas lanzaré la parte práctica. Puedes echarle un vistazo si te interesa.
Después, pasa a Python. Te permitirá hacer análisis, construir modelos y automatizar tareas. El curso de introducción a Python en Kaggle es un excelente punto de partida. También puedes practicar directamente en Google Colab o Kaggle Notebooks, sin necesidad de instalar nada.
2. Aprende a tratar, visualizar y comunicar datos
Uno de los primeros retos reales es enfrentarte a datos "de verdad": sucios, incompletos, mal estructurados.
El proceso de limpiar, transformar y preparar estos datos se conoce como data wrangling, y es una de las habilidades más útiles desde el principio.
📚 Para empezar Kaggle ofrece unos muy buenos cursos de iniciación para limpieza de datos, tratar con tablas en pandas y visualización de datos. Te recomiendo comenzar por ahí.
🎯 Herramientas recomendadas
En Python: pandas, matplotlib, seaborn, plotly
No-code: Power BI, Tableau. Puedes iniciarte siguiendo los siguientes cursos de PowerBI y Tableau.
Consejo personal
No se trata solo de encontrar insights, sino de saber contarlos. Explicar tus hallazgos de forma clara y visual es una ventaja competitiva enorme. Invierte tiempo en aprender data storytelling y cómo comunicar con perfiles no técnicos.
Te aseguro que marca la diferencia.
3. Refuerza tus bases en matemáticas, estadística y machine learning
No necesitas un doctorado en estadística o matematicas para convertirte en científico de datos, pero sí una base sólida para entender los fundamentos de los modelos que aplicarás, y para no depender de la caja negra.
Los principales temas que deberías dominar (o al menos entender)
Probabilidades, distribuciones, inferencia
Álgebra lineal: vectores y matrices
Cálculo: derivadas y optimización
ML: regresión, clasificación, overfitting, validación cruzada
Recursos útiles
StatQuest: el canal perfecto para entender estadística y matematicas con claridad
Khan Academy: ideal para reforzar matemáticas desde lo básico
Cursos introductorios de ML como fast.ai course
4. Comprende cómo funcionan las bases de datos
Los datos casi nunca vienen en un CSV perfecto. La mayoría de veces están guardados en sistemas complejos o bases de datos relacionales.
📚 Para practicar
Puedes aprender PostgreSQL o MySQL con tutoriales en YouTube.
Instala PostgreSQL + pgAdmin para montar tu propio entorno local
Aprende a conectar todo con Python usando SQLAlchemy o psycopg2
El siguiente paso natural es pasar a la nube.
5. Familiarízate con Big Data y la nube
Conforme crece el volumen de datos, también cambian las herramientas. Hoy en día muchas empresas trabajan en la nube y procesan datos distribuidos usando los servicios de AWS, Google Cloud o Azure. Por eso es importante que te familiarices con servicios como S3, BigQuery o Data Lake.
A mí personalmente me encanta trabajar con Google Cloud. Su curso gratuito Google Cloud Skills Boost está muy bien hecho, y perfiles como TheCloudGirl crean contenido muy accesible.
6. Practica, crea proyectos y conéctate con otros
Esta es, sinceramente, la parte más importante. Por mucha teoría que leas, si no practicas, no vas a aprender. Por este mismo motivo, es muy importante que crees tu propio portfolio con proyectos personales, retos de análisis, notebooks explicados y miniapps con Streamlit o dashboards con Power BI o Tableau.
Puedes aprender los pasos previos directamente de forma práctica, para acumular así los resultados en proyectos que puedas mostrar.
Pero si te faltan ideas… literalmente tienes TODO internet para inspirarte.
Aquí van algunos repositorios útiles en GitHub:
Una vez empiezas a crear proyectos, necesitas un lugar donde documentarlos, compartirlos y mantenerlos organizados.
Ese lugar es GitHub.
Pero antes, tienes que aprender lo básico de Git, la herramienta que permite hacer control de versiones: guardar cambios, colaborar sin pisarte, y volver atrás cuando rompes algo (que pasa más de lo que crees).
📚 Recursos recomendados:
GitHub Skills: minicursos gratuitos y guiados por GitHub
7. Haz prácticas o busca tu primer trabajo
Cuando ya tengas cierta base y algunos proyectos, empieza a aplicar a prácticas o puestos junior. No hace falta que lo sepas todo. Hace falta que se note que sabes aprender.
📌 Prepárate bien
Ten un portafolio bien estructurado (GitHub, Notion, Medium)
Cuida tu perfil de LinkedIn: claro, conciso, orientado a lo que buscas
Practica ejercicios tipo entrevista: SQL, razonamiento de negocio, EDA
Consejo clave: Tu forma de comunicar vale tanto (o más) que tu código.
8. Conecta con la comunidad
La ciencia de datos cambia rápido, y la mejor forma de mantenerte al día es estar cerca de quienes también están aprendiendo, creando y compartiendo.
Sigue a referentes, únete a comunidades en Discord o LinkedIn, participa en eventos. Y si puedes, comparte lo que estás aprendiendo: escribir, enseñar o explicar te ayudará a consolidar lo aprendido.
Un último apunte
Si has llegado hasta aquí, ya diste el primer paso: entender que esto no va de saberlo todo, sino de avanzar poco a poco.
Con paciencia, curiosidad y constancia.
Nadie empieza sabiendo.
Pero todos empezamos por el mismo sitio: dando el primer paso.
¿Te animas?
Espero verte pronto en la comunidad!
Atentamente,
— Josep
Ha sido un placer trabajar contigo Dani! Ha quedado una guía muy chula :)