¿Por qué debo convertirme en un científico de datos? – La tubería de Big Data para principiantes

por-que-convertirme-en-cientifico-de-datos-big-data-para-principiantes

¿Por qué debo convertirme en un científico de datos? - La tubería de Big Data para principiantes

Post - Why am I supposed to become a Data Scientist? – Big Data’s Pipeline for beginners data science

¿Otro artículo sobre Big Data? En serio, ¿otro más?

Estamos cansados de leer sobre Big Data aquí y allá. Todo el mundo habla de ello pero no todos acaban especificando en qué consiste todo este nuevo universo y que es ser un científico de datos. Y es que el Big Data no tiene un único objetivo final. Dependiendo de dónde se obtenga el gran volumen de datos a analizar o del tipo de datos que se utilicen, podemos predecir si una persona padecerá diabetes en el futuro, para mostrar lo que se busca antes de que se haya perdido (sí, Amazon utiliza el Big Data, como… mucho.

Todo esto me parece muy bien, pero ¿cómo se hace?

Tú eres impresionante pero el Big Data es OSUMANTE. ¿Por qué eres impresionante? Como curiosidad, el rol de científico de datos es conocido en el mundo empresarial como el rol del unicornio azul. Personalmente, prefiero decir que somos como detectives, como padawans detectives, ya que somos principiantes. Tenemos que utilizar nuestro poder de deducción para encontrar patrones y predecir comportamientos de los datos.

Además, no nos limitamos a hacer Big Data sin saber lo que estamos haciendo. Hay seis sencillos pasos que puedes seguir para tener éxito lo antes posible.

O – Obtener los datos.

L – Limpiar los datos de datos nulos o erróneos (conocidos como falsos positivos).

C – Comprender los datos para encontrar los patrones de los que hablábamos antes.

M – Modelizar los datos para poder utilizar nuestro poder de deducción.

I – Interpretar los resultados.

C – Conseguir el éxito (y el dinero, a todos nos gusta ese paso).

La parte que más tiempo consume es la de entender nuestros datos. Si realmente quieres encontrar patrones secretos o llegar a la meta, entender los datos debería ser la parte más importante. No es lo mismo averiguar dónde es mejor instalar la AC en los vagones del metro que averiguar cómo evoluciona la economía. Aproximadamente, el 80% del tiempo empleado será sólo de comprensión. La modelización será más fácil (como principiantes) con software de Big Data como Knime o R. Esto último es más programación pero nada que no puedas conseguir siendo un científico de datos.

Ahora ya tienes las pistas para averiguar qué ha pasado en el caso Big Data, coge tu licencia de detective y haz que Sherlock esté orgulloso de ti.

Si te interesa formarte en este campo, desde Qaleon te proponemos conocer Empleable para tener un itinerario formativo del cientifico de datos que quieres ser.