La gran mayoría de las personas que trabajan con datos, ya sea como analistas o profesionales del sector financiero, desarrollan su vida profesional a partir de una base matemática. Pero ¿por qué?
A menudo nos preguntamos si un máster en matemáticas aplicadas tienen una base suficiente para especializarse en big data. ¿Existe la opción de seguir un programa paralelo para terminar la formación en este campo sin tener una experiencia real en Big Data?
La gente relaciona el aprendizaje automático, la ciencia de los datos, etc. con la estadística, pero también se mencionan estas especialidades en programas de matemáticas aplicadas que no incluyen la estadística como parte de su formación. ¿Cómo pueden diferenciarse la carrera de matemáticas aplicadas de la de estadística en este punto? ¿Cómo difiere la investigación en estadística y matemática aplicada sobre «Machine Learning» y ciencia de datos?
Table of Contents
¿Qué es la matemática aplicada y en qué se diferencia de la ciencia de datos?
La gran mayoría de las personas que trabajan con datos, ya sean analistas o profesionales del sector financiero, suelen iniciar su vida profesional desde una base matemática. ¿Pero por qué?
A menudo nos preguntamos si un máster en matemáticas aplicadas tiene una base suficiente para especializarse en data science. ¿Existe la opción de seguir un programa paralelo para terminar la formación en este campo sin tener una experiencia real de big data?
Matemáticas aplicadas, áreas de estudio y salidas laborales
Lo que hace que las matemáticas aplicadas sean tan interesantes es su capacidad para resolver problemas complejos utilizando herramientas simples. Por ejemplo, utilizamos el cálculo para encontrar soluciones a ecuaciones diferenciales, álgebra lineal para analizar sistemas, métodos combinatorios para contar cosas, teoría de grafos para modelar redes… Se trata de aplicar conceptos abstractos a situaciones concretas.
Hay muchas formas de aplicar las matemáticas a otros campos además de los asociados tradicionalmente con las matemáticas «puras». Puede buscar aplicaciones como finanzas, ingeniería, física, biología, medicina, química, economía, investigación de operaciones, informática, robótica, inteligencia artificial… Todas estas áreas tienen algún tipo de aplicación para las matemáticas. Cada vez se aplica más la Inteligencia Artificial en la selección de personal.
La matemática aplicada es un campo muy amplio, que va desde la matemática extremadamente pura hasta la matemática extremadamente aplicada. La estadística es una rama de las matemáticas aplicadas, pero las clases de estadística más difíciles en la escuela de posgrado son principalmente teoría de la medición / teoría de la probabilidad / estadística matemática. Entonces, si quieres poder entender todo lo que implica la parte matemática de la estadística y además desarrollar nuevos modelos de optimización, la matemática aplicada es la solución.
La estadística te permite trabajar con big data sin tener que implicarse en el desarrollo de nuevos modelos de datos.
El desarrollo de modelos de datos en big data
Sin embargo, si el interés es poder trabajar en nuevos modelos de datos veamos qué se requiere: El objetivo final del diseño de un modelo de datos es reducir la cantidad de tiempo dedicado al análisis de datos.
Los nuevos modelos de datos más comunes son big data, modelos predictivos y aprendizaje automático:
1. El modelado de datos en big data es un proceso sistemático de selección y organización de datos en una base de datos, con el objetivo de responder preguntas sobre lo que sucedió en el pasado, lo que está sucediendo ahora y lo que sucederá en el futuro.
Para ello el diseño de modelos de datos incluye saber qué son datos estructurados y datos no estructurados.
- Los datos estructurados son elementos que se han registrado mediante mediciones o recuentos para cada categoría. Los ejemplos incluyen altura, peso, edad, etc.
- Los datos no estructurados son elementos que no se pueden clasificar por medidas o recuentos para cada categoría. Este tipo de información puede ser cualquier cosa, desde correos electrónicos hasta videos y grabaciones de sonido.
El modelado matemático es una parte esencial del análisis de big data. Permite analizar los datos, a través de varios algoritmos, con el fin de encontrar conocimientos e indicaciones. Estos algoritmos son necesarios para dar sentido a la gran cantidad de datos que obtienen las empresas todos los días.
Como siempre, el modelado matemático necesita conocimientos y experiencia sobre matemáticas y lenguajes de programación como R o Python. El aprendizaje de estas habilidades nos permitirá explorar el mundo del análisis de big data.
2. En este tipo de análisis predictivo, los datos se modelan para formar una representación de poder predictivo o explicativo.
Para diseñar un modelo, se deben conocer los fundamentos de probabilidad y estadística. Además, uno debe estar familiarizado con el álgebra lineal y el cálculo, ya que se utilizan a menudo en el modelado estadístico.
3. El desarrollo de nuevos modelos de datos se puede realizar aplicando estadísticas o aprendizaje automático, pero la elección entre ellos depende en gran medida de la industria en la que se encuentre y de sus objetivos.
P.E.: Si nuestro objetivo es predecir con precisión las tasas de fraude con tarjetas de crédito, entonces el aprendizaje automático sería lo mejor porque tiene una alta tasa de poder predictivo. Sin embargo, si deseamos predecir los precios futuros de las acciones con alta precisión y bajas tasas de error, entonces optaríamos por las estadísticas aplicadas.
El tipo de entrenamiento óptimo depende del tipo de datos que estemos utilizando. Por ejemplo, un modelo puede necesitar entrenar la red neuronal para el reconocimiento de imágenes, mientras que otro podría requerir solo entrenamiento básico en estadística.
Concluyendo ¿matemáticas aplicadas o data science?
La ciencia de datos es un campo de interés creciente entre personas de todas las edades. Es un buen campo para aquellos que desean seguir una carrera en matemáticas y programación.
Uno puede convertirse en científico de datos completando una licenciatura en alguna rama de matemáticas aplicadas, estadística o ciencias informáticas, y luego adquirir experiencia en alguna empresa que se dedica a la ciencia de datos, o realizando un máster especializado.
También se ha de tener en cuenta que el conocimiento de lenguajes de programación como SQL, Python, R y SAS son una habilidad esencial para un científico de datos. Estas habilidades se pueden adquirir a través de Bootcamps específicos o en programas dirigidos como serían los estudios de posgrado en data science.