El aprendizaje automático se ha convertido en una de las herramientas más importantes durante los últimos 10 años, ofreciendo enormes mejoras para muchas empresas. Esta ciencia, perteneciente al campo de la inteligencia artificial, se divide en dos grupos; predicción y segmentación. A continuación, te explicaremos brevemente la analítica predictiva también conocida como aprendizaje supervisado, y la segmentación en clúster, también conocida como aprendizaje no supervisado.
Analítica predictiva
Los algoritmos de aprendizaje supervisado crean un modelo con el objetivo de utilizar la entrada de data para predecir la salida de la misma. Se llama aprendizaje supervisado porque se han etiquetado los datos, por ejemplo, un conjunto de data sobre clientes divididos como “Compró o No compró”. El algoritmo utilizará esta información para aprender a predecir el resultado, es decir, si un cliente va a comprar o no el producto. Durante el proceso de aprendizaje, el algoritmo obtiene retroalimentación sobre qué tan bien lo está haciendo, y usa esa información para ajustarse y mejorar.
El algoritmo se auto evaluará sobre qué tan bien le fue al predecir la probabilidad de compra, y como se puede ver en el gráfico a continuación, el algoritmo funcionó bien. Sólo cuatro individuos se clasifican erróneamente, es decir, cuatro clientes que no compraron el producto se clasificaron como alguien con alta probabilidad de compra ya que los mismos se encontraban en el "lado de compra" de la línea descendente.
Clustering
Los algoritmos de aprendizaje no supervisados toman datos que solo sirven de entrada, es decir, no tenemos información sobre ningún resultado. El algoritmo intenta encontrar la estructura en la data, agrupándola en grupos o clústeres, e identifica elementos comunes en los mismos en función de la similitud (o disimilitud) que puedan tener.
El algoritmo no recibe retroalimentación durante su entrenamiento, ya que no hay resultados para comparar la predicción, lo que hace que la segmentación sea mucho más desafiante que el aprendizaje supervisado. El gráfico a continuación muestra que los datos no han sido etiquetados, es decir, todos los puntos tienen el mismo color y forma, lo que significa que no sabemos qué individuos pertenecen a qué grupo.
Sin embargo, el algoritmo ha encontrado tres grupos en la data que al analizarlos en detalle, podemos averiguar si los objetos (por ejemplo, clientes) en uno de los grupos tienen algo en común. Al obtener estos resultados, la información podría usarse para realizar campañas de marketing extremadamente específicas y precisas. Tenga en cuenta que pocos clientes no pertenecen a ninguno de los clústeres. Esto es bastante común en la agrupación y estos valores atípicos se pueden filtrar y analizar de nuevo.
¿Por qué ahora?
Aunque muchos de los algoritmos de aprendizaje automático, tanto supervisados como no supervisados, se inventaron hace ya muchos años, ahora se están volviendo muy populares en casi todas las industrias y en organizaciones de todos los tamaños. Esto se debe a que los algoritmos requieren de una gran potencia de cálculo y muchos datos, que es algo que no teníamos hace 10-15 años.
En la actualidad encontramos data en todas partes, la mayoría de las organizaciones almacenan consciente o inconscientemente bases de datos. Además, con los avances tecnológicos, los ordenadores son cada vez más potentes, lo que hace posible hacer cálculos bastante complicados con un ordenador de escritorio. Todo esto en conjunto está popularizando el uso y la aplicación del aprendizaje automático.
Sin embargo, cuando el almacenamiento de data es demasiado grande y complejo para que un ordenador pequeño lo analice, se requiere de máquinas más potentes y avanzadas. En Sumo Analytics hemos estado obsesionados con el análisis de datos durante muchos años y hemos aplicado nuestras habilidades para ayudar a un número creciente de empresas a racionalizar sus negocios con el único propósito de aumentar las ganancias. Todo lo que se decía sobre lo que pasaría en un futuro lejano, está sucediendo justo ahora.