La fuerza del mercado vinculada a la analítica y la minería de datos

La expresión analítica de datos, constituye una expresión nacida en los primeros años del siglo XXI, como heredera del concepto tradicional de la “minería de datos”, que tanto predicamento tuvo en los finales del siglo XX. Se puede afirmar que hoy en día, en el mundo empresarial el uso del término relativo a la “analítica” o “minería de datos”, tiene como finalidad fundamental, la toma de decisiones institucionales a partir de la extracción de conocimiento oculto existente en datos estructurados, semiestructurados y no estructurados, y expresable a través de patrones extrapolables a escenarios futuros, tomando fundamentalmente en consideración el análisis predictivo de los datos.

La minería de datos (data mining) puede ser considerada como un subconjunto de la ciencia de datos que utiliza técnicas estadísticas y matemáticas junto con el aprendizaje automático y los sistemas de bases de datos. El Grupo de Interés Especial sobre Descubrimiento de Conocimiento y Minería de Datos (SigKDD) de la Association for Computing Machinery lo define como “la ciencia para extraer conocimiento útil de los enormes repositorios de datos digitales creados por las tecnologías informáticas”.

La “minería de datos” se enfoca en limpiar datos sin procesar, encontrar patrones, crear modelos y luego probar esos modelos, mientras que el “análisis de datos”, por otro lado, es la parte de la minería de datos centrada en extraer información de los datos; y su objetivo no es otro que el hecho de aplicar análisis estadísticos y tecnologías sobre los datos para encontrar tendencias y resolver problemas.

La extracción de patrones existente en pequeños, grandes o diversos conjuntos de datos es el objetivo central de la analítica de datos (analytics), y para ello se apoya en dos recursos principales: los algoritmos y la disposición de cientos de técnicas o métodos que hacen uso de estos para múltiples propósitos. Los algoritmos son el método de facto empleado por las técnicas de analítica de datos, y los mismos pueden ser entendidos como un conjunto de instrucciones o reglas claramente definidas, las cuales se ejecutan mediante pasos sucesivos con el fin de encontrar un estado final deseado. Los pasos sucesivos requeridos en la ejecución de un algoritmo pueden, en muchos casos, alcanzar cifras de cientos o millones por lo que estos deben valerse de las capacidades de cómputo actualmente existentes para su viabilidad.

Hoy en día debe tenerse en cuenta las múltiples aplicaciones que tiene la minería de datos, y al hilo de ello, el uso de diferentes herramientas y técnicas que abarcan funciones muy distintas, entre las que destacan, a título de ejemplo las siguientes: a). La limpieza y preparación de datos. Antes de que los datos puedan analizarse y procesarse, debe identificar y eliminar errores, y también identificar los datos que faltan.La minería de datos con frecuencia aprovecha la inteligencia artificial para tareas asociadas con la planificación, el aprendizaje, el razonamiento y la resolución de problemas.

b). El aprendizaje de reglas de asociación. También conocido como análisis de la cesta de la compra, estas herramientas se utilizan para buscar relaciones entre variables en un conjunto de datos. Un minorista podría utilizarlos para determinar qué productos se compran normalmente juntos. La agrupación en clústeres se utiliza para dividir un conjunto de datos en subclases significativas para comprender la estructura de los datos.

c). La analítica de datos. El análisis de datos es el proceso de extraer información de los datos.

d). El almacenamiento de datos. Un almacén de datos es una colección de datos comerciales. Es la base de la mayoría de la minería de datos.

e). El aprendizaje automático. El aprendizaje automático ayuda a automatizar el proceso de búsqueda de patrones en sus datos. Esta técnica se utiliza con un conjunto de datos en particular para predecir valores como ventas, temperaturas o precios de las acciones. El desarrollo de estas técnicas está propiciando el surgimiento de nuevas profesiones, que cada día tienen una mayor presencia en los mercados, y ello vinculado a la necesidad o demanda llevada a cabo por las empresas, cada vez más necesitadas de la prestación de servicios de esta índole.

Entre dichas nuevas profesiones vinculadas tanto al análisis como la minería de datos, cabe destacar alguna de ellas, y así cabe tener en cuenta las siguientes: a). El analista de inteligencia empresarial. b). El arquitecto de inteligencia empresarial. c. El desarrollador de inteligencia empresarial. d). El analista de datos. e). El ingeniero de datos. f). El científico de datos. g). El analista de datos sénior. h). El estadístico.

Las retribuciones de estos profesionales tienen un mínimo de 60 mil euros en los mercados internacionales, y como se indicó anteriormente, constituyen profesiones con unos índices de demanda empresarial muy alta. En este sentido, se estima que de manera global puede existir una demanda aproximada de medio millón de profesionales, y la razón de ello, con independencia del desarrollo tecnológico y económico de las empresas, hace referencia en la escasez de los mismos, debido a la complejidad del proceso de formación al que están supeditados dichos profesionales, donde se requiere de un índice elevado de ensayos/errores, y de un muy amplio conocimiento tecnológico que abarca materias tan dispersas como: la estadística, la programación, el conocimiento del negocio del sector donde va a prestar sus servicios, o por ejemplo, el conocimiento del comportamiento de los consumidores, cada vez más vinculado a elementos tecnológicos, y desde luego, muy sofisticado.

En todo caso, hoy en día se hace imprescindible cada vez más el desarrollo y la proliferación de estas nuevas profesiones, las cuales se van a ver más exigidas, siendo además, mucho más demandadas, precisamente por la progresiva implantación que está teniendo la inteligencia artificial en todos los sectores de la industria y de la actividad económica de las empresas.