Del ‘Big Data’ al ‘Dirty Data’

Los datos erróneos, falsos o desactualizados provocan pérdidas
de 321 millones de euros al año a
las empresas españolas

Usted en su compañía seguramente tiene dirty data y, además, puede que sea el origen desconocido de más de un quebradero de cabeza. Los expertos hablan ya de este concepto para referirse al conjunto de datos erróneos, falsos, duplicados o desactualizados que maneja una compañía pensando que son buenos cuando en realidad es evidente que no lo son. Llevamos ya bastantes años oyendo hablar y escribiendo sobre Big Data. Desde las compañías especializadas en tecnologías de la nube aconsejan a las empresas a captar la máxima cantidad de datos en su día a día -sobre los clientes, pedidos, procesos de todo tipo, etc.-. Ya habrá tiempo de analizarlos o de intentar sacarles partido, pero de momento se nos recomienda guardar la máxima cantidad de información posible con la máxima de que los datos son el oro del siglo XXI y esas cosas... Ahora, una firma española, Hocelot, ha calculado que estos datos erróneos provocan pérdidas de 321 millones de euros al año a las compañías de nuestro país. Es más, desde esta firma especializada en el estudio de los clientes a partir de inteligencia artificial, calculan que el 82% de la información que poseen las empresas españolas son datos falsos u obsoletos.

Según el informe que acaban de publicar, el dato más falsificado por los usuarios es la edad, seguido de la localización y la dirección de email. Explican desde esta compañía que, si el material con el que se trabaja está viciado desde su inicio, todo lo que hagamos con él cae en saco roto. Y esto hace que se pierdan recursos, tiempo, etc. “Cada vez son más las empresas que se ven desbordadas en la recopilación, el procesamiento y el almacenamiento del volumen de datos relacionados con sus actividades habituales de negocio. A esta realidad se le suma una nueva variable poco explorada y conocida por el tejido empresarial: el dirty data”, explican sus autores. Añaden que, en los últimos años, estos dirty data “se han convertido en uno de los principales obstáculos para las compañías”. En cuanto a su origen, estos datos pueden ser incorrectos bien porque el usuario se ha equivocado al introducirlos o porque han quedado obsoletos -por ejemplo, por un cambio de domicilio-, o bien porque han sido falsificados de forma intencionada con fines ilegales o delictivos en encuestas, formularios o solicitudes de prueba de un servicio. Según este estudio, entre 2017 y 2019, estos datos erróneos o inútiles crecieron un 57% en las bases de datos de las empresas españolas. Los análisis realizados por Hocelot señalan que actualmente el 8% de los españoles miente o aporta al menos un dato falso cuando se le solicitan datos personales en Internet. También hay diferencias notables por sexos en esta actitud: el 61% de los datos erróneos provienen de hombres y el 39% de mujeres.

Añaden los autores del informe que contar con un dato fiable y actualizado es vital para las empresas que necesitan analizar el perfil de sus clientes para ofrecerles un producto totalmente personalizado, como suele suceder a las aseguradoras, a los bancos, a las compañías telefónicas, etc. Cuando esos datos son erróneos, es cuando las compañías incurren en pérdidas importantes, ya que se pierde agilidad en los procesos y se toman decisiones de negocio basadas en análisis incorrectos.