Haciendo la luz al dark data

Todos hemos oído hablar alguna vez de la dark web, pero personalmente el concepto dark data me ha llegado como algo nuevo que ha despertado mi curiosidad.

El dark data o dusty data son aquellos datos redundantes, olvidados, que las empresas y las organizaciones recopilan en el curso de su actividad, pero que luego no utilizan. Es información no estructurada, no etiquetada y no analizada que tiende a permanecer en redes y servidores, ocupando un espacio valioso. ¿Quién no ha trabajado en una gran organización donde los servidores se llenaban y llenaban de datos y que cuando se necesitaba alguno, nunca se lograba encontrar en medio de la marabunta?

Hay tres tipos principales de dark data. El primero es el tradicional, los datos basados ​​en texto: correos electrónicos, documentos, logs de actividad del usuario o logs de monitorización delservidor. Un segundo tipo son los datos no tradicionales: archivos de audio y video e imágenes como grabaciones de conversaciones de clientes, información de sensores generados por el internet de las cosas…. Este tipo de datos oscuros no puede analizarse mediante técnicas de análisis tradicional, sino que requieren un análisis basado ​​en inteligencia artificial, como el reconocimiento facial y de patrones. Y hay un tercer tipo que son los deep data, que es información de la deep web que no puede ser alcanzada por los motores tradicionales de búsqueda. Gran parte de estos datos están controlados por organizaciones gubernamentales o privadas. Incluye datos como registros médicos, registros legales, información financiera… Me encanta esta imagen del dar-data-berg!

Si una organización no sabe qué datos tiene, esto puede llevarle a un aumento de los costes y problemas de cumplimiento de leyes y regulaciones. Al mismo tiempo, estos datos “desconocidos” podrían ser un activo valioso, podrían contener información que no está disponible en ningún otro formato.

El deep learning y la IA están comenzando a ofrecer a las organizaciones nuevas esperanzas y tecnologías para gestionar este 65% de la información que está en estado latente a la espera de un destino.

Deja un comentario

Archivado bajo otros

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.