La era del Big Data: ¿Estás listo para sumergirte en un océano de la información?

Por Nicole Altamirano

De seguro alguna vez te levantaste con la alarma de tu smartphone; registraste tus datos en páginas web; hiciste un pedido de comida o medicinas por medio de una App; pediste Uber o un DiDi para dirigirte a un lugar; hiciste búsquedas en Google; revisaste perfiles de Facebook; o, registraste tus datos en páginas web. Estos son unos ejemplos de cómo estamos proporcionando datos de manera constante, a un click de distancia. Estas herramientas nos han permitido desde la comodidad de nuestro hogar o desde cualquier parte del mundo, acceder a servicios y productos que antes eran inaccesibles.

Sin embargo, todas las acciones digitales que realizamos diariamente alimentan una  base de datos que contienen nuestros movimientos en internet, con los que se pueden identificar patrones de comportamiento, preferencias personales/colectivas, lugares que frecuentamos, estado civil, entre otras. 

En el año 2021, según un estudio de Statista, se registró el intercambio de más de 300 mil millones de correos electrónicos ese año. Cada correo electrónico, pensando que se intercambia sólo texto y sin adjuntos, tiene un peso promedio de 20 kb. Es decir, sólo a través de correo electrónico, en el año 2021, se generó información por al menos unos 6.000 Terabytes. Esta cifra se puede representar como 120 rascacielos de 100 pisos, cada uno lleno de papeles. 

Esta explosión de cantidad de datos generados, es lo que se conoce como “Big Data”, este plantea un desafío significativo para las herramientas tradicionales de administración y procesamiento de datos. En este blog explicaremos sobre qué es el “Big Data”, su importancia en la era digital, los tipos de datos que almacena, sus retos y sobre los temas jurídicos que se están debatiendo en torno al tema.

  1. Origen y Definición del “Big Data”

En 1992, Windows crea la primera base de datos simple “Microsoft Access” que sería el abrebocas para la aparición del Big Data, ya que, en el año 1997 los investigadores de la NASA, Michael Cox y David Ellsworth acuñan por primera vez en un artículo el término “Big Data” y lo denominan como un problema para los sistemas informáticos. 

Más adelante, la empresa consultora y de investigación de las tecnologías de la información «Gartner» en el año 2001, presenta la definición de referencia para Big Data: 

“Big data son activos de información de gran volumen, alta velocidad y/o gran variedad que exigen formas innovadoras y rentables de procesamiento de la información que permiten una mejor comprensión, toma de decisiones y automatización de procesos.” -Traducido al español

Los expertos Data Scientist de IBM, caracterizan al big data en cuatro dimensiones:

  • Volumen: gran cantidad de datos generados y almacenados.
  • Velocidad: la rapidez en la que se generan y se almacenan estos datos.
  • Variedad: las diversas fuentes y distintos tipos de datos que se generan.
  • Veracidad de los datos: el tiempo en el que se consiguen datos reales y de calidad.

Estas características mencionadas son intrínsecas de los datos masivos, sin embargo, con el tiempo se han añadido 3 características, explicadas por la Universidad Autónoma de Madrid, en en relación a las características a tomar en cuenta para obtener ventaja competitiva: 

  • Viabilidad: las empresas que utilizan estos datos deben determinar cuáles son los datos relevantes para su objetivo.
  • Visualización de datos: los datos deben ser comprendidos al momento de presentarlos a las personas responsables de tomar decisiones respecto a estos datos.
  • Valor de los datos: los datos se transforman en información, esta información es crucial para la toma de decisiones para la empresa.

  1. La importancia del Big Data

Volviendo al ejemplo mencionado anteriormente, que en 2021, la cantidad de información que se generó a través de correos electrónicos, es fácil imaginar que si solo dos personas son responsables de examinar este voluminoso archivo, el tiempo necesario para revisarlo sería exorbitante. Dado que la revisión de tal información requiere una cantidad considerable de tiempo, estas dos personas prácticamente se verían obligadas a trabajar día y noche, y quizá nunca acabarían de completar una tarea simple de búsqueda.

Con el propósito de agilizar el proceso y optimizar los recursos, resulta esencial integrar tecnologías que puedan analizar y sintetizar la información de manera más eficiente y representativa. En este contexto, la adopción de la inteligencia artificial (IA) se presenta como la solución primordial para llevar a cabo el análisis y la gestión de esta enorme cantidad de datos. Mediante la aplicación de algoritmos y modelos de IA, sería posible automatizar una parte significativa del procedimiento, identificando patrones, clasificando contenidos y generando resúmenes coherentes. De este modo, se liberaría a los trabajadores de la labor manual exhaustiva y se conseguiría un proceso de revisión mucho más ágil y efectivo.

Si bien, el “Big Data”, ha sido objeto de diversas problemáticas actuales como la protección de datos personales, el “Big Data”, es esencial para la cultura digital actual debido a su potencial para: obtener insights relevantes para solucionar problemas del mercado; tomar decisiones más acertadas que comprendan patrones, tendencias y oportunidades; descubrir las necesidades del mercado para mejorar productos y servicios con el plus de la innovación; realizar investigaciones y análisis valiosos para todos los campos profesionales; y, conducir a una mayor eficiencia en logística y funcionamiento interno de las organizaciones.

El caso de los supermercados Walmart es uno de los ejemplos más conocidos sobre el uso de big data. Esta cadena de supermercados recopiló y almacenó datos relacionados con las compras de sus clientes para posteriormente analizarlos y captar sus hábitos de consumo. Con esto, Walmart comenzó a realizar predicciones sobre las ventas que obtendrían en diferentes escenarios. Por ejemplo, descubrieron que antes de las alarmas por huracán, el producto que generaba más ventas era la cerveza y que los dulces “Pop Tarts” se vendían siete veces más del nivel normal de ventas. Con esto, Walmart pudo tomar decisiones basadas en datos e incrementar su productividad y eficiencia. 

Otro ejemplo importante de big data es el de Netflix, la famosa plataforma de streaming, recopila y analiza información acerca de las películas y series que eliges ver, el tiempo que dedicas a cada contenido y las calificaciones que otorgas. Esta recopilación de datos tiene como propósito personalizar las recomendaciones que aparecen en tu página principal, adaptándolas a tus gustos y mejorando tu experiencia. De esta manera, Netflix se consolida como una de las plataformas de streaming más populares. Los datos específicos que se recopilan abarcan aspectos como las búsquedas que realizas, las puntuaciones que otros usuarios dan y los comentarios que realizas en redes sociales. Por otro lado, los datos implícitos incluyen detalles como los dispositivos que utilizas para acceder, tus días preferidos para ver contenido, el tiempo que dedicas al servicio y a cada contenido en particular, si ves los episodios completos o parcialmente e incluso qué partes vuelves a ver. Además, se registra cuándo abandonas la visualización y si luego retomas o no, y se analizan las preferencias que compartes con tus amigos o con otros usuarios de tu región.

Esta estrategia quedó en evidencia con el éxito de la serie «House of Cards». En aquel momento, Netflix, originalmente una empresa tecnológica, incursionó en el mundo del entretenimiento. Tomando una decisión audaz, invirtieron 100 millones de dólares en producir una serie original, liberando todos los episodios al mismo tiempo, rompiendo con las prácticas tradicionales de los medios. Sin embargo, esta apuesta no fue un tiro al aire; Netflix había estudiado detenidamente a su audiencia. Lograron prever con precisión cómo responderían a un drama político, consideraron el atractivo del director David Fincher y tomaron en cuenta el éxito de la versión británica.

Pero su uso del big data no se limitó a asegurar el triunfo de «House of Cards». Implementaron una estrategia de promoción basada en datos, creando diez versiones distintas del tráiler para diferentes segmentos de la audiencia, según sus patrones de comportamiento en la plataforma. Aprovechando el análisis del Big Data, Netflix logró predecir el momento óptimo para lanzar la serie, seleccionar al elenco y prever la evolución de la trama. En definitiva, el Big Data contribuyó de manera sustancial a fortalecer la lealtad de los usuarios.

3. Proceso de Gestión de Datos

¿Alguna vez te has preguntado qué ocurre por ejemplo después de aceptar esos «términos y condiciones»? Esa pequeña acción es el umbral que abre la puerta al análisis y procesamiento de tus datos por parte de las empresas. Así es como empiezan a descubrir patrones en tus acciones y preferencias, lo que conduce a la automatización de procesos y toma de decisiones más acertadas.

En este punto la  inteligencia artificial (IA) juega un papel importantísimo, pero este camino no está exento de dilemas éticos. La IA, ese prodigio tecnológico que impulsa la automatización y la toma de decisiones, se nutre de datos para operar de manera efectiva. Sin embargo, este proceso trae consigo un reto crucial: la misma IA diseñada para decisiones imparciales y lógicas puede ser influenciada por sesgos y discriminación.

¿Cómo puede ser que algo basado en matemáticas y lógica tenga prejuicios? La respuesta se encuentra en los datos que se utilizan, los cuales pueden contener sesgos históricos arraigados en la sociedad. Este dilema ético ha desatado debates sobre cómo garantizar que las decisiones automatizadas sean genuinamente justas y equitativas.

Esta problemática ha colocado a las empresas en una encrucijada ética y operativa. Por un lado, la automatización de procesos y la toma de decisiones precisa son elementos vitales para mejorar la eficiencia. Por otro lado, la preocupación surge debido a la posibilidad de que se creen desequilibrios y se mantenga la desigualdad. La resolución se encuentra en la educación y en una comprensión profunda de cómo recolectar y estructurar la información de forma efectiva y ética. El factor clave implica emplear los datos de manera consciente y ética. Reconocer cuáles tipos de datos son delicados, como la información médica, los datos biométricos, la ascendencia, la identidad cultural y la identidad personal, se convierte en un elemento esencial.

En este punto, cobra relevancia la normativa de salvaguarda de la información, que establece directrices para proteger la confidencialidad y la justicia en el empleo de los datos, en el caso de Ecuador, la norma que contiene estas disposiciones es la Ley de Protección de Datos Personales. Las compañías necesitan tener en cuenta qué datos son adecuados para el tratamiento y cuáles demandan una atención más precisa, llegando incluso a su exclusión si es necesario.

La gestión efectiva de los datos se mantiene como un desafío en constante evolución. Las empresas deben encontrar un equilibrio entre la personalización y el respeto a la privacidad. La ética digital se convierte en el faro que guía para asegurar que la inteligencia artificial beneficie a la sociedad sin dañarla. Con una profunda conciencia de la responsabilidad y una ejecución transparente, avanzamos hacia una era donde las decisiones automáticas sean auténticamente justas y enriquecedoras para todos.

También te puede interesar: La transformación digital: un imperativo para el sector legal

Conclusión

La gran cantidad de información que generamos con nuestras actividades cotidianas en internet, ha generado el fenómeno conocido como “Big Data”. Esta información ha ayudado a que las empresas entiendan a sus consumidores y la forma en la que operan en el entorno digital. A pesar que esta información ha ayudado a las empresas a tomar decisiones más acertadas, esto también conlleva desafíos éticos y prácticos. 

La inteligencia artificial para tomar decisiones automáticas puede perpetuar prejuicios y discriminación por sesgos históricos en los datos. En este contexto, la educación y transparencia son esenciales. Las empresas deben comprender la importancia de recopilar y estructurar datos de manera ética, optimizando el equilibrio entre la personalización y la privacidad, así pueden aprovechar al máximo el potencial del Big Data, pero a su vez tomar decisiones justas para los consumidores.

Bibliografía

Definition of big data – Gartner information technology glossary. (s/f). Gartner. Recuperado el 30 de agosto de 2023, de https://www.gartner.com/en/information-technology/glossary/big-data

Ellsworth, D., & Cox, M. (1997, enero). Managing big data for scientific visualization. Researchgate.net. https://www.researchgate.net/publication/238704525_Managing_big_data_for_scientific_visualization

Emails: correos electrónicos recibidos diariamente en el mundo hasta 2025. (2022, febrero). Statista. https://es.statista.com/estadisticas/637674/numero-de-correos-electronicos-al-dia-en-todo-el-mundo–2019/

González, J. (2023, junio 13). Netflix: Las claves del éxito basado en Big Data. Deyde DataCentric. https://www.datacentric.es/blog/insight/exito-netflix-datos/

Instituto del Conocimiento, I. de I. (2016, junio 28). Las 7 V del Big data: Características más importantes – IIC. Instituto de Ingeniería del Conocimiento. https://www.iic.uam.es/innovacion/big-data-caracteristicas-mas-importantes-7-v/

LegalToday, & Gil González, E. (2016, octubre 18). ¿Qué es el big data y por qué debe interesarme si soy abogado? Legaltoday.com; Legal Today. http://www.legaltoday.com/practica-juridica/derecho-civil/nuevas-tecnologias-civil/que-es-el-big-data-y-por-que-debe-interesarme-si-soy-abogado-2016-10-18/

The Four V’s of Big Data By IBM. (2016, diciembre). Slideshare.net. https://www.slideshare.net/MertAkn1/the-four-vs-of-big-data-by-ibm
Wikipedia contributors. (s/f). Microsoft Access. Wikipedia, The Free Encyclopedia. https://es.wikipedia.org/w/index.php?title=Microsoft_Access&oldid=152110345

Descarga el caso de éxito

Lorem fistrum por la gloria de mi madre esse jarl aliqua llevame al sircoo. De la pradera ullamco qué dise usteer está la cosa muy malar.

Lorem ipsum dolor sit amet consectetur adipiscing elit, diam quisque tempus inceptos sociosqu malesuada hac, proin conubia luctus sociis erat felis. Donec mi porttitor primis gravida mollis torquent nam nisl, porta suscipit pulvinar est malesuada risus curabitur, sollicitudin arcu fermentum nullam vel ornare turpis. Cum sociosqu mi ultrices in suscipit vivamus donec eleifend, hac tortor etiam dictumst auctor erat facilisi faucibus, mattis montes semper tellus quisque ut facilisis. Volutpat auctor hac turpis est lectus rutrum et gravida, curabitur massa aliquam eget conubia dis bibendum, maecenas sollicitudin fusce penatibus inceptos sociis imperdiet.

Suscríbete para no perderte las novedades

Thanks for subscribed!

Processing...

También te puede interesar

Predicciones con AI: ¿El futuro de las decisiones judiciales?

Guardián Digital: obligaciones del titular de firma electrónica y su uso responsable

Datos Masivos, Dilemas Legales: Navegando los Debates del Uso del Big Data