Trabajo de investigación · 3STI

Observatorio 2030

Big Data e inteligencia artificial en el comercio

Sector asignado: comercio, supermercados y venta online

Autor: Brian · 3STI — Digitalización aplicada a los sectores productivos · CIFP Hespérides

Cuando compras en una web o pasas la tarjeta en el supermercado, dejas un rastro de datos: qué miraste, cuánto tardaste, si volviste al día siguiente. Las empresas llevan años usando eso para organizar el stock o mandarte ofertas, pero ahora la IA permite cruzar mucha más información y decidir cosas en minutos. Me interesa el comercio porque es el sector que más noto en el día a día: Amazon, Mercadona, tiendas de ropa… En este trabajo he buscado ejemplos concretos, no frases genéricas, y al final intento responder si todo esto ayuda de verdad al cliente o solo a la cuenta de resultados de la empresa.

¿Puede un supermercado saber lo que vas a comprar antes de que tú mismo lo tengas claro?

Fundamentos

Del dato a la decisión

En comercio los datos salen de casi cualquier gesto: una compra online guarda producto, hora, móvil o PC, y si cerraste el pedido o dejaste el carrito a medias. En tienda física entran la tarjeta de cliente, la caja y, en algunos sitios, sensores que cuentan gente por pasillos. Todo eso se guarda en servidores —muchas veces en la nube— y ahí empieza el trabajo de ordenarlo.

Un dato suelto no sirve para mucho. Lo que importa es el conjunto: por ejemplo, ver que los viernes por la tarde suben las ventas de cerveza cuando hay partido en la tele, y con eso decidir meter más stock el jueves. Eso ya es información útil para el encargado de la sección.

Big Data e IA van juntos en la práctica: hacen falta muchos registros para entrenar un modelo, y hace falta IA (o herramientas muy potentes) porque un equipo humano no puede revisar millones de líneas de ventas a mano.

Tabla: del dato a la decisión

Dato recopilado Fuente del dato Tipo de dato Información obtenida Decisión empresarial
Lo que compras cada semana App del supermercado o tarjeta de puntos Estructurado Qué productos repites y con qué frecuencia Mandarte cupones o cambiar lo que te sale primero en la app
Carrito que dejas sin pagar Tienda online Estructurado Qué ibas a comprar y no terminaste Enviarte un correo con descuento para que vuelvas
Cuánta gente pasa por un pasillo Sensores o cámaras (sin identificar personas) No estructurado (vídeo/conteo) Qué zonas de la tienda se usan más Mover productos o poner promos donde hay más tráfico
Opiniones en texto o estrellas Web de la tienda, Google, redes No estructurado (texto) Quejas repetidas o productos que gustan Retirar un lote defectuoso o responder al cliente
Precios de la competencia Bots que leen webs rivales Semiestructurado Si estás caro o barato en un producto Bajar o subir precio ese mismo día

Conceptos clave

Dato

El hecho tal cual, sin explicación. Ejemplo: «ayer a las 19:14 se vendieron 3 litros de leche en la tienda 12».

Información

El dato ya interpretado. Ejemplo: «los martes por la tarde se vende el doble de leche en barrios con muchos estudiantes».

Datos estructurados

Van en tablas claras: filas y columnas. Lo típico en un ticket: fecha, código de producto, precio, cantidad.

Datos no estructurados

No vienen en una tabla lista: un vídeo de seguridad, una reseña escrita como quiera el cliente, una foto del producto.

Ciclo de vida del dato

Se recoge → se guarda → se limpia (quitar errores) → se analiza → se usa en la empresa → al final se archiva o se borra si ya no hace falta.

Big Data

Tanto volumen y variedad que Excel o una base de datos pequeña se quedan cortos. En Amazon, por ejemplo, el número de compras por hora en fechas como el Black Friday es enorme.

Minería de datos

Buscar patrones que no ves a simple vista. El ejemplo clásico del instituto: en Walmart vieron que quien compraba pañales a veces también llevaba cerveza.

Las 5 V del Big Data

  • Volumen En días punta, Amazon mueve más de 1,6 millones de transacciones por hora (dato que aparece en varios informes sobre el Black Friday).
  • Velocidad Los precios en marketplaces grandes pueden cambiar muchas veces al día según demanda y competencia; se habla de millones de actualizaciones diarias en Amazon.
  • Variedad No es solo la venta: clics, devoluciones, reseñas, redes, sensores de almacén, ubicación del móvil si la app lo pide...
  • Veracidad Si el sistema dice que hay 50 unidades y en realidad hay 0, vendes algo que no puedes enviar y el cliente se cabrea.
  • Valor Recoger datos por recoger no vale; tiene que servir para decidir algo (pedir más stock, no spamear al cliente, etc.).

Casos reales

Tres aplicaciones reales de IA

He elegido tres empresas que casi todo el mundo conoce. No son inventadas: he mirado sus webs oficiales y algún informe. Pulsa cada pestaña para ver el detalle.

Amazon

Motor de recomendaciones personalizadas

Problema actual
En Amazon hay tantísimos productos que sin ayuda pierdes tiempo. Las recomendaciones («los que compraron esto también…») son clave: en la documentación de AWS citan que alrededor del 35% de las ventas pasan por ese sistema.
Datos utilizados
Lo que compraste antes, lo que miras, la lista de deseos, cuánto tardas en cada página, las valoraciones y lo que compran otros usuarios parecidos a ti.
Tipo de IA
Sistemas de recomendación: mezclan filtrado colaborativo (comparar con otros clientes) y por contenido (productos parecidos).
Funcionamiento básico
En resumen: si mucha gente con gustos como los tuyos compró B después de A, te mostrará B. Va actualizando mientras navegas. No es magia, es estadística y modelos entrenados con millones de compras.
Beneficio
Encuentras antes lo que te interesa y la empresa vende más. AWS menciona mejoras importantes en ingresos cuando otras tiendas usan su servicio Personalize (cifras del 20-30% según el caso).
Limitación o riesgo
Solo te empuja hacia lo que ya sueles ver; cuesta descubrir cosas distintas. También hay debate sobre si el precio puede cambiar según tu perfil, aunque eso cuesta más demostrarlo.
Caso real
Amazon Personalize: la misma lógica que usa la tienda, vendida a otras empresas vía AWS.

Fuente: aws.amazon.com/personalize

Mercadona

Gestión predictiva de stock con IA

Problema actual
Tienen más de 1.600 tiendas y miles de referencias. Si pides de más, tiras comida; si pides de menos, se agota el producto y la gente se va a la competencia.
Datos utilizados
Ventas pasadas de cada tienda, tiempo (helados con calor, sopas con frío), fiestas del pueblo, datos de proveedores, temperatura en almacenes, etc.
Tipo de IA
Predicción de demanda con machine learning (series temporales y modelos de regresión).
Funcionamiento básico
El software mira el histórico y calcula cuánto hará falta en los próximos días en esa tienda concreta. Si detecta un pico raro (fiestas, buen tiempo), sube el pedido. No lo hace a ojo el encargado: lo propone el sistema y luego alguien puede revisarlo.
Beneficio
Menos desperdicio y menos huecos en la estantería. En su informe de sostenibilidad hablan de haber reducido el desperdicio alimentario alrededor de un 20% en varios años (hay que leer bien el periodo del informe).
Limitación o riesgo
Cuando pasa algo que no estaba en los datos viejos (COVID, temporal fuerte), el modelo se lía. Si el proveedor miente sobre plazos o stock, el error se propaga.
Caso real
Llevan años metiendo tecnología en logística; en notas de prensa e informes citan inversiones millonarias anuales en digitalización desde 2019.

Fuente: mercadona.es — Sostenibilidad

Zara (Inditex)

Precios dinámicos y detección de tendencias

Problema actual
En moda lo que vende hoy puede sobrar en tres semanas. Hay que pillar tendencias pronto y saber cuándo rebajar sin regalar el margen.
Datos utilizados
Ventas por tienda y web, devoluciones, qué se comenta en redes, tendencias de búsqueda y qué miras en la web sin comprar.
Tipo de IA
Procesamiento de lenguaje en redes (ver qué se habla) y algoritmos que proponen precios y rebajas.
Funcionamiento básico
Software que lee mucho contenido social para ver colores o cortes que empiezan a repetirse, y otro bloque que sugiere cuándo bajar precios según ventas y stock. El diseño humano sigue existiendo, pero con datos detrás.
Beneficio
Zara saca colecciones muy a menudo (cada pocas semanas) comparado con marcas más lentas. Las rebajas pueden ser más finas y no dejar tanto stock muerto.
Limitación o riesgo
En redes a veces solo ves moda de un grupo pequeño y parece tendencia global. Y sigue el debate de si el precio debería cambiar según dónde vives o qué móvil usas.
Caso real
Inditex tiene su plataforma de datos SINT y en 2023 comunicó un plan de unos 1.800 millones de euros en digitalización hasta 2025 (dato de su web corporativa).

Fuente: inditex.com — Innovación

Flujo de información

El viaje del dato en el sector del comercio

  1. 1. Captura del dato

    Compra, clic, tarjeta de puntos, reseña, devolución…

  2. 2. Almacenamiento

    Servidores en la nube (AWS, Azure, Google).

  3. 3. Limpieza y organización

    Quitar duplicados y corregir errores.

  4. 4. Análisis

    Informes y patrones de compra.

  5. 5. Aplicación de IA

    Predecir ventas, recomendar, ajustar precios.

  6. 6. Decisión empresarial

    Pedir stock, ofertas, cambios de precio.

  7. 7. Revisión humana

    Comprobar que la decisión sea justa y coherente.

Lo resumo así: en cuanto interactúas con la tienda ya hay dato. Va a un almacén enorme en la nube, se limpia porque si no mezclas formatos y errores, luego todo falla. Con datos decentes sacas gráficos y modelos; la IA entra sobre todo para predecir (¿cuánta leche hará falta el sábado?) o para recomendar. Al final alguien de la empresa debería mirar si la decisión es razonable: no vale decir «lo dice el algoritmo» y listo, sobre todo si afecta a precios o a datos personales.

Riesgos y medidas

Ciberseguridad y protección de datos

Riesgo Ejemplo en comercio Consecuencia Medida
Robo de datos de clientes Hackean la base de datos de una tienda online y roban tarjetas o DNI Fraude, clientes que no vuelven, multas RGPD (muy altas) Cifrar datos guardados y en tránsito (HTTPS, AES)
Acceso no autorizado Empleado cambia precios en el sistema para ayudar a alguien de fuera Pérdidas de dinero, desconfianza Cada usuario solo ve lo que necesita (RBAC) y doble factor al entrar (MFA)
Ransomware Virus que cifra el stock y las cajas de una cadena de supermercados Tiendas paradas, datos inutilizados si no hay copia Backups 3-2-1 y sistemas actualizados
Demasiados datos personales App del super que pide ubicación todo el rato sin motivo claro Quejas, sanciones de la AEPD Pedir solo lo necesario (minimización)
Phishing Correo falso al departamento de compras pidiendo la clave del ERP Entran al sistema de pedidos y proveedores Formación, filtros de correo, contraseñas fuertes

Medidas obligatorias

🔐 Control de accesos (RBAC) 🔑 Contraseñas seguras + MFA 💾 Copias de seguridad (regla 3-2-1) 🔒 Cifrado en reposo y en tránsito 🔄 Actualizaciones y parches regulares 📋 Protección de datos personales (RGPD) ✂️ Minimización de datos 👤 Supervisión humana de decisiones automatizadas

Opinión personal

¿Revolución o exageración?

  1. ¿Qué tareas podrían automatizarse parcialmente?

    Inventario, cambiar precios según demanda, correos de «te dejaste el carrito», detectar pagos raros y primeras respuestas con chatbot ya van por ahí. En supermercados grandes no me extrañaría ver más robots reponiendo en unos años, aunque al principio costará pasta.

  2. ¿Qué tareas seguirán necesitando intervención humana?

    Quejas gordas de un cliente enfadado, decidir no subir el agua en una emergencia, negociar con proveedores, montar la estrategia de la tienda y revisar que el algoritmo no esté discriminando. Un chatbot no tiene la misma paciencia que una persona cuando algo va mal de verdad.

  3. ¿Qué nuevos perfiles profesionales podrían aparecer?

    Personas que lean informes de ventas, que vigilen que los precios automáticos sean legales, que mantengan robots de almacén, o que expliquen a los empleados cómo usar las nuevas herramientas. Nombres raros en ofertas de empleo, pero el trabajo sería eso.

  4. ¿Qué conocimientos necesitará un trabajador para adaptarse?

    Saber leer un panel con gráficos, entender lo mínimo del RGPD, no creer ciegamente lo que dice el programa y preguntar cuando algo huele raro. No hace falta ser programador, pero sí saber que la IA se equivoca.

  5. ¿Qué riesgos tendría depender demasiado de la IA?

    Si el modelo falla en Black Friday te quedas sin stock de lo más vendido. Si todo el mundo confía solo en la pantalla, luego nadie sabe decidir a mano. Y si AWS o similar se cae un rato, muchas empresas que dependen de la misma nube lo notan a la vez.

  6. ¿La IA destruirá más empleos de los que creará?

    Yo creo que al principio se notará más en caja automática, almacén y reposición que en puestos nuevos, porque los nuevos piden estudios que no todo el mundo puede hacer. Eso no significa que sea imposible formar a la gente, pero hay que invertir; si no, la diferencia entre quien programa y quien no aumenta.

Transparencia

Uso responsable de la IA

Herramienta Para qué la usé Algo útil Corrección / verificación
ChatGPT / Claude Aclarar dudas de vocabulario y ver si me dejaba algo del esquema del PDF Me recordó apartados que pide el enunciado y me propuso buscar Mercadona, que yo solo tenía Amazon en mente Los porcentajes los contrasté en la web de AWS y en informes; la IA mezcló una vez ventas con ingresos totales
Google Encontrar páginas oficiales y noticias con cifras Localicé el informe de sostenibilidad de Mercadona y la parte de innovación de Inditex En blogs ponían cifras de años distintos en el mismo párrafo; al final usé sobre todo webs de empresa y EUR-Lex
diagrams.net + esta web Boceto del flujo del dato; luego lo pasé al HTML El esquema en papel ayuda a no saltarte pasos El diagrama final lo hice en la página, no es una captura literal de la plantilla
Necesito para un trabajo de instituto ejemplos de cómo Mercadona usa IA
para el stock. Explícame el problema, qué datos usa, cómo funciona más o menos
y qué puede fallar. Si pones números dime de dónde salen porque tengo que citar fuentes.

Bibliografía

Fuentes consultadas