data-metrics.pro / Casos / Combinado metalúrgico ruso (líder regional)
Caso de customer journey · 15 fuentes · 16 semanas

Cero conversación entre ellas.
Un grafo que las une.

El portal B2B de un gran combinado metalúrgico ruso — 5 000+ clientes corporativos, USD 12 000 M de facturación — tenía sus datos repartidos en más de 15 fuentes: web tracking, ERP, Salesforce, sistemas de planta, telefonía, calculadora de tonelaje, correo, marketing tools. Cada equipo medía cosas distintas. Construimos un ETL unificado, generamos el primer grafo Markov del recorrido del cliente (Retentioneering) y enlazamos cada nodo con CRM Salesforce.

+14%
revenue marketing
// 6 meses post go-live
15+ fuentes
unificadas en un ETL común
// vs silos previos
99% precisión
de datos en métricas críticas
// auditoría interna
40 h/sem
de trabajo manual liberadas
// validado por gerencia
+34% ROI marketing
medible y atribuible
// 12 meses rolling
// flujo en producción LIVE
SESSION_STARTCATALOGPRODUCT1CARTDOCS_CERTSDELIVERYPAYMENTDONE
// 01 · TL;DR

El caso, en cuatro frases.

Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.

01

Quince fuentes, cero diálogo, mil discusiones semanales.

Web tracking, ERP, Salesforce, calculadora de tonelaje, planta, telefonía, marketing tools, email. Cada uno con su propia identidad de cliente.

02

Unificamos en ETL y construimos el primer Markov chain del portal.

Identity resolution + dbt + Airflow + ClickHouse. Sobre eso, Retentioneering para generar el grafo — cada arista un peso real, no estimado.

03

Descubrimos un patrón invisible: el camino por certificados.

Un % alto del cart no completaba porque salía a buscar certificados. Movimos los documentos al carrito. +14% revenue.

04

Precisión 99%, 40 h/sem liberadas, marketing con ROI atribuible.

Y un grafo que el equipo de producto abre todos los días — no un dashboard que abren los lunes a las 9.

// 02 · El problema

Combinado metalúrgico ruso (líder regional) llegó con un problema medible.

  1. 01

    15 fuentes, 5 identidades del mismo cliente

    El mismo comprador corporativo aparece con 5 IDs distintos: web cookie, mobile device id, Salesforce contact, número telefónico, email corporativo. Sin resolución, cada análisis lo cuenta como 5 personas.

    5× usuario fantasma
  2. 02

    El recorrido vive entre fuentes

    El cliente entra por web, llama a un comercial, recibe email, vuelve 3 días después, registra. El recorrido real cruza 4 fuentes — pero cada fuente solo ve un segmento.

    journey invisible
  3. 03

    Reportes manuales 3 días por semana

    El analista reconciliaba a mano Excel + SQL ad hoc + export Salesforce. 40 horas/semana en preparar antes de analizar.

    40 h/sem manual
  4. 04

    Métricas inconsistentes entre departamentos

    Marketing decía «5 000 leads». Sales decía «3 200 oportunidades». Producto decía «8 100 registros». Los 3 tenían razón en su fuente — pero ninguno en la realidad.

    3 fuentes · 3 verdades
  5. 05

    Documentos / certificados enterrados

    Los certificados de calidad eran críticos para compras industriales — pero vivían a 3 clics del carrito. Nadie había medido cuánto pesaban en la conversión.

    3 clics · ?% impacto
  6. 06

    Sin atribución cruzada

    El equipo de marketing operaba sobre last-click web. Las llamadas telefónicas (canal mayor en B2B siderurgia) eran invisibles para ROAS.

    0 ROAS telefónico
  7. 07

    Insights no aterrizaban

    Cada PDF analítico tenía 40 slides, los PMs leían 4. La decisión se tomaba por intuición y la analítica acumulaba polvo.

    0 acción / PDF
// trabajo manual de reconciliación
40h/sem
// fuentes sin lenguaje común
15
// tiempo para reconstruir camino
3días
// 03 · La solución

Lo que construimos.

No reemplazamos lo que ya funcionaba. Construimos capas finas que comunicaron sistemas ciegos entre sí.

SUPERFICIE 01

Grafo dirigido del recorrido del cliente

Cada nodo es un estado. Cada arista una transición con peso real. Click en un nodo → segmentos que pasan por ahí. 12 nodos · 28 aristas · ~16 000 recorridos únicos/mes.

SUPERFICIE 02

Salesforce timeline embedded

En el contacto Salesforce, el vendedor ve un timeline con los últimos 30 eventos del portal — visitas, productos vistos, certificados descargados, abandonos, regresos. Llama con contexto.

SUPERFICIE 03

Exec BI · KPIs por etapa

Conversión, drop-off, tiempo medio entre etapas. Por segmento, geografía, industria. Todo en DataLens.

SUPERFICIE 04

Experimentos sobre el grafo

«¿Qué pasa si movemos certificados antes del cart?». Hipótesis con segmento, criterio, resultado, decisión. Memoria institucional.

// 04 · Arquitectura

Stack y capas.

stack: dbt Core · Airflow · ClickHouse · Retentioneering · Salesforce Streaming API · Postgres + Citus

L1

Captura

tracker.js · web · 127 eventos tipados
iOS / Android SDK · 60 eventos
SAP / ERP CDC · Debezium
Salesforce Streaming API
L2

ETL · medallion

Airflow · 80 DAGs
Bronce (raw) en ClickHouse
Plata (identity resolution + enrichment) · dbt
Oro (aggregated for BI + Retentioneering) · dbt
L3

Almacenamiento

ClickHouse · 24 meses caliente
Delta Lake · histórico 5 años (S3-compat)
Postgres + Citus · serving Salesforce
Redis · hot cache
L4

Superficies

Retentioneering UI (custom theme cliente)
Salesforce embedded panel
Yandex.DataLens executive
Slack alerts ETL
// 05 · Resultados

Los números.

Medidos por el equipo del cliente, no por nosotros. Comparativa: baseline previo al go-live.

Métrica Antes Después Δ
Fuentes de datos unificadas
15 silos
1 ETL común
nuevo
Identidad de cliente única
5 IDs distintos
1 (resolution)
−80%
Precisión de datos en métricas críticas
n/d
99%
nuevo
Tiempo de preparar informes
semanas
1 hora
~40× más rápido
Horas / semana liberadas
0
40 h
nuevo
Conversión visita → pedido
2.3%
5.8%
+152%
Bounce rate
60%
45%
−15 pp
ROI marketing
baseline
+34%
good

«Por primera vez todo el equipo abre el mismo grafo y discute sobre lo mismo. Antes cada uno traía su Excel.»

H
Head of Data Combinado metalúrgico ruso
Inversión total USD 165k // 16 semanas + setup ETL
Uplift + ahorro anualizado USD 2.4M // +14% revenue + 40 h/sem libres
Payback 2.5 meses // validado por CFO
ROI a 12 meses 14.5× // rango conservador
// 06 · Lecciones

Lo que aprendimos — y aplicamos en el siguiente caso.

L1

Identity resolution es 60% del proyecto.

Sin un único `user_id` que ate web + mobile + Salesforce + telefonía, cualquier análisis vive sobre arena. Antes de pensar en visualización, hay que firmar la lista de identidades y deduplicar 6 semanas. Sin glamour, pero indispensable.

L2

Grafos cambian la intuición — los dashboards no.

El equipo de producto había mirado dashboards de embudo durante 2 años sin notar el patrón de certificados. El Markov chain lo hizo visible en una sesión de 30 minutos. Diferentes representaciones revelan diferentes verdades.

L3

El analista que abre el grafo se gana presupuesto.

Cuando el PM B2B mostró el Markov chain en directorio, la decisión de mover certificados se aprobó en la misma reunión. Antes, las mismas cifras agregadas no habían movido a nadie en 18 meses.

// 07 · Siguientes pasos

¿Te suena familiar? Hablemos.

No vendemos software de plantilla. Empezamos siempre con una auditoría gratis de 4 semanas: nos sentamos con tu equipo, mapeamos sistemas y dolores, y entregamos un PDF con 3–5 quick wins concretas.