data-metrics.pro / Casos / Combinado metalúrgico ruso (líder regional)
Caso de migración cloud · siderurgia · 16 semanas

Yandex dentro.
Cero interrupción de servicios críticos.

Un gran combinado metalúrgico ruso — uno de los mayores productores de acero del mundo, con facturación superior a USD 12 000 M y plataforma B2B operando con 5 000+ clientes corporativos — necesitaba migrar completamente su infraestructura de datos desde el ecosistema Google Cloud Platform hacia Yandex Cloud, manteniendo la continuidad operativa de servicios críticos. Diseñamos e implementamos una infraestructura completa con arquitectura medallion Bronze → Silver → Gold, Apache Airflow como orquestador, ClickHouse como almacén central y DataLens como capa de visualización. Tiempos de consulta: de minutos a segundos.

0
interrupciones de servicios críticos
// migración por etapas
min → s
tiempo medio de consulta DataLens
// post-agregados ClickHouse
Bronze · Silver · Gold
arquitectura medallion
// raw + processed + analytical
End-to-end
tracking desde clic a entrega
// fulfillment completo
−% costo
vs stack Google previo
// validado por finanzas
// flujo en producción LIVE
KAFKAAIRFLOWBRONZESILVERGOLDCLICKHOUSEDATALENSEXEC
// 01 · TL;DR

El caso, en cuatro frases.

Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.

01

Google fuera por razones geopolíticas + costos.

El cliente necesitaba salir del ecosistema GCP hacia infraestructura soberana, sin perder funcionalidad analítica ni interrumpir servicios críticos del portal B2B.

02

Migración por etapas con plan de reversión.

Cada fuente migró con periodo de coexistencia 2-4 semanas. Lecturas a ambos sistemas en paralelo, validación cruzada, corte solo cuando los datos coincidían al 99%+.

03

Arquitectura medallion sobre ClickHouse + Airflow.

Bronze (raw) · Silver (validated) · Gold (pre-aggregated). DataLens consulta directo a Gold, queries que tardaban minutos en BigQuery ahora corren en segundos.

04

Tracking end-to-end del fulfillment: del clic al producto entregado.

Por primera vez, el cliente atribuye ingresos del portal B2B a campañas digitales con visibilidad completa del lifecycle.

// 02 · El problema

Combinado metalúrgico ruso (líder regional) llegó con un problema medible.

  1. 01

    Necesidad geopolítica de migrar fuera de GCP

    Por razones regulatorias y soberanía de datos, el cliente necesitaba salir del ecosistema Google completo en plazos definidos. No era opcional.

    regulatorio
  2. 02

    Servicios críticos en producción

    El portal B2B con 5 000+ clientes corporativos no podía dejar de funcionar ni un minuto durante la migración. Cualquier interrupción = pérdida de revenue + reputación.

    0 downtime
  3. 03

    Consultas en BigQuery lentas y caras

    Reportes complejos en Looker tomaban minutos. Costos de consulta crecían con el volumen. Equipos esperaban resultados.

    slow + caro
  4. 04

    Sin tracking end-to-end del fulfillment

    El clic publicitario y la entrega del producto vivían en sistemas distintos. Imposible atribuir ROI real al marketing.

    journey fragmentado
  5. 05

    Datos dispersos sin arquitectura clara

    Capas mezcladas: datos crudos, procesados y analíticos en mismas tablas. Sin separación, sin testing, sin lineage.

    0 arquitectura
  6. 06

    Sin orquestador robusto

    Scripts cron en VMs aisladas. Cuando uno fallaba, nadie se enteraba hasta que el dashboard del lunes no tenía datos.

    cron frágil
  7. 07

    Métricas inconsistentes entre departamentos

    Marketing veía sesiones de GA, ventas veía órdenes de SAP, fulfillment veía entregas. Sin reconciliación.

    silos verticales
// migración obligatoria con plazos
regulatorio
// servicios críticos no interrumpibles
0 ventana
// consultas BigQuery con costos crecientes
minutos
// 03 · La solución

Lo que construimos.

No reemplazamos lo que ya funcionaba. Construimos capas finas que comunicaron sistemas ciegos entre sí.

SUPERFICIE 01

DataLens BI · queries en segundos

Mismo dashboard ejecutivo. Misma profundidad. Pero conectado a ClickHouse con tablas pre-agregadas. Las queries que en BigQuery tomaban 47 min ahora corren en 1.4 s.

SUPERFICIE 02

Fulfillment dashboard · tracking del clic a la entrega

Cada orden lleva un journey: clic publicitario → cotización → orden creada → preparación almacén → empaque → envío → entrega. Cada paso con timestamp + responsable + SLA.

SUPERFICIE 03

Marketing attribution · ROI real del clic

Yandex.Direct → landing → comportamiento web → cotización → orden → entrega. Atribución completa. Permite optimizar pujas con LTV real, no con conversión web.

SUPERFICIE 04

Exec DWH view · capa Gold como fuente única

El comité ejecutivo consulta la capa Gold (pre-agregada, validada, governance). DataLens dashboards alimentados de Gold. Conversaciones sobre números, no fuentes.

// 04 · Arquitectura

Stack y capas.

stack: Yandex Cloud · ClickHouse · Apache Airflow · dbt Core · DataLens · Debezium CDC · Yandex Object Storage · PostgreSQL

L1

Ingesta

Yandex.Metrica streaming · web events
Debezium CDC · sistemas core
API connectors · Yandex.Direct + Google Ads
Local DB exporters · ventas + usuarios
L2

Orquestación + transform

Apache Airflow · 80+ DAGs
dbt Core · 140+ models
Spark batch (cargas pesadas históricas)
Custom Python scripts (legacy reescrito)
L3

Almacenamiento

ClickHouse cluster · 24 meses caliente
Yandex Object Storage · histórico 5 años
PostgreSQL · servicios y catálogos
Redis · cache queries frecuentes
L4

Superficies

DataLens · BI principal
Custom dashboards · fulfillment tracking
Slack · alertas pipeline
Exec mobile · top KPIs
// 05 · Resultados

Los números.

Medidos por el equipo del cliente, no por nosotros. Comparativa: baseline previo al go-live.

Métrica Antes Después Δ
Interrupciones de servicios críticos
n/a
0
nuevo
Tiempo medio query DataLens
minutos
segundos
~30×
Tracking end-to-end fulfillment
parcial
completo (clic → entrega)
nuevo
Capas medallion separadas
mezcladas
Bronze + Silver + Gold
nuevo
Tests automatizados por modelo
0
200+
nuevo
Costo de infraestructura
baseline (Google)
reducido
good
Autonomía analítica de equipos
dependiente IT
self-service
nuevo
Calidad de datos auditable
manual
governance + lineage en git
nuevo

«Cambiamos toda la infraestructura sin que el equipo de negocio se enterara — hasta que vieron las consultas en segundos.»

H
Head of Data Engineering Combinado metalúrgico ruso
Inversión total USD 380k // 16 sem + setup + 6 meses operación
Ahorro infra + uplift anualizado USD 1.2M // licencias GCP + horas analista
Payback 3.8 meses // validado por CFO
ROI a 24 meses 6.3× // rango conservador
// 06 · Lecciones

Lo que aprendimos — y aplicamos en el siguiente caso.

L1

Migrar cloud es 80% gobernanza, 20% código.

El equipo técnico quería empezar por el corte. El equipo de operaciones exigía dos pipelines en paralelo. El segundo enfoque parecía más caro, más lento — y fue el único que llegó a producción sin un incidente.

L2

Migración paralela es la única migración segura.

El pipeline GCP siguió funcionando hasta que el de Yandex pasó 4 semanas consecutivas con outputs idénticos. Solo entonces se hizo el corte. Cero interrupción porque hubo dos pipelines en producción durante semanas.

L3

El método de migración vale más que el destino.

El verdadero entregable no fue Yandex Cloud — fue el método de migración que el cliente reutiliza ahora para otros dominios. Bronze → Silver → Gold + parallel pipeline + 200+ tests es el playbook que extendieron a 4 sub-dominios más.

// 07 · Siguientes pasos

¿Te suena familiar? Hablemos.

No vendemos software de plantilla. Empezamos siempre con una auditoría gratis de 4 semanas: nos sentamos con tu equipo, mapeamos sistemas y dolores, y entregamos un PDF con 3–5 quick wins concretas.