Inicio/Servicios/Marketing Operations/Computer Vision para operaciones
● Mini-producto · Setup 6 – 12 semanas · 12 000 horas validadas (Dodo)

Computer Vision. 12 000 horas no son teoría.

En Dodo Brands medimos 12 000 horas de video de cocina y entregamos KPI a managers en vivo. Yo trabajé en ese pipeline. Hoy lo adapto a tu cadena de restaurantes, planta de manufactura, warehouse o clínica. Sin cambiar hardware. Sin SaaS de USD 9 000/mes.

12 000 h
video procesado en Dodo Brands
// con Sergei en el proyecto
−25%
tiempo de servicio hora pico
// cadena Lima (caso real)
+6%
ventas por mesa post optimización
// medible mes 2
3-4
modelos CV · queue · anomaly · defect · presence
// según tu necesidad
0
partners Gold ofrecen CV productizado LATAM
// nicho ignorado
// flujo del servicio LIVE
QUEUEANOMALYDEFECTPRESENCECOMPLIANCETEMPKPI
// 01 · TL;DR

El servicio, en cuatro frases.

Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.

01

Tienes cámaras. Y no las usas para nada útil.

Las cámaras IP de tu restaurante / planta / warehouse graban 24/7. Alguien las revisa una vez al mes (cuando hay robo). El 99.9% del video se borra sin extraer ninguna métrica operativa.

02

CV transforma video en KPI tiempo real.

Modelos especializados: queue measurement, anomaly detection, defect detection, presence/compliance. Cada uno se entrena para tu caso.

03

Edge computing · sin pagar SaaS por frame.

Procesamiento en Jetson Nano / Google Coral / Raspberry Pi en el local. No subes 12 000 horas a la nube. Pricing 30× menor que SaaS típico.

04

6-12 semanas. Patrón Dodo. Escala PYME.

USD 15-60 k setup + USD 500-1.9 k/mes ongoing. Lo que en enterprise costó USD 380 k acá cuesta USD 30 k.

// 02 · El problema

Por qué llegaste aquí.

  1. 01

    Cámaras graban 24/7. Nadie las usa para nada útil.

    Las cámaras IP de tu restaurante / planta / warehouse graban todo el día. El 99.9% del video se borra sin extraer ninguna métrica operativa.

    99.9% video desperdiciado
  2. 02

    Manager reporta «el servicio fue rápido».

    Sin datos. Decisiones operativas basadas en feeling. Hora pico real vs hora pico percibida no coinciden. Gerentes regionales no saben cuál local es realmente lento.

    0 medición
  3. 03

    SaaS de visión cuesta USD 9 000/mes.

    Eyrene, Logivations y similares cobran por frame procesado en la nube. Para 10 locales con 4 cámaras cada uno: USD 9k-15k/mes solo en procesamiento. Insostenible.

    USD 9k+/mes SaaS
  4. 04

    Sin alertas en tiempo real.

    El robo se descubre al día siguiente. El producto fuera de spec llega al cliente. La cola de 8 personas no se gestiona porque manager está atendiendo otro tema.

    lag detección
  5. 05

    Cero compliance medido.

    Uniforme · zona restringida · presencia obligatoria · temperatura cocina. Auditorías manuales 1×/mes. Resto del tiempo: te enteras por queja del cliente.

    auditoría manual
  6. 06

    Defectos en producción descubiertos por cliente.

    Línea de manufactura produce 1 000 unidades/día. Defectos detectados al final del día (o por el cliente). Cada defecto = 4 unidades buenas ya producidas mal después.

    lag defectos
// video desperdiciado sin métricas
99.9%
// SaaS CV típico para 10 locales
$9k/mes
// auditorías manuales compliance
1×/mes
// 03 · La solución

Lo que construimos contigo.

No vendemos plantillas — construimos capas finas que comunican lo que ya existe.

SUPERFICIE 01

Queue measurement · cuánta cola hay en tiempo real

Modelo YOLO entrenado para detectar personas en fila. Output: longitud cola, tiempo promedio espera, evolución por hora. Alerta cuando cola > N personas o tiempo > M minutos.

SUPERFICIE 02

Anomaly detection · algo raro pasa, alerta inmediata

Modelo entrenado en patrones normales de tu operación. Detecta: objeto fuera de lugar, persona en zona prohibida, tiempo de servicio fuera de rango. Alerta Slack en < 30 segundos.

SUPERFICIE 03

Defect detection · producto fuera de spec en línea

Para manufactura: modelo CV detecta defectos visuales en línea. Se entrena con 200-800 frames anotados. Antes de que el cliente lo reciba.

SUPERFICIE 04

Presence / compliance · uniforme, zona, temperatura

Cumplimiento de uniforme, zonas restringidas, presencia obligatoria. Para clínicas/farmacéutica: zonas con compliance regulatorio. Compliance 70% → 95%+ medido.

// 04 · Pieza firma

8 frames analizados · de cámara IP a KPI en 30 segundos

Sigue un frame real desde la cámara hasta el dashboard. 8 pasos. Latencias reales. Stack visible. Sin streaming masivo a la nube — todo edge.

  1. 01

    01 · CÁMARA — Frame capturado (T+0 ms)

    Cámara IP RTSP genera frame 720p @ 15 fps. Resolución suficiente para detección. Sin requerir hardware nuevo.

  2. 02

    02 · EDGE — Jetson Nano recibe stream (T+50 ms)

    Edge device (USD 99) en el local recibe stream local. Procesa sin subir frames a nube. Solo subirá el KPI agregado.

  3. 03

    03 · PRE-PROCESS — Resize + normalize (T+100 ms)

    Frame resized a 640×480 para inferencia. Normalización RGB. CPU optimizado.

  4. 04

    04 · INFERENCE — YOLO detección personas (T+250 ms)

    Modelo YOLO v8 nano corre en GPU Jetson. Detecta personas en frame con bounding boxes. 3 personas detectadas en zona cola.

  5. 05

    05 · BUSINESS LOGIC — Filtrado por zona (T+280 ms)

    Reglas custom: solo personas en polígono «zona cola» cuentan. Excluye empleados (por uniforme). 2 clientes en cola.

  6. 06

    06 · AGGREGATION — KPI cada 30 segundos (T+30 s)

    Promedio rolling 30 segundos: queue length avg = 2.4 personas, tiempo espera estimado 3 min. 1 número/30s vs 12 000 horas video.

  7. 07

    07 · STREAMING — Solo KPI sube a cloud

    POST JSON {queue_length: 2.4, wait_time: 180, location: 'lima-03'} a backend. 30 KB/día vs 60 GB/día de video raw.

  8. 08

    08 · DASHBOARD — Manager ve en vivo (T+30 s)

    Metabase dashboard actualiza. Manager local ve queue length en pantalla cocina. Si > 5 personas → alerta Slack regional manager.

// 05 · Arquitectura

Cómo está armado.

L1

Hardware existente

Lo que ya tienes en cada local
CÁMARAS IP
720p+ resolución, 10+ fps
CONECTIVIDAD
LAN local + internet básica
ENERGÍA
enchufe estándar para edge device
ESPACIO
10×10 cm para Jetson Nano
L2

Edge computing

Lo que agregamos en cada local
JETSON NANO
USD 99 device · 472 GFLOPS
GOOGLE CORAL
USD 60 alternativa · 4 TOPS Edge TPU
MODELOS
YOLO · MediaPipe · custom PyTorch
PIPELINE
Python OpenCV · gstreamer
L3

Networking + storage

Cómo viaja el KPI a la nube
KPI STREAMING
30 KB/día · MQTT o HTTPS
RETENTION
video local 7 días · KPI 12 meses
AGGREGATION
cloud function cada 30s
STORAGE
Postgres / ClickHouse para series
L4

Surfaces + alertas

Cómo se opera
DASHBOARDS
Metabase per location + regional
ALERTAS
Slack / Telegram en tiempo real
OPERACIÓN
pantallas en cocina/floor
REPORTING
semanal automatizado managers
// 06 · Evidencia

Los números reales.

Métricas observadas en proyectos concretos. Baseline antes vs estado después de la intervención.

Métrica Antes Después Δ
Tiempo de servicio hora pico
baseline
−15 a −25%
−25% (caso Lima)
Ventas por mesa post optimización
baseline
+4 a +6%
+6% mes 2
Compliance uniforme/zona
70%
95%+
+25 pp
Costo procesamiento (vs SaaS)
USD 9k/mes
USD 500-1.9k/mes
−80%
Detección anomalías
1×/mes (auditoría)
tiempo real
30× más rápido
Video que viaja a la nube
12 000 h/mes raw
30 KB/día KPIs
−99.99%

«Mis managers regionales ya no me preguntan «¿cómo está el local de Surco?» — abren el dashboard y ven queue, tiempo servicio, compliance. Pasamos de auditorías mensuales a operación en tiempo real, con las mismas cámaras que ya teníamos.»

A
Anónimo COO · Cadena restaurantes · 18 locales · Lima
Inversión setup USD 15 – 60 k // según locales + modelos
Mensual ongoing USD 500 – 1.9 k/mes // modelos + monitoring + iteración
Payback 4 – 9 meses // según volumen + precio promedio
ROI a 24 meses 3 – 8× // ahorro SaaS evitado + uplift ventas
// 07 · Objeciones

Tres preguntas reales — y mis respuestas honestas.

L1

¿Necesito cambiar mis cámaras?

No. Adaptamos las cámaras IP existentes en el 95% de los casos. Solo pedimos un mínimo de resolución (720p) y fps (10+). En la auditoría in-situ confirmamos qué se puede reusar.

L2

¿Por qué edge computing y no cloud?

Por costo y latencia. Subir 12 000h de video a la nube cuesta una fortuna (USD 9 000+/mes en SaaS típicos). Edge procesa localmente y solo envía el KPI (1 número cada N segundos). Pricing 30× menor que SaaS.

L3

¿Cuánto del patrón Dodo se replica?

Toda la arquitectura es directamente replicable. Lo que en Dodo costó USD 380 k a 1 200 locales, aquí cuesta USD 15–60k a 5–30 locales. La diferencia es escala — el patrón es idéntico.

// 08 · Qué incluye

Qué entregamos, sin sorpresas.

  • Auditoría de cámaras existentes (resolución · fps · ángulos · cobertura)
  • Setup edge computing: Jetson Nano / Google Coral / Raspberry Pi en cada local
  • 3–4 modelos CV: queue measurement · anomaly detection · defect · presence
  • Entrenamiento custom sobre tu caso (fine-tuning con 200–800 frames anotados)
  • Pipeline streaming KPI cada N segundos (no subes 12 000h a la nube)
  • Dashboards Metabase: tiempo servicio · queue length · compliance · alertas
  • Alertas Slack/Telegram para anomalías en tiempo real
  • Documentación del pipeline + runbooks para gerencia operativa
  • Capacitación a managers de local para interpretar KPI
  • 1–2 visitas in-situ por país clave para setup hardware
// 09 · Cómo funciona

El proceso en 5 pasos.

  1. 01

    Auditoría hardware + diagnóstico (1–2 sem)

    Visita in-situ a 1–2 locales pilot. Revisión cámaras existentes, ángulos, resolución, conectividad. Definición de modelos CV.

  2. 02

    Setup edge piloto (2–3 sem)

    Provisión Jetson/Coral en 1–2 locales piloto. Captura de 200–800 frames de entrenamiento. Modelos baseline funcionando localmente.

  3. 03

    Fine-tuning + dashboards (2–3 sem)

    Anotación de frames específicos a tu caso. Re-training de modelos. Setup pipeline streaming KPI. Dashboards Metabase + alertas Slack.

  4. 04

    Rollout a resto de locales (2–4 sem)

    Provisión hardware en locales adicionales. Sincronización de modelos. Capacitación a managers de local. Documentación operativa.

  5. 05

    Go-live + ongoing

    Operación en producción. USD 500–1.9k/mes ongoing para iteración modelos, ajustes según drift, nuevas métricas bajo demanda.

Tienes cámaras. Y no las usas para nada útil.

Las cámaras IP de tu restaurante / planta / warehouse graban 24/7. Alguien las revisa una vez al mes (cuando hay robo). El 99.9 % del video se borra sin extraer ninguna métrica operativa.

CV transforma video en KPI tiempo real

Modelos especializados, cada uno entrenado para tu caso: queue measurement, anomaly detection, defect detection, presence/compliance.

Edge computing · sin pagar SaaS por frame

Procesamiento en Jetson Nano / Google Coral / Raspberry Pi en el local. No subes 12 000 horas a la nube. Solo subes el KPI (1 número cada N segundos). Pricing 30× menor que SaaS típico.

Patrón Dodo · escala PYME

En Dodo Brands procesamos 12 000 horas de video de cocina, entregando KPI a managers en vivo. Yo trabajé en ese pipeline. Hoy adapto el patrón a PYME LATAM: USD 15–60k setup + USD 500–1.9k/mes ongoing.

Lo que en Dodo costó USD 380k a 1 200 locales, aquí cuesta USD 30k a 10 locales. Misma arquitectura, escala PYME.

Único en LATAM: 0 partners Odoo LATAM ofrecen CV productizado.

// FAQ

Preguntas que recibo cada semana.

¿Necesito cambiar mis cámaras?

No. Adaptamos las cámaras IP existentes en el 95 % de los casos. Solo pedimos un mínimo de resolución (720p) y fps (10+).

¿Por qué edge computing y no cloud?

Por costo y latencia. Subir 12 000h de video cuesta USD 9 000+/mes en SaaS típicos. Edge procesa localmente y solo envía el KPI. Pricing 30× menor.

¿Qué modelos CV se usan?

YOLO para queue measurement y defect. MediaPipe para presence y compliance. Modelos custom PyTorch para casos específicos. Open-source todo.

¿Cuánto del patrón Dodo se replica?

Toda la arquitectura es directamente replicable. Lo que en Dodo costó USD 380 k a 1 200 locales, aquí cuesta USD 15–60k a 5–30 locales.

¿GDPR / privacidad de empleados?

Pipeline cumple GDPR-like: edge procesa solo el KPI agregado, no almacena video con identificación facial. Si quieres face recognition, eso requiere consentimiento explícito.