Computer Vision. 12 000 horas no son teoría.
En Dodo Brands medimos 12 000 horas de video de cocina y entregamos KPI a managers en vivo. Yo trabajé en ese pipeline. Hoy lo adapto a tu cadena de restaurantes, planta de manufactura, warehouse o clínica. Sin cambiar hardware. Sin SaaS de USD 9 000/mes.
El servicio, en cuatro frases.
Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.
Tienes cámaras. Y no las usas para nada útil.
Las cámaras IP de tu restaurante / planta / warehouse graban 24/7. Alguien las revisa una vez al mes (cuando hay robo). El 99.9% del video se borra sin extraer ninguna métrica operativa.
CV transforma video en KPI tiempo real.
Modelos especializados: queue measurement, anomaly detection, defect detection, presence/compliance. Cada uno se entrena para tu caso.
Edge computing · sin pagar SaaS por frame.
Procesamiento en Jetson Nano / Google Coral / Raspberry Pi en el local. No subes 12 000 horas a la nube. Pricing 30× menor que SaaS típico.
6-12 semanas. Patrón Dodo. Escala PYME.
USD 15-60 k setup + USD 500-1.9 k/mes ongoing. Lo que en enterprise costó USD 380 k acá cuesta USD 30 k.
Por qué llegaste aquí.
- 01
Cámaras graban 24/7. Nadie las usa para nada útil.
Las cámaras IP de tu restaurante / planta / warehouse graban todo el día. El 99.9% del video se borra sin extraer ninguna métrica operativa.
99.9% video desperdiciado - 02
Manager reporta «el servicio fue rápido».
Sin datos. Decisiones operativas basadas en feeling. Hora pico real vs hora pico percibida no coinciden. Gerentes regionales no saben cuál local es realmente lento.
0 medición - 03
SaaS de visión cuesta USD 9 000/mes.
Eyrene, Logivations y similares cobran por frame procesado en la nube. Para 10 locales con 4 cámaras cada uno: USD 9k-15k/mes solo en procesamiento. Insostenible.
USD 9k+/mes SaaS - 04
Sin alertas en tiempo real.
El robo se descubre al día siguiente. El producto fuera de spec llega al cliente. La cola de 8 personas no se gestiona porque manager está atendiendo otro tema.
lag detección - 05
Cero compliance medido.
Uniforme · zona restringida · presencia obligatoria · temperatura cocina. Auditorías manuales 1×/mes. Resto del tiempo: te enteras por queja del cliente.
auditoría manual - 06
Defectos en producción descubiertos por cliente.
Línea de manufactura produce 1 000 unidades/día. Defectos detectados al final del día (o por el cliente). Cada defecto = 4 unidades buenas ya producidas mal después.
lag defectos
Lo que construimos contigo.
No vendemos plantillas — construimos capas finas que comunican lo que ya existe.
Queue measurement · cuánta cola hay en tiempo real
Modelo YOLO entrenado para detectar personas en fila. Output: longitud cola, tiempo promedio espera, evolución por hora. Alerta cuando cola > N personas o tiempo > M minutos.
Anomaly detection · algo raro pasa, alerta inmediata
Modelo entrenado en patrones normales de tu operación. Detecta: objeto fuera de lugar, persona en zona prohibida, tiempo de servicio fuera de rango. Alerta Slack en < 30 segundos.
Defect detection · producto fuera de spec en línea
Para manufactura: modelo CV detecta defectos visuales en línea. Se entrena con 200-800 frames anotados. Antes de que el cliente lo reciba.
Presence / compliance · uniforme, zona, temperatura
Cumplimiento de uniforme, zonas restringidas, presencia obligatoria. Para clínicas/farmacéutica: zonas con compliance regulatorio. Compliance 70% → 95%+ medido.
8 frames analizados · de cámara IP a KPI en 30 segundos
Sigue un frame real desde la cámara hasta el dashboard. 8 pasos. Latencias reales. Stack visible. Sin streaming masivo a la nube — todo edge.
- 01
01 · CÁMARA — Frame capturado (T+0 ms)
Cámara IP RTSP genera frame 720p @ 15 fps. Resolución suficiente para detección. Sin requerir hardware nuevo.
- 02
02 · EDGE — Jetson Nano recibe stream (T+50 ms)
Edge device (USD 99) en el local recibe stream local. Procesa sin subir frames a nube. Solo subirá el KPI agregado.
- 03
03 · PRE-PROCESS — Resize + normalize (T+100 ms)
Frame resized a 640×480 para inferencia. Normalización RGB. CPU optimizado.
- 04
04 · INFERENCE — YOLO detección personas (T+250 ms)
Modelo YOLO v8 nano corre en GPU Jetson. Detecta personas en frame con bounding boxes. 3 personas detectadas en zona cola.
- 05
05 · BUSINESS LOGIC — Filtrado por zona (T+280 ms)
Reglas custom: solo personas en polígono «zona cola» cuentan. Excluye empleados (por uniforme). 2 clientes en cola.
- 06
06 · AGGREGATION — KPI cada 30 segundos (T+30 s)
Promedio rolling 30 segundos: queue length avg = 2.4 personas, tiempo espera estimado 3 min. 1 número/30s vs 12 000 horas video.
- 07
07 · STREAMING — Solo KPI sube a cloud
POST JSON {queue_length: 2.4, wait_time: 180, location: 'lima-03'} a backend. 30 KB/día vs 60 GB/día de video raw.
- 08
08 · DASHBOARD — Manager ve en vivo (T+30 s)
Metabase dashboard actualiza. Manager local ve queue length en pantalla cocina. Si > 5 personas → alerta Slack regional manager.
Cómo está armado.
Hardware existente
Lo que ya tienes en cada localEdge computing
Lo que agregamos en cada localNetworking + storage
Cómo viaja el KPI a la nubeSurfaces + alertas
Cómo se operaLos números reales.
Métricas observadas en proyectos concretos. Baseline antes vs estado después de la intervención.
«Mis managers regionales ya no me preguntan «¿cómo está el local de Surco?» — abren el dashboard y ven queue, tiempo servicio, compliance. Pasamos de auditorías mensuales a operación en tiempo real, con las mismas cámaras que ya teníamos.»
Tres preguntas reales — y mis respuestas honestas.
¿Necesito cambiar mis cámaras?
No. Adaptamos las cámaras IP existentes en el 95% de los casos. Solo pedimos un mínimo de resolución (720p) y fps (10+). En la auditoría in-situ confirmamos qué se puede reusar.
¿Por qué edge computing y no cloud?
Por costo y latencia. Subir 12 000h de video a la nube cuesta una fortuna (USD 9 000+/mes en SaaS típicos). Edge procesa localmente y solo envía el KPI (1 número cada N segundos). Pricing 30× menor que SaaS.
¿Cuánto del patrón Dodo se replica?
Toda la arquitectura es directamente replicable. Lo que en Dodo costó USD 380 k a 1 200 locales, aquí cuesta USD 15–60k a 5–30 locales. La diferencia es escala — el patrón es idéntico.
Qué entregamos, sin sorpresas.
- Auditoría de cámaras existentes (resolución · fps · ángulos · cobertura)
- Setup edge computing: Jetson Nano / Google Coral / Raspberry Pi en cada local
- 3–4 modelos CV: queue measurement · anomaly detection · defect · presence
- Entrenamiento custom sobre tu caso (fine-tuning con 200–800 frames anotados)
- Pipeline streaming KPI cada N segundos (no subes 12 000h a la nube)
- Dashboards Metabase: tiempo servicio · queue length · compliance · alertas
- Alertas Slack/Telegram para anomalías en tiempo real
- Documentación del pipeline + runbooks para gerencia operativa
- Capacitación a managers de local para interpretar KPI
- 1–2 visitas in-situ por país clave para setup hardware
El proceso en 5 pasos.
- 01
Auditoría hardware + diagnóstico (1–2 sem)
Visita in-situ a 1–2 locales pilot. Revisión cámaras existentes, ángulos, resolución, conectividad. Definición de modelos CV.
- 02
Setup edge piloto (2–3 sem)
Provisión Jetson/Coral en 1–2 locales piloto. Captura de 200–800 frames de entrenamiento. Modelos baseline funcionando localmente.
- 03
Fine-tuning + dashboards (2–3 sem)
Anotación de frames específicos a tu caso. Re-training de modelos. Setup pipeline streaming KPI. Dashboards Metabase + alertas Slack.
- 04
Rollout a resto de locales (2–4 sem)
Provisión hardware en locales adicionales. Sincronización de modelos. Capacitación a managers de local. Documentación operativa.
- 05
Go-live + ongoing
Operación en producción. USD 500–1.9k/mes ongoing para iteración modelos, ajustes según drift, nuevas métricas bajo demanda.
Tienes cámaras. Y no las usas para nada útil.
Las cámaras IP de tu restaurante / planta / warehouse graban 24/7. Alguien las revisa una vez al mes (cuando hay robo). El 99.9 % del video se borra sin extraer ninguna métrica operativa.
CV transforma video en KPI tiempo real
Modelos especializados, cada uno entrenado para tu caso: queue measurement, anomaly detection, defect detection, presence/compliance.
Edge computing · sin pagar SaaS por frame
Procesamiento en Jetson Nano / Google Coral / Raspberry Pi en el local. No subes 12 000 horas a la nube. Solo subes el KPI (1 número cada N segundos). Pricing 30× menor que SaaS típico.
Patrón Dodo · escala PYME
En Dodo Brands procesamos 12 000 horas de video de cocina, entregando KPI a managers en vivo. Yo trabajé en ese pipeline. Hoy adapto el patrón a PYME LATAM: USD 15–60k setup + USD 500–1.9k/mes ongoing.
Lo que en Dodo costó USD 380k a 1 200 locales, aquí cuesta USD 30k a 10 locales. Misma arquitectura, escala PYME.
Único en LATAM: 0 partners Odoo LATAM ofrecen CV productizado.
Preguntas que recibo cada semana.
¿Necesito cambiar mis cámaras?
No. Adaptamos las cámaras IP existentes en el 95 % de los casos. Solo pedimos un mínimo de resolución (720p) y fps (10+).
¿Por qué edge computing y no cloud?
Por costo y latencia. Subir 12 000h de video cuesta USD 9 000+/mes en SaaS típicos. Edge procesa localmente y solo envía el KPI. Pricing 30× menor.
¿Qué modelos CV se usan?
YOLO para queue measurement y defect. MediaPipe para presence y compliance. Modelos custom PyTorch para casos específicos. Open-source todo.
¿Cuánto del patrón Dodo se replica?
Toda la arquitectura es directamente replicable. Lo que en Dodo costó USD 380 k a 1 200 locales, aquí cuesta USD 15–60k a 5–30 locales.
¿GDPR / privacidad de empleados?
Pipeline cumple GDPR-like: edge procesa solo el KPI agregado, no almacena video con identificación facial. Si quieres face recognition, eso requiere consentimiento explícito.
¿Te suena familiar? Hablemos.
Empezamos siempre con una llamada de 30 minutos. Sin formularios largos — agenda directa.