Inicio/Servicios/Marketing Operations/RPA + OCR · Documentos automatizados
● Mini-producto · 4 – 6 semanas · USD 4 – 12 k

300 facturas al mes. Tu contador las teclea a mano. No más.

PDF entra. `account.move` sale. Sin tipear. 7 pasos: upload → OCR extract → field detection → match supplier → match products → post a Odoo → reconciliation. Tesseract + Google Vision + AWS Textract según volumen. En 5 semanas: 20-28 horas/mes recuperadas, 0 facturas perdidas, 0 multas SUNAT/SAT por errores de tipeo.

20 – 28 h/mes
ahorradas por contador
// caso Lima · caso MX
0
facturas perdidas en 6 meses
// vs 4-12 perdidas típicas
97%
accuracy en campos críticos
// post-validación humana
3 – 6 meses
payback típico
// solo costo contador
Único
OCR + Odoo productizado LATAM
// 0 partners ofrecen esto
// flujo del servicio LIVE
PDFOCREXTRACTMATCHPOSTRECONCILE
// 01 · TL;DR

El servicio, en cuatro frases.

Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.

01

Tu contador es analista de datos, no data-entry.

El 60-70% del tiempo de tu contador externo/interno se va en tipear facturas de proveedor a Odoo. Trabajo cognitivamente bajo, propenso a error, costoso (USD 12-25/hora × 24-40 horas/mes).

02

OCR + RPA · pipeline 7 pasos.

PDF (email, WhatsApp, Drive) → OCR extract → field detection (RUC/RFC, monto, fecha, conceptos) → match supplier → match products → post a account.move en Odoo → conciliación bancaria. Tesseract / Google Vision / AWS Textract según volumen.

03

Validación humana antes de posting.

Stack no posta directo. Crea borrador en Odoo con confidence score. Contador revisa solo los < 90% confidence (típicamente 8-15%). Resto auto-aprobado. Cero riesgo SUNAT/SAT/DIAN.

04

Caso real · Importadora Lima.

320 facturas/mes (proveedores PE, MX, CN, US). Contador externo cobraba S/ 4 800/mes en horas de captura. Post-implementación: 20 horas/mes ahorradas, 0 facturas perdidas, ROI 4 meses.

// 02 · El problema

Por qué llegaste aquí.

  1. 01

    5-10 minutos tipeando cada factura.

    RUC, fecha, número, subtotal, IGV/IVA, total, productos uno por uno. Crea account.move. 300 facturas/mes × 7 min = 35 h/mes solo de tipeo.

    35 h/mes tipeo
  2. 02

    RUC mal tecleado · factura no se acredita.

    Un dígito mal en el RUC del proveedor → factura no se vincula correctamente → reclamación SUNAT/SAT → multa.

    multa SUNAT/SAT
  3. 03

    Monto mal tecleado · reconciliación rota.

    10 centavos de diferencia entre factura y pago → reconciliación bancaria no cuadra → semanas de debugging contable.

    días debugging
  4. 04

    Factura perdida en hilo de email.

    Proveedor manda PDF en thread reply. Tu contador no lo ve. Reclama 2 meses después. Documento sin rastro.

    facturas perdidas
  5. 05

    Cada factura formato distinto.

    Proveedor A: PDF estructurado. Proveedor B: scan de papel. Proveedor C: XML CFDI. Sin pipeline único, cada formato exige tratamiento manual.

    5 formatos típicos
  6. 06

    UiPath enterprise cuesta USD 24k/año.

    Las plataformas RPA enterprise (UiPath, Automation Anywhere, Blue Prism) cobran USD 18-40k/año por bot + licencias OCR adicionales. No se amortiza para PYME.

    USD 24k/año
// horas/mes tipeando facturas
25-50h
// facturas perdidas / 6 meses
4-12×
// UiPath enterprise (no se amortiza)
$24k/año
// 03 · La solución

Lo que construimos contigo.

No vendemos plantillas — construimos capas finas que comunican lo que ya existe.

SUPERFICIE 01

Pipeline 7 pasos · PDF entra, account.move sale

Upload → OCR → field detection → match supplier → match products → post → reconcile. Cualquier campo con confidence < 90% va a cola revisión humana.

SUPERFICIE 02

Stack según volumen · Tesseract / Vision / Textract

Tesseract (gratis) para < 200 facturas/mes. Google Vision (USD 1.50/1000 páginas) para 200-800/mes. AWS Textract para 800+/mes con tablas complejas. Sin lock-in — cambias backend sin rehacer pipeline.

SUPERFICIE 03

Multi-país · soporte LATAM completo

SUNAT (PE) · SAT (MX) · SII (CL) · DIAN (CO) · SET/SIFEN (PY). Integración nativa con módulos l10n_xx de Odoo. XML facturación electrónica parseado directo (no OCR).

SUPERFICIE 04

Dashboard contable · accuracy, throughput, tiempo ahorrado

Metabase con: facturas procesadas/día, accuracy por proveedor, tiempo ahorrado vs baseline, alertas anomalías (duplicada, monto fuera rango, proveedor no encontrado).

// 04 · Pieza firma

Pipeline 7 pasos · 1 PDF, 12 segundos, asiento contable en Odoo

Sigue una factura real (importadora repuestos Lima) desde el email recibido hasta el asiento contable en Odoo. 7 pasos. 12 segundos total. Confidence scores reales.

  1. 01

    01 · UPLOAD — Factura llega por email (T+0 s)

    Proveedor envía PDF como attachment. Sistema captura desde mailbox proveedores@empresa.com. Almacena en S3/local con hash.

  2. 02

    02 · OCR EXTRACT — Google Vision lee texto (T+2 s)

    Vision API extrae todo el texto del PDF estructurado por bloques + bounding boxes. Latencia: ~2 s para PDF 2 páginas.

  3. 03

    03 · FIELD DETECTION — Identifica campos críticos (T+3 s)

    Reglas + ML detectan: RUC=10456789012 (confidence 99%), fecha=2026-04-15 (confidence 98%), monto total=S/ 1 480 (confidence 97%), IGV=S/ 226 (97%).

  4. 04

    04 · MATCH SUPPLIER — Fuzzy contra res.partner Odoo (T+4 s)

    Busca RUC en Odoo. Match exacto: Suministros Industriales S.A.C. (id=2847). Si no hay match → cola revisión + crear partner nuevo.

  5. 05

    05 · MATCH PRODUCTS — Contra catálogo (T+6 s)

    Cada línea producto matcheada contra product.product. 'Repuesto motor X450' → match a SKU REP-MOTOR-X450 (confidence 92%). 1 producto a revisión (confidence 78%).

  6. 06

    06 · POST A ODOO — account.move creado (T+9 s)

    Sistema crea account.move borrador con líneas, monto, IVA, asiento contable según plan cuentas l10n_pe. Estado: «To review» porque 1 línea < 90% confidence.

  7. 07

    07 · RECONCILE — Contador revisa 10 segundos (T+12 s)

    Contador abre Odoo, ve la línea marcada, confirma producto correcto, un click aprobar. account.move pasa a Posted. Reconciliación bancaria automática al recibir pago. Total: 12 segundos vs 7 minutos tipear.

// 05 · Arquitectura

Cómo está armado.

L1

Ingestion

De dónde llega el PDF
EMAIL
IMAP/Gmail API · mailbox proveedores@
WHATSAPP
Business API · PDFs adjuntos
DRIVE
Google Drive / Dropbox / OneDrive sync
PORTAL PROVEEDOR
scraper o API directa
L2

OCR + Extraction

Cómo se lee el documento
TESSERACT
open-source · gratis · volumen bajo
GOOGLE VISION
USD 1.50/1000 pgs · multilingüe
AWS TEXTRACT
USD 1.50+ · tablas complejas
XML PARSING
CFDI · CPE · DTE directo
L3

Matching + Posting

Cómo se vincula con Odoo
FIELD DETECTION
RUC · fecha · monto · IVA · líneas
MATCH SUPPLIER
fuzzy contra res.partner
MATCH PRODUCTS
contra product.product + score
POST
account.move + asiento + l10n_xx
L4

Validación + Reconciliación

Cómo se cierra el ciclo
COLA REVISIÓN
confidence < 90% (típico 8-15%)
RECONCILIACIÓN
vs pago bancario · proveedor
DASHBOARD
throughput · accuracy · tiempo
ALERTAS
duplicada · monto raro · proveedor no encontrado
// 06 · Evidencia

Los números reales.

Métricas observadas en proyectos concretos. Baseline antes vs estado después de la intervención.

Métrica Antes Después Δ
Horas/mes ahorradas por contador
0
20-28 h
+20-28 h
Accuracy en campos críticos
~95% (humano)
97%
+2 pp
Facturas perdidas / 6 meses
4-12
0
−100%
Errores tipeo → multas SUNAT/SAT
~2/mes
0
eliminados
Tiempo por factura
5-10 min
10-15 seg revisión
−97%
Costo mensual operativo
USD 1 200-2 400
USD 700-2 200
−30%

«Mi contador externo me cobraba S/ 4 800/mes solo en horas de captura. Después de OCR: 20 horas/mes ahorradas, 0 facturas perdidas en 6 meses. Y mi contador ahora hace lo que cobra caro: analizar, no tipear.»

A
Anónimo CFO · Importadora repuestos · Lima · 320 facturas/mes
Inversión setup USD 4 – 12 k // según volumen + stack OCR
Mensual ongoing USD 700 – 2.2 k/mes // OCR API + monitoring + iteración
Payback 3 – 6 meses // solo costo contador
ROI a 24 meses 4 – 9× // + multas evitadas + facturas no perdidas
// 07 · Objeciones

Tres preguntas reales — y mis respuestas honestas.

L1

¿Qué accuracy es realista?

97% en campos críticos (RUC, monto total, fecha) post-calibración a tu set de proveedores. El 3% restante va a cola de revisión humana — sigue siendo mucho más rápido (10 segundos validar vs 5 minutos tipear desde cero). Para llegar a 99%+, necesitas volumen alto y entrenamiento custom.

L2

¿Funciona con facturas timbradas CFDI / electrónicas SUNAT?

Sí. Las facturas electrónicas LATAM vienen en XML estructurado — más fácil aún que OCR sobre PDF. Pipeline detecta automáticamente si es PDF (usa OCR) o XML (parsea directo). El módulo l10n_pe/mx/cl/co/py de Odoo se aprovecha al máximo.

L3

¿Comparado con UiPath / Automation Anywhere?

UiPath cuesta USD 18-40k/año por bot + licencias OCR adicionales. Aquí: USD 4-12k setup + USD 700-2.2k/mes ongoing. Y el código es tuyo (Python + Tesseract/Vision/Textract). Para PYME LATAM, las plataformas RPA enterprise no se amortizan.

// 08 · Qué incluye

Qué entregamos, sin sorpresas.

  • Pipeline 7 pasos: upload → OCR → field detection → match → post → reconcile
  • Stack OCR: Tesseract (volumen bajo) · Google Vision (medio) · AWS Textract (alto)
  • Matcheo automático de proveedor (RUC/RFC + fuzzy match nombre)
  • Matcheo de productos contra catálogo Odoo (con confidence score)
  • Posting automático a account.move con asiento contable correcto
  • Cola de revisión humana para facturas con confidence < 90 %
  • Reconciliación automática contra pagos · banco · proveedor
  • Dashboard Metabase: facturas procesadas · accuracy · tiempo ahorrado · pendientes
  • Soporte multi-país: SUNAT (PE) · SAT (MX) · SII (CL) · DIAN (CO) · SET (PY)
  • Documentación operativa + capacitación al equipo contable
// 09 · Cómo funciona

El proceso en 5 pasos.

  1. 01

    Auditoría flujo actual (3–5 días)

    Mapeo del flujo actual: dónde llegan las facturas (email/WhatsApp/portal proveedor), cuántas/mes, tiempo de tipeo promedio, errores típicos. Decisión de stack OCR según volumen.

  2. 02

    Setup pipeline OCR (2 sem)

    Provisión de stack OCR (Tesseract/Vision/Textract). Pipeline upload → extract → field detection. Calibración para tu formato dominante (80 % de facturas suelen ser 5–8 plantillas distintas).

  3. 03

    Matching + Odoo posting (1–2 sem)

    Matcheo automático de proveedor (RUC/RFC + fuzzy match). Matcheo productos contra catálogo. Posting a account.move con plan de cuentas correcto. Cola revisión humana para confidence < 90 %.

  4. 04

    Reconciliación + dashboard (3–5 días)

    Reconciliación automática vs pagos/banco. Dashboard Metabase: throughput · accuracy · tiempo ahorrado. Alertas para anomalías (factura duplicada · proveedor no encontrado · monto fuera de rango).

  5. 05

    Go-live + hypercare

    Lanzamiento gradual (10 % → 50 % → 100 % de facturas). Validación con equipo contable. Hypercare 30 días para calibrar matching. Ongoing USD 700–2.2k/mes para iteración + nuevos formatos.

300 facturas al mes. Tu contador teclea cada una.

El patrón típico PYME LATAM con > 100 facturas/mes:

  • Llegan por email · WhatsApp · portal proveedor
  • El contador (interno o externo) abre el PDF
  • Teclea: RUC proveedor, fecha, número factura, monto subtotal, IGV/IVA, total, productos uno por uno
  • Crea el account.move en Odoo
  • 5–10 minutos por factura × 300 facturas/mes = 25–50 horas/mes solo de tipeo

Y los errores cuestan caro:

  • RUC mal tecleado → factura no se acredita → multa SUNAT/SAT
  • Monto mal tecleado → reconciliación rota → semanas debugging
  • Factura perdida en hilo de email → proveedor reclama 2 meses después

7 pasos · PDF entra · account.move sale

1. UPLOAD              → email · WhatsApp · drag&drop · API proveedor
2. OCR EXTRACT         → Tesseract / Google Vision / AWS Textract
3. FIELD DETECTION     → RUC · fecha · monto · productos · IVA
4. MATCH SUPPLIER      → fuzzy match contra res.partner en Odoo
5. MATCH PRODUCTS      → contra product.product (confidence score)
6. POST A ODOO         → account.move con plan de cuentas correcto
7. RECONCILIATION      → vs pagos · banco · proveedor

Cualquier campo con confidence < 90 % → cola de revisión humana (10 segundos validar vs 5 minutos tipear). Resto pasa automático.

Stack según volumen · sin lock-in

  • Tesseract (gratis, open-source) — para < 200 facturas/mes y formatos consistentes.
  • Google Vision (USD 1.50/1000 páginas) — para 200–800/mes, multilingüe, layouts variados.
  • AWS Textract (USD 1.50/1000 + features) — para 800+/mes, tablas complejas, formularios.

Lo decidimos en la auditoría. Si tu volumen crece, migras de Tesseract a Vision/Textract sin rehacer pipeline (solo cambias el backend).

Multi-país · soporte LATAM completo

  • SUNAT (Perú) — CPE · GRE · facturas electrónicas XML + PDF
  • SAT (México) — CFDI 4.0 timbrado · complemento de pagos
  • SII (Chile) — DTE · libros de compra/venta · CAF folio
  • DIAN (Colombia) — facturación electrónica · CUFE · documento soporte
  • SET / SIFEN (Paraguay) — Kuatia · timbrado · libros RG 90

Integración nativa con módulos l10n_pe / l10n_mx / l10n_cl / l10n_co / l10n_py de Odoo.

Diferencia con RPA enterprise

UiPath / Automation Anywhere / Blue Prism cuestan USD 18–40k/año por bot + licencias OCR adicionales + consultor certificado por hora. Para PYME LATAM con 200–2 000 facturas/mes, no se amortizan.

Aquí: USD 4–12k setup + USD 700–2.2k/mes ongoing. Stack open-source / managed APIs. Código Python que queda contigo.

Único en LATAM productizado: 0 Gold Partners Odoo LATAM ofrecen OCR + Odoo como producto empaquetado.

Resultados típicos

  • Horas/mes ahorradas por contador: 20–28h
  • Accuracy en campos críticos: 97 % post-validación humana
  • Facturas perdidas en 6 meses: 0 (vs 4–12 típicas)
  • Errores de tipeo → multas SUNAT/SAT: eliminados
  • Payback típico: 3–6 meses (solo el costo del contador)
// FAQ

Preguntas que recibo cada semana.

¿Qué accuracy es realista?

97 % en campos críticos (RUC, monto total, fecha) post-calibración a tu set de proveedores. El 3 % restante va a cola de revisión humana — sigue siendo mucho más rápido (10 segundos validar vs 5 minutos tipear desde cero). Para llegar a 99 %+, necesitas volumen alto y entrenamiento custom (proyecto separado).

¿Qué stack OCR usar?

Depende del volumen y tipo de documento. **Tesseract** (open-source, gratis) para volumen bajo y documentos consistentes. **Google Vision** (USD 1.50/1000 páginas) para volumen medio y multilingüe. **AWS Textract** (USD 1.50/1000 páginas + features) para volumen alto, tablas complejas y formularios estructurados. Lo decidimos en la auditoría.

¿Funciona con facturas timbradas CFDI (México) / electrónicas SUNAT (PE)?

Sí. Las facturas electrónicas LATAM vienen en XML estructurado — más fácil aún que OCR sobre PDF. Pipeline detecta automáticamente si es PDF (usa OCR) o XML (parsea directo). El módulo l10n_pe/mx/cl/co/py de Odoo se aprovecha al máximo.

¿Y si un proveedor cambia el formato?

Se detecta en la cola de revisión (confidence baja). Re-entrenamos la plantilla en 30 minutos. El sistema aprende. Para 80 % de PYMES, las facturas vienen de 5–15 proveedores frecuentes — el ROI viene de automatizar esos.

¿Comparado con UiPath / Automation Anywhere?

UiPath cuesta USD 18–40k/año por bot + licencias OCR adicionales. Aquí: USD 4–12k setup + USD 700–2.2k/mes ongoing. Y el código es tuyo (Python + Tesseract/Vision/Textract). Para PYME LATAM, las plataformas RPA enterprise no se amortizan.