300 facturas al mes. Tu contador las teclea a mano. No más.
PDF entra. `account.move` sale. Sin tipear. 7 pasos: upload → OCR extract → field detection → match supplier → match products → post a Odoo → reconciliation. Tesseract + Google Vision + AWS Textract según volumen. En 5 semanas: 20-28 horas/mes recuperadas, 0 facturas perdidas, 0 multas SUNAT/SAT por errores de tipeo.
El servicio, en cuatro frases.
Para los que llegaron desde LinkedIn y solo tienen 30 segundos. Si quieres profundidad, sigue scrolleando.
Tu contador es analista de datos, no data-entry.
El 60-70% del tiempo de tu contador externo/interno se va en tipear facturas de proveedor a Odoo. Trabajo cognitivamente bajo, propenso a error, costoso (USD 12-25/hora × 24-40 horas/mes).
OCR + RPA · pipeline 7 pasos.
PDF (email, WhatsApp, Drive) → OCR extract → field detection (RUC/RFC, monto, fecha, conceptos) → match supplier → match products → post a account.move en Odoo → conciliación bancaria. Tesseract / Google Vision / AWS Textract según volumen.
Validación humana antes de posting.
Stack no posta directo. Crea borrador en Odoo con confidence score. Contador revisa solo los < 90% confidence (típicamente 8-15%). Resto auto-aprobado. Cero riesgo SUNAT/SAT/DIAN.
Caso real · Importadora Lima.
320 facturas/mes (proveedores PE, MX, CN, US). Contador externo cobraba S/ 4 800/mes en horas de captura. Post-implementación: 20 horas/mes ahorradas, 0 facturas perdidas, ROI 4 meses.
Por qué llegaste aquí.
- 01
5-10 minutos tipeando cada factura.
RUC, fecha, número, subtotal, IGV/IVA, total, productos uno por uno. Crea account.move. 300 facturas/mes × 7 min = 35 h/mes solo de tipeo.
35 h/mes tipeo - 02
RUC mal tecleado · factura no se acredita.
Un dígito mal en el RUC del proveedor → factura no se vincula correctamente → reclamación SUNAT/SAT → multa.
multa SUNAT/SAT - 03
Monto mal tecleado · reconciliación rota.
10 centavos de diferencia entre factura y pago → reconciliación bancaria no cuadra → semanas de debugging contable.
días debugging - 04
Factura perdida en hilo de email.
Proveedor manda PDF en thread reply. Tu contador no lo ve. Reclama 2 meses después. Documento sin rastro.
facturas perdidas - 05
Cada factura formato distinto.
Proveedor A: PDF estructurado. Proveedor B: scan de papel. Proveedor C: XML CFDI. Sin pipeline único, cada formato exige tratamiento manual.
5 formatos típicos - 06
UiPath enterprise cuesta USD 24k/año.
Las plataformas RPA enterprise (UiPath, Automation Anywhere, Blue Prism) cobran USD 18-40k/año por bot + licencias OCR adicionales. No se amortiza para PYME.
USD 24k/año
Lo que construimos contigo.
No vendemos plantillas — construimos capas finas que comunican lo que ya existe.
Pipeline 7 pasos · PDF entra, account.move sale
Upload → OCR → field detection → match supplier → match products → post → reconcile. Cualquier campo con confidence < 90% va a cola revisión humana.
Stack según volumen · Tesseract / Vision / Textract
Tesseract (gratis) para < 200 facturas/mes. Google Vision (USD 1.50/1000 páginas) para 200-800/mes. AWS Textract para 800+/mes con tablas complejas. Sin lock-in — cambias backend sin rehacer pipeline.
Multi-país · soporte LATAM completo
SUNAT (PE) · SAT (MX) · SII (CL) · DIAN (CO) · SET/SIFEN (PY). Integración nativa con módulos l10n_xx de Odoo. XML facturación electrónica parseado directo (no OCR).
Dashboard contable · accuracy, throughput, tiempo ahorrado
Metabase con: facturas procesadas/día, accuracy por proveedor, tiempo ahorrado vs baseline, alertas anomalías (duplicada, monto fuera rango, proveedor no encontrado).
Pipeline 7 pasos · 1 PDF, 12 segundos, asiento contable en Odoo
Sigue una factura real (importadora repuestos Lima) desde el email recibido hasta el asiento contable en Odoo. 7 pasos. 12 segundos total. Confidence scores reales.
- 01
01 · UPLOAD — Factura llega por email (T+0 s)
Proveedor envía PDF como attachment. Sistema captura desde mailbox proveedores@empresa.com. Almacena en S3/local con hash.
- 02
02 · OCR EXTRACT — Google Vision lee texto (T+2 s)
Vision API extrae todo el texto del PDF estructurado por bloques + bounding boxes. Latencia: ~2 s para PDF 2 páginas.
- 03
03 · FIELD DETECTION — Identifica campos críticos (T+3 s)
Reglas + ML detectan: RUC=10456789012 (confidence 99%), fecha=2026-04-15 (confidence 98%), monto total=S/ 1 480 (confidence 97%), IGV=S/ 226 (97%).
- 04
04 · MATCH SUPPLIER — Fuzzy contra res.partner Odoo (T+4 s)
Busca RUC en Odoo. Match exacto: Suministros Industriales S.A.C. (id=2847). Si no hay match → cola revisión + crear partner nuevo.
- 05
05 · MATCH PRODUCTS — Contra catálogo (T+6 s)
Cada línea producto matcheada contra product.product. 'Repuesto motor X450' → match a SKU REP-MOTOR-X450 (confidence 92%). 1 producto a revisión (confidence 78%).
- 06
06 · POST A ODOO — account.move creado (T+9 s)
Sistema crea account.move borrador con líneas, monto, IVA, asiento contable según plan cuentas l10n_pe. Estado: «To review» porque 1 línea < 90% confidence.
- 07
07 · RECONCILE — Contador revisa 10 segundos (T+12 s)
Contador abre Odoo, ve la línea marcada, confirma producto correcto, un click aprobar. account.move pasa a Posted. Reconciliación bancaria automática al recibir pago. Total: 12 segundos vs 7 minutos tipear.
Cómo está armado.
Ingestion
De dónde llega el PDFOCR + Extraction
Cómo se lee el documentoMatching + Posting
Cómo se vincula con OdooValidación + Reconciliación
Cómo se cierra el cicloLos números reales.
Métricas observadas en proyectos concretos. Baseline antes vs estado después de la intervención.
«Mi contador externo me cobraba S/ 4 800/mes solo en horas de captura. Después de OCR: 20 horas/mes ahorradas, 0 facturas perdidas en 6 meses. Y mi contador ahora hace lo que cobra caro: analizar, no tipear.»
Tres preguntas reales — y mis respuestas honestas.
¿Qué accuracy es realista?
97% en campos críticos (RUC, monto total, fecha) post-calibración a tu set de proveedores. El 3% restante va a cola de revisión humana — sigue siendo mucho más rápido (10 segundos validar vs 5 minutos tipear desde cero). Para llegar a 99%+, necesitas volumen alto y entrenamiento custom.
¿Funciona con facturas timbradas CFDI / electrónicas SUNAT?
Sí. Las facturas electrónicas LATAM vienen en XML estructurado — más fácil aún que OCR sobre PDF. Pipeline detecta automáticamente si es PDF (usa OCR) o XML (parsea directo). El módulo l10n_pe/mx/cl/co/py de Odoo se aprovecha al máximo.
¿Comparado con UiPath / Automation Anywhere?
UiPath cuesta USD 18-40k/año por bot + licencias OCR adicionales. Aquí: USD 4-12k setup + USD 700-2.2k/mes ongoing. Y el código es tuyo (Python + Tesseract/Vision/Textract). Para PYME LATAM, las plataformas RPA enterprise no se amortizan.
Qué entregamos, sin sorpresas.
- Pipeline 7 pasos: upload → OCR → field detection → match → post → reconcile
- Stack OCR: Tesseract (volumen bajo) · Google Vision (medio) · AWS Textract (alto)
- Matcheo automático de proveedor (RUC/RFC + fuzzy match nombre)
- Matcheo de productos contra catálogo Odoo (con confidence score)
- Posting automático a account.move con asiento contable correcto
- Cola de revisión humana para facturas con confidence < 90 %
- Reconciliación automática contra pagos · banco · proveedor
- Dashboard Metabase: facturas procesadas · accuracy · tiempo ahorrado · pendientes
- Soporte multi-país: SUNAT (PE) · SAT (MX) · SII (CL) · DIAN (CO) · SET (PY)
- Documentación operativa + capacitación al equipo contable
El proceso en 5 pasos.
- 01
Auditoría flujo actual (3–5 días)
Mapeo del flujo actual: dónde llegan las facturas (email/WhatsApp/portal proveedor), cuántas/mes, tiempo de tipeo promedio, errores típicos. Decisión de stack OCR según volumen.
- 02
Setup pipeline OCR (2 sem)
Provisión de stack OCR (Tesseract/Vision/Textract). Pipeline upload → extract → field detection. Calibración para tu formato dominante (80 % de facturas suelen ser 5–8 plantillas distintas).
- 03
Matching + Odoo posting (1–2 sem)
Matcheo automático de proveedor (RUC/RFC + fuzzy match). Matcheo productos contra catálogo. Posting a account.move con plan de cuentas correcto. Cola revisión humana para confidence < 90 %.
- 04
Reconciliación + dashboard (3–5 días)
Reconciliación automática vs pagos/banco. Dashboard Metabase: throughput · accuracy · tiempo ahorrado. Alertas para anomalías (factura duplicada · proveedor no encontrado · monto fuera de rango).
- 05
Go-live + hypercare
Lanzamiento gradual (10 % → 50 % → 100 % de facturas). Validación con equipo contable. Hypercare 30 días para calibrar matching. Ongoing USD 700–2.2k/mes para iteración + nuevos formatos.
300 facturas al mes. Tu contador teclea cada una.
El patrón típico PYME LATAM con > 100 facturas/mes:
- Llegan por email · WhatsApp · portal proveedor
- El contador (interno o externo) abre el PDF
- Teclea: RUC proveedor, fecha, número factura, monto subtotal, IGV/IVA, total, productos uno por uno
- Crea el
account.moveen Odoo - 5–10 minutos por factura × 300 facturas/mes = 25–50 horas/mes solo de tipeo
Y los errores cuestan caro:
- RUC mal tecleado → factura no se acredita → multa SUNAT/SAT
- Monto mal tecleado → reconciliación rota → semanas debugging
- Factura perdida en hilo de email → proveedor reclama 2 meses después
7 pasos · PDF entra · account.move sale
1. UPLOAD → email · WhatsApp · drag&drop · API proveedor
2. OCR EXTRACT → Tesseract / Google Vision / AWS Textract
3. FIELD DETECTION → RUC · fecha · monto · productos · IVA
4. MATCH SUPPLIER → fuzzy match contra res.partner en Odoo
5. MATCH PRODUCTS → contra product.product (confidence score)
6. POST A ODOO → account.move con plan de cuentas correcto
7. RECONCILIATION → vs pagos · banco · proveedor
Cualquier campo con confidence < 90 % → cola de revisión humana (10 segundos validar vs 5 minutos tipear). Resto pasa automático.
Stack según volumen · sin lock-in
- Tesseract (gratis, open-source) — para < 200 facturas/mes y formatos consistentes.
- Google Vision (USD 1.50/1000 páginas) — para 200–800/mes, multilingüe, layouts variados.
- AWS Textract (USD 1.50/1000 + features) — para 800+/mes, tablas complejas, formularios.
Lo decidimos en la auditoría. Si tu volumen crece, migras de Tesseract a Vision/Textract sin rehacer pipeline (solo cambias el backend).
Multi-país · soporte LATAM completo
- SUNAT (Perú) — CPE · GRE · facturas electrónicas XML + PDF
- SAT (México) — CFDI 4.0 timbrado · complemento de pagos
- SII (Chile) — DTE · libros de compra/venta · CAF folio
- DIAN (Colombia) — facturación electrónica · CUFE · documento soporte
- SET / SIFEN (Paraguay) — Kuatia · timbrado · libros RG 90
Integración nativa con módulos l10n_pe / l10n_mx / l10n_cl / l10n_co / l10n_py de Odoo.
Diferencia con RPA enterprise
UiPath / Automation Anywhere / Blue Prism cuestan USD 18–40k/año por bot + licencias OCR adicionales + consultor certificado por hora. Para PYME LATAM con 200–2 000 facturas/mes, no se amortizan.
Aquí: USD 4–12k setup + USD 700–2.2k/mes ongoing. Stack open-source / managed APIs. Código Python que queda contigo.
Único en LATAM productizado: 0 Gold Partners Odoo LATAM ofrecen OCR + Odoo como producto empaquetado.
Resultados típicos
- Horas/mes ahorradas por contador: 20–28h
- Accuracy en campos críticos: 97 % post-validación humana
- Facturas perdidas en 6 meses: 0 (vs 4–12 típicas)
- Errores de tipeo → multas SUNAT/SAT: eliminados
- Payback típico: 3–6 meses (solo el costo del contador)
Preguntas que recibo cada semana.
¿Qué accuracy es realista?
97 % en campos críticos (RUC, monto total, fecha) post-calibración a tu set de proveedores. El 3 % restante va a cola de revisión humana — sigue siendo mucho más rápido (10 segundos validar vs 5 minutos tipear desde cero). Para llegar a 99 %+, necesitas volumen alto y entrenamiento custom (proyecto separado).
¿Qué stack OCR usar?
Depende del volumen y tipo de documento. **Tesseract** (open-source, gratis) para volumen bajo y documentos consistentes. **Google Vision** (USD 1.50/1000 páginas) para volumen medio y multilingüe. **AWS Textract** (USD 1.50/1000 páginas + features) para volumen alto, tablas complejas y formularios estructurados. Lo decidimos en la auditoría.
¿Funciona con facturas timbradas CFDI (México) / electrónicas SUNAT (PE)?
Sí. Las facturas electrónicas LATAM vienen en XML estructurado — más fácil aún que OCR sobre PDF. Pipeline detecta automáticamente si es PDF (usa OCR) o XML (parsea directo). El módulo l10n_pe/mx/cl/co/py de Odoo se aprovecha al máximo.
¿Y si un proveedor cambia el formato?
Se detecta en la cola de revisión (confidence baja). Re-entrenamos la plantilla en 30 minutos. El sistema aprende. Para 80 % de PYMES, las facturas vienen de 5–15 proveedores frecuentes — el ROI viene de automatizar esos.
¿Comparado con UiPath / Automation Anywhere?
UiPath cuesta USD 18–40k/año por bot + licencias OCR adicionales. Aquí: USD 4–12k setup + USD 700–2.2k/mes ongoing. Y el código es tuyo (Python + Tesseract/Vision/Textract). Para PYME LATAM, las plataformas RPA enterprise no se amortizan.
¿Te suena familiar? Hablemos.
Empezamos siempre con una llamada de 30 minutos. Sin formularios largos — agenda directa.