Primeros pasos

OCR para documentos escaneados

Entiende cómo Polaris lee texto escaneado y qué ocurre cuando OCR es parcial o no está incluido.

OCR permite que Polaris lea texto dentro de imágenes o PDFs escaneados. Es útil cuando el archivo no tiene texto seleccionable, pero sí contiene texto visible en la página.

Cuándo aplica

OCR puede aplicar en:

  • PDFs escaneados.
  • Imágenes con texto.
  • Capturas donde el texto es legible.

Si el PDF ya tiene texto seleccionable, Polaris puede procesarlo como documento textual sin depender de OCR.

Planes

  • Starter: OCR no incluido.
  • Pro: OCR incluido.
  • Business: OCR incluido con límites mensuales.
  • Enterprise: OCR con límites personalizados.

La disponibilidad también puede depender de la configuración del workspace.

Si OCR no está incluido

El documento puede cargarse correctamente, pero el texto escaneado no se usará para responder. En Documents verás avisos como OCR no incluido o Indexación parcial.

Si el archivo también contiene texto normal, Polaris conserva esa parte.

OCR parcial y timeout

OCR parcial significa que Polaris logró leer una parte del documento, pero no todas las páginas.

Puede ocurrir por:

  • una página que tardó demasiado;
  • un PDF muy largo;
  • una imagen difícil de leer;
  • límites del plan.

Cuando ocurre, Polaris mantiene el texto que sí pudo leer y muestra avisos como OCR parcial o Timeout OCR.

Buenas prácticas

  • Usa escaneos nítidos y bien orientados.
  • Evita PDFs escaneados muy largos.
  • Sube una versión con texto seleccionable cuando exista.
  • Divide documentos grandes en archivos más pequeños.

Más información