Primeros pasos

Vision para imágenes y gráficas

Cómo Polaris describe imágenes, capturas, diagramas y gráficas para que el chatbot pueda responder.

Vision permite que Polaris convierta contenido visual en descripciones textuales que el chatbot puede usar para responder.

Qué puede analizar

Vision puede ayudar con:

  • imágenes;
  • capturas de pantalla;
  • diagramas;
  • gráficas;
  • tablas visuales;
  • páginas visuales de PDFs.

Planes

  • Starter: Vision no incluido.
  • Pro: Vision no incluido.
  • Business: Vision incluido con límites mensuales.
  • Enterprise: Vision con límites personalizados.

La disponibilidad también puede depender de la configuración del workspace.

Citas multimodales

Cuando una respuesta usa evidencia visual, Polaris puede mostrar una cita con más contexto.

Ejemplo:

Reporte anual.pdf · Página 3 · Gráfica · Vision

Esto indica que la respuesta se apoyó en una descripción visual de una gráfica en la página 3.

Limitaciones actuales

Vision no es búsqueda por imagen. Todavía no permite subir una imagen como pregunta para buscar imágenes similares.

También hay límites intencionales:

  • no hay miniaturas en las citas;
  • no hay previsualización visual avanzada;
  • no hay índice visual separado;
  • el contenido visual se convierte a texto para que el chatbot pueda usarlo.

Buenas prácticas

  • Usa imágenes nítidas.
  • Evita capturas borrosas o demasiado pequeñas.
  • Si una gráfica tiene valores importantes, verifica que sean legibles.
  • Para PDFs con muchas páginas visuales, usa archivos más cortos cuando sea posible.

Más información