Studio: Base de Conocimiento – Blip | Blip Help

Índice

Introducción

La Base de Conocimiento es una funcionalidad que centraliza documentos, enlaces y artículos para que el agente virtual acceda rápidamente a informaciones confiables durante las interacciones con usuarios.

Permite organizar contenidos en catálogos, importar archivos, vincular URLs y mantener las informaciones siempre actualizadas.

Cómo acceder a la Base de Conocimiento

Esta es la pantalla inicial que permite acceder al área de gestión de catálogos de la Base de Conocimiento. Para acceder, siga la ruta:

En el panel del contrato, localice la tarjeta Base de conocimiento.
Haga clic en Importar base.

Catálogo

Es un agrupador de informaciones dentro de la Base de Conocimiento. Centraliza archivos y URLs sobre un mismo tema, permitiendo que el agente virtual utilice esos datos para responder a los usuarios con precisión.

Cómo crear un catálogo

Al acceder a la Base de conocimiento, haga clic en Crear catálogo.

Esta pantalla se mostrará solamente en el primer acceso

En la ventana mostrada, escriba el nombre del catálogo. Haga clic en Guardar para concluir o Cancelar para salir.

Añadir contenido al catálogo

Después de crear un catálogo, se mostrará la pantalla Configurar catálogo. En ella, usted podrá añadir archivos y URLs que el agente de IA utilizará para responder a los usuarios.

Pasos

Haga clic en Añadir contenido.
Elija entre:
- Importar archivo – enviar un documento desde su computadora.
- Añadir URL – vincular una página web pública.

Importar archivo

Permite enviar documentos directamente desde su computadora al catálogo.

Pasos

Seleccione la opción Importar archivo. Formatos aceptados: XLSX, CSV, JSON, PDF, TXT, DOCX, PPTX, MD.
Arrastre y suelte el documento o haga clic para seleccionar.
Haga clic en Guardar para concluir o Cancelar para volver.

Puntos importantes

Los archivos añadidos sirven como base para las respuestas del agente.
Es posible combinar diversos tipos de archivo en un mismo catálogo; sin embargo, cada envío — incluso si contiene documentos duplicados — será añadido al historial del agente.
Los archivos no pueden ser editados: en caso de que sea necesario modificar el contenido, debe eliminar el archivo antiguo o actualizar una nueva versión.
El agente no interpreta contenido en imágenes, por lo tanto, asegúrese de que toda la información relevante esté en el texto.
Para que el agente pueda enviar archivos multimedia (imágenes, audios, vídeos, PDFs o enlaces) como respuesta, la Base de Conocimiento debe seguir un modelo específico (disponible abajo en Ejemplos de modelos de archivo. Utilice el archivo Base de conocimiento ejemplo Agente de IA como referencia para estructurar el contenido).
Todos los enlaces a archivos multimedia deben ser públicos, garantizando que el agente logre acceder a ellos y entregarlos correctamente al usuario.

Tipo de contenido	Tipo de archivo	Recomendaciones	Restricciones
FAQ	XLSX y CSV	• Dejar preguntas y respuestas en una misma célula o línea aumenta la eficiencia del Agente	Es obligatorio que haya una columna denominada “text” (con letras minúsculas) para que el archivo sea interpretado. De lo contrario, se presentará un error.
FAQ	DOCX y PDF	• Dejar preguntas y respuestas próximas, en la misma línea o en líneas diferentes, pero secuenciales. • Evitar la presencia de imágenes en el archivo o garantizar que todas las informaciones relevantes estén en elementos textuales	DOCX: Hasta 1 millón de caracteres PDF: Hasta 250 mil caracteres (en promedio de 120 a 150 páginas)
FAQ	TXT y MD	• Dejar preguntas y respuestas en una misma línea. • En caso de que no sea posible, dejar ambas lo más próximo posible, es decir, en líneas diferentes pero secuenciales.	TXT: Hasta 500 KB Hasta 500 mil caracteres
Otros contenidos (manuales, informes o guías que no sean FAQs)	PDF y DOCX	• Eliminar sumarios, en caso de que existan. • Evitar la presencia de imágenes en el archivo o garantizar que todas las informaciones relevantes estén en elementos textuales. • En caso de que el archivo sea muy extenso, realizar la división en más de un archivo para facilitar la carga y el mantenimiento de los datos.	DOCX: Hasta 1 millón de caracteres PDF: Hasta 250 mil caracteres (en promedio de 120 a 150 páginas)
Otros contenidos (manuales, informes o guías que no sean FAQs)	TXT y MD	• Eliminar sumarios en caso de que existan.	TXT: Hasta 500 KB Hasta 500 mil caracteres
Otros contenidos (manuales, informes o guías que no sean FAQs)	PPTX	• Verificar que el contenido relevante para el Agente esté contenido en informaciones textuales de las diapositivas	Hasta 30 MB
Otros contenidos (manuales, informes o guías que no sean FAQs)	JSON	• Recomendado para la inserción de párrafos aislados e informaciones independientes con hasta 700 caracteres • Es necesario que exista el campo “text” en este formato

Ejemplos de modelos de archivo

Formato	Modelo
XLSX	Base de conhecimento exemplo - Agente de IA
CSV	modelo_csv_FAQ_Notificações_Ativas
TXT	modeo_txt_FAQ_Notificações_Ativas
PDF	modelo_pdf_Notificações_Ativas.pdf
DOC/DOCX	modelo_docs_Notificações_Ativas
MD	modelo_md_Notificações_Ativas
PPT/PPTX	modelo_pptx_Boas práticas_Templates_WhatsApp.pptx

Después de añadir una URL o archivo por primera vez, será dirigido a la pantalla Configurar catálogo, donde podrá gestionar todos los archivos y URLs vinculados a ese catálogo. En esta pantalla, también es posible incluir nuevos ítems haciendo clic en el botón Añadir contenido.

Observación: El proceso de importación de archivos sigue el mismo procedimiento descrito en el tema Importar archivo.

Añadir URL

Permite vincular una página web pública al catálogo, garantizando que el contenido esté accesible al agente sin autenticación.

Pasos:

Haga clic en Añadir contenido;
Inserte la dirección completa (incluyendo https://);
Haga clic en Guardar o Cancelar.

Configurar el catálogo

Pantalla que permite visualizar y configurar todos los ítems (archivos y URLs) de un catálogo. Para cada contenido, se muestra información como nombre y tipo, fecha y autor de la última actualización, además del estado de sincronización (Activo, Inactivo o Sincronizando).

Pasos:

En la pantalla Base de conocimiento, localice el catálogo deseado.
Haga clic en el menú de opciones (icono de tres puntos) y seleccione Abrir.

Al abrir el catálogo, se mostrará el listado completo de archivos y URLs, permitiendo consultar detalles y utilizar el menú de acciones.

Menú de acciones (icono de tres puntos) disponible para cada ítem:

Abrir: Muestra el contenido del ítem seleccionado;
Descargar: Realiza la descarga del archivo en el formato original a su dispositivo;
Actualizar: Sustituye el contenido existente por una nueva versión;
Restaurar: Revierte el contenido a la versión anterior más reciente guardada en Blip;
Activar/Desactivar: Define si el contenido estará disponible para su uso por el agente de IA;
Eliminar: Elimina permanentemente el contenido del catálogo.

Gestionar URLs vinculadas

Muestra todas las páginas asociadas a una URL pública registrada en el catálogo. Solo las URLs accesibles sin autenticación o bloqueos pueden sincronizarse correctamente.

Pasos:

En el contenido de tipo URL, haga clic en Abrir.
Active o desactive la sincronización de cada página.
Elimine páginas cuando sea necesario.
Use la búsqueda para localizar páginas específicas.

Configurando la Base de Conocimiento en la pestaña Herramientas

La pestaña Herramientas permite que su agente interactúe con recursos externos y consulte información específica para enriquecer sus respuestas. Actualmente, la base de conocimiento está conectada al agente como una herramienta, permitiendo que el agente tenga acceso a múltiples contextos de forma organizada.

Cómo añadir una Base de Conocimiento

Al hacer clic en Añadir herramienta, se mostrará una lista de opciones. En el submenú Consultar, seleccione la opción Base de Conocimiento.

A diferencia de versiones anteriores, ahora su agente puede tener una o varias herramientas de este tipo. Esto es útil para separar asuntos diferentes (ej: una base para "Dudas Técnicas" y otra para "Políticas de RR.HH."), permitiendo una referencia más precisa en las instrucciones del agente.

Configuraciones Principales

Para cada herramienta de base de conocimiento, será necesario definir los siguientes campos:

Nombre: Un nombre único que ayude a identificar la herramienta.
Descripción: Este campo es fundamental. Es aquí donde explicará al agente cuándo debe consultar esta base y qué encontrará en ella.
- Ejemplo: "Utilice esta herramienta para responder a dudas sobre precios, planes y métodos de pago."

Seleccionando los Contenidos (Catálogos)

Para que la herramienta tenga información para consultar, necesita Catálogos. Los catálogos centralizan sus archivos y URLs.

Haga clic en Añadir catálogo.
En la ventana que se abrirá, puede seleccionar catálogos ya existentes o hacer clic en Crear catálogo para ser redireccionado al área de gestión de contenidos.

Consejo Práctico: Puede seleccionar un catálogo entero o solo contenidos específicos dentro de él, marcando las casillas de verificación (checkboxes). Esto le da un control total sobre lo que cada herramienta puede "leer".

Optimización y Definiciones de Consulta

Para garantizar que el agente responda de forma rápida y económica, la plataforma utiliza la tecnología de RAG (Retrieval Augmented Generation). Esto significa que, en lugar de leer todos los documentos a la vez, el agente busca solo los fragmentos más relevantes para el contexto del usuario.

En la sección Definiciones de la Consulta, es posible ajustar:

Fragmentos retornados (Chunks): Define cuántos "pedazos" de información recibe el agente por consulta.
Recomendación: El valor predeterminado es 3. Añadir más fragmentos puede ayudar al agente a responder mejor, pero consume más tokens y puede exceder la ventana de contexto del modelo.

Potencie su Base de Conocimiento con Preprocesamiento

El preprocesamiento optimiza los documentos de su base de conocimiento antes de que estén disponibles para los agentes del Studio. Este proceso mejora la calidad de la información, la precisión de las búsquedas y la eficiencia de las respuestas generadas. Ofrecemos tres tipos de preprocesamiento que pueden habilitarse de acuerdo con su necesidad.

1. Optimización (Limpieza de Ruidos)

¿Qué es?

La Optimización es un proceso automático de limpieza que elimina "ruidos" y formateos innecesarios del texto de sus documentos. El objetivo es estandarizar el contenido, garantizando que la IA se enfoque solo en la información relevante.

¿Cómo funciona?

Este procesador aplica un conjunto de reglas para refinar el texto. Con base en su configuración estándar, ejecuta las siguientes acciones en cada fragmento del documento:

Corrección de Unicode: Repara caracteres que fueron corrompidos o mal codificados.
Eliminación de HTML: Elimina todas las etiquetas HTML (ej: <div>, <p>, <span>) que pueden estar presentes en documentos extraídos de la web.
Normalización de Espacios: Elimina espacios múltiples, tabulaciones y saltos de línea excesivos, sustituyéndolos por un único espacio o salto de línea, respectivamente.

Ejemplo Práctico:

Texto Original:

<p>A Reunião será na terça.

Confira o tópico principal.</p>

Texto Optimizado:

A Reunião será na terça. Confira o tópico principal.

2. Indexación (Resúmenes y Tags con IA)

¿Qué es?

La Indexación utiliza un AI Agente para enriquecer cada fragmento (chunk) de su documento con un resumen conciso y palabras clave relevantes. Esto crea un "índice semántico" que mejora drásticamente la capacidad del sistema para encontrar la información exacta que el usuario busca.

¿Cómo funciona?

Un agente de IA especializado en síntesis de conocimiento analiza cada fragmento de texto y genera:

Resumen: Un sumario corto (2-3 sentencias) que explica el tópico específico de aquel fragmento.
Palabras clave: Una lista de 5 a 8 términos esenciales, entidades o jergas técnicas encontrados en el texto.

El proceso se realiza en el mismo idioma del documento original para mantener la consistencia.

Ejemplo Práctico:

Texto del Chunk:

"El Artículo 14 del contrato de servicio estipula que la parte contratada debe notificar a la contratante con 30 días de antelación sobre cualquier interrupción programada. El incumplimiento de esta cláusula resultará en penalidades financieras, conforme se detalla en el Anexo B."
Resultado de la Indexación:
- Resumen: "Este fragmento detalla la cláusula del Artículo 14 sobre la obligatoriedad de notificación previa de 30 días para interrupciones de servicio. El incumplimiento de la notificación acarrea multas financieras."
- Palabras clave: "contrato de servicio, Artículo 14, notificación previa, interrupción programada, cláusula, penalidades financieras, Anexo B"

¿Cuándo usar?

En documentos que funcionan como una colección de informaciones independientes, donde cada fragmento tiene valor por sí solo. Ideal para:

Bases de Preguntas y Respuestas (FAQ): Donde cada par de pregunta/respuesta es un "hecho" que necesita ser encontrado de forma aislada.
Contenido tabular o dividido: Documentos en los que la información ya está segmentada en bloques, como una planilla con descripciones de productos o una lista de políticas internas.
Artículos o posts de blog: Donde cada párrafo o sección aborda un subtópico específico que puede ser resumido para facilitar la búsqueda.

Beneficio principal

Crea un "índice" rico que permite al buscador encontrar fragmentos específicos con alta precisión, incluso si la búsqueda del usuario utiliza sinónimos o términos relacionados.

Costo

Consume tokens de IA de acuerdo con el tamaño del documento.

3. Contextualización (Lectura Semántica Global con IA)

¿Qué es?

La Contextualización es el preprocesamiento más avanzado. Utiliza un AI Agent para realizar una "lectura semántica global" de todo el documento. Para cada fragmento de texto, la IA describe dónde encaja en el contexto general del documento, actuando como un "GPS" para el motor de búsqueda.

¿Cómo funciona?

A diferencia de la Indexación, que se enfoca en el contenido del fragmento, la Contextualización se enfoca en su ubicación y propósito. El agente de IA lee el documento completo para entender su estructura (capítulos, secciones, flujo de ideas) y, luego, genera una frase corta (15-25 palabras) para cada fragmento, describiendo su papel contextual.

Ejemplo Práctico:

Documento: "Manual de Seguridad de TI de la Empresa"
Texto del Chunk:

"Todos los empleados deben usar contraseñas con un mínimo de 12 caracteres, incluyendo letras mayúsculas, minúsculas, números y símbolos."
Resultado de la Contextualización:
- Contexto Generado: "Sección de 'Política de Contraseñas' del manual, especificando los requisitos de complejidad para las credenciales de acceso de los empleados."

¿Cuándo usar?

En documentos largos, continuos y estructurados, donde la posición de una información dentro del todo es crucial para su significado. Ideal para:

Manuales técnicos y guías de usuario: Donde es importante saber si un fragmento está en la sección de "Instalación", "Solución de Problemas" o "Configuraciones Avanzadas".
Contratos y documentos jurídicos: Donde el contexto de una cláusula (ej: "Cláusula de Rescisión", "Anexo de Penalidades") es fundamental.
Artículos científicos e informes de investigación: Donde la estructura (Introducción, Metodología, Resultados, Conclusión) da sentido a cada parte del texto.

Beneficio principal

Actúa como un "GPS" para la búsqueda, informando al sistema no solo lo que está en el fragmento, sino dónde encaja en el flujo de información del documento.

Costo

Consume tokens de IA de acuerdo con el tamaño del documento.

Tabla Comparativa

Opción	Ideal para...	Benefício Principal	Costo de IA
Optimización	Todos los tipos de archivo, especialmente los "sucios".	Garantiza la calidad y consistencia del texto base.	No
Indexación	Contenido segmentado (FAQs, tablas, artículos cortos).	Hace que cada fragmento sea "encontrable" por su contenido específico.	Sí
Contextualización	Documentos largos y estructurados (manuales, contratos).	Localiza la información dentro de la estructura general del documento.	Sí

Regla de Oro

Si sus documentos son una colección de hechos, donde cada uno puede leerse de forma independiente, elija la Indexación.
Si sus documentos cuentan una historia o siguen una estructura lógica, donde el contexto es el rey, elija la Contextualización.
La Optimización es como arreglar la casa antes de decorar: úsela siempre que sea posible.

Cómo usar el Preprocesamiento en el Studio

Ahora, al hacer clic en “Importar archivos” dentro del catálogo, se abrirá un menú lateral:

En este menú lateral, es posible cargar múltiples archivos y elegir qué preprocesamiento desea aplicar en cada uno de ellos. Basta con seleccionar la casilla de verificación del preprocesamiento deseado y luego hacer clic en guardar:

Las bases se cargarán y se preprocesarán. El tiempo de procesamiento puede variar según el tamaño de la base y las configuraciones seleccionadas.

Buenas prácticas

Mantenga los contenidos siempre actualizados.
Utilice nombres claros y estandarizados para facilitar las búsquedas.
Revise las URLs periódicamente para evitar enlaces rotos.

Blip Academy

¿Quiere aprender cómo funciona y cómo trabajar con Blip Studio? Acceda a Blip Academy y aprenda de forma gratuita.

Para obtener más información, acceda a la discusión sobre el tema en nuestra comunidad o los vídeos en nuestro canal. 😃

Índice

Introducción

Cómo acceder a la Base de Conocimiento

Catálogo

Cómo crear un catálogo

Añadir contenido al catálogo

Importar archivo

Añadir URL

Configurar el catálogo

Gestionar URLs vinculadas

Configurando la Base de Conocimiento en la pestaña Herramientas

Cómo añadir una Base de Conocimiento

Configuraciones Principales

Seleccionando los Contenidos (Catálogos)

Optimización y Definiciones de Consulta

Potencie su Base de Conocimiento con Preprocesamiento

1. Optimización (Limpieza de Ruidos)

¿Qué es?

¿Cómo funciona?

Ejemplo Práctico:

2. Indexación (Resúmenes y Tags con IA)

¿Qué es?

¿Cómo funciona?

Ejemplo Práctico:

¿Cuándo usar?

Beneficio principal

Costo

3. Contextualización (Lectura Semántica Global con IA)

¿Qué es?

¿Cómo funciona?

Ejemplo Práctico:

¿Cuándo usar?

Beneficio principal

Costo

Tabla Comparativa

Regla de Oro

Cómo usar el Preprocesamiento en el Studio

Buenas prácticas

Blip Academy

Artículos relacionados