Studio: Base de Conocimiento 25 de marzo de 2026 12:55 Actualización Índice Introducción Cómo acceder a la Base de Conocimiento Catálogo Configurar el catálogo Configurando la Base de Conocimiento en la pestaña Herramientas Potencie su Base de Conocimiento con Preprocesamiento Buenas prácticas Blip Academy IntroducciónLa Base de Conocimiento es una funcionalidad que centraliza documentos, enlaces y artículos para que el agente virtual acceda rápidamente a informaciones confiables durante las interacciones con usuarios.Permite organizar contenidos en catálogos, importar archivos, vincular URLs y mantener las informaciones siempre actualizadas.Cómo acceder a la Base de ConocimientoEsta es la pantalla inicial que permite acceder al área de gestión de catálogos de la Base de Conocimiento. Para acceder, siga la ruta: En el panel del contrato, localice la tarjeta Base de conocimiento. Haga clic en Importar base. CatálogoEs un agrupador de informaciones dentro de la Base de Conocimiento. Centraliza archivos y URLs sobre un mismo tema, permitiendo que el agente virtual utilice esos datos para responder a los usuarios con precisión.Cómo crear un catálogoAl acceder a la Base de conocimiento, haga clic en Crear catálogo.Esta pantalla se mostrará solamente en el primer accesoEn la ventana mostrada, escriba el nombre del catálogo. Haga clic en Guardar para concluir o Cancelar para salir.Añadir contenido al catálogoDespués de crear un catálogo, se mostrará la pantalla Configurar catálogo. En ella, usted podrá añadir archivos y URLs que el agente de IA utilizará para responder a los usuarios.Pasos Haga clic en Añadir contenido. Elija entre: Importar archivo – enviar un documento desde su computadora. Añadir URL – vincular una página web pública. Importar archivoPermite enviar documentos directamente desde su computadora al catálogo.Pasos Seleccione la opción Importar archivo. Formatos aceptados: XLSX, CSV, JSON, PDF, TXT, DOCX, PPTX, MD. Arrastre y suelte el documento o haga clic para seleccionar. Haga clic en Guardar para concluir o Cancelar para volver. Puntos importantes Los archivos añadidos sirven como base para las respuestas del agente. Es posible combinar diversos tipos de archivo en un mismo catálogo; sin embargo, cada envío — incluso si contiene documentos duplicados — será añadido al historial del agente. Los archivos no pueden ser editados: en caso de que sea necesario modificar el contenido, debe eliminar el archivo antiguo o actualizar una nueva versión. El agente no interpreta contenido en imágenes, por lo tanto, asegúrese de que toda la información relevante esté en el texto. Para que el agente pueda enviar archivos multimedia (imágenes, audios, vídeos, PDFs o enlaces) como respuesta, la Base de Conocimiento debe seguir un modelo específico (disponible abajo en Ejemplos de modelos de archivo. Utilice el archivo Base de conocimiento ejemplo Agente de IA como referencia para estructurar el contenido). Todos los enlaces a archivos multimedia deben ser públicos, garantizando que el agente logre acceder a ellos y entregarlos correctamente al usuario. Tipo de contenido Tipo de archivo Recomendaciones Restricciones FAQ XLSX y CSV • Dejar preguntas y respuestas en una misma célula o línea aumenta la eficiencia del Agente Es obligatorio que haya una columna denominada “text” (con letras minúsculas) para que el archivo sea interpretado. De lo contrario, se presentará un error. FAQ DOCX y PDF • Dejar preguntas y respuestas próximas, en la misma línea o en líneas diferentes, pero secuenciales. • Evitar la presencia de imágenes en el archivo o garantizar que todas las informaciones relevantes estén en elementos textuales DOCX:Hasta 1 millón de caracteres PDF: Hasta 250 mil caracteres (en promedio de 120 a 150 páginas) FAQ TXT y MD • Dejar preguntas y respuestas en una misma línea. • En caso de que no sea posible, dejar ambas lo más próximo posible, es decir, en líneas diferentes pero secuenciales. TXT:Hasta 500 KBHasta 500 mil caracteres Otros contenidos (manuales, informes o guías que no sean FAQs) PDF y DOCX • Eliminar sumarios, en caso de que existan. • Evitar la presencia de imágenes en el archivo o garantizar que todas las informaciones relevantes estén en elementos textuales. • En caso de que el archivo sea muy extenso, realizar la división en más de un archivo para facilitar la carga y el mantenimiento de los datos. DOCX:Hasta 1 millón de caracteres PDF:Hasta 250 mil caracteres (en promedio de 120 a 150 páginas) Otros contenidos (manuales, informes o guías que no sean FAQs) TXT y MD • Eliminar sumarios en caso de que existan. TXT:Hasta 500 KBHasta 500 mil caracteres Otros contenidos (manuales, informes o guías que no sean FAQs) PPTX • Verificar que el contenido relevante para el Agente esté contenido en informaciones textuales de las diapositivas Hasta 30 MB Otros contenidos (manuales, informes o guías que no sean FAQs) JSON • Recomendado para la inserción de párrafos aislados e informaciones independientes con hasta 700 caracteres • Es necesario que exista el campo “text” en este formato Ejemplos de modelos de archivo Formato Modelo XLSX Base de conhecimento exemplo - Agente de IA CSV modelo_csv_FAQ_Notificações_Ativas TXT modeo_txt_FAQ_Notificações_Ativas PDF modelo_pdf_Notificações_Ativas.pdf DOC/DOCX modelo_docs_Notificações_Ativas MD modelo_md_Notificações_Ativas PPT/PPTX modelo_pptx_Boas práticas_Templates_WhatsApp.pptx Después de añadir una URL o archivo por primera vez, será dirigido a la pantalla Configurar catálogo, donde podrá gestionar todos los archivos y URLs vinculados a ese catálogo. En esta pantalla, también es posible incluir nuevos ítems haciendo clic en el botón Añadir contenido.Observación: El proceso de importación de archivos sigue el mismo procedimiento descrito en el tema Importar archivo. Añadir URL Permite vincular una página web pública al catálogo, garantizando que el contenido esté accesible al agente sin autenticación. Pasos: Haga clic en Añadir contenido; Inserte la dirección completa (incluyendo https://); Haga clic en Guardar o Cancelar. Configurar el catálogo Pantalla que permite visualizar y configurar todos los ítems (archivos y URLs) de un catálogo. Para cada contenido, se muestra información como nombre y tipo, fecha y autor de la última actualización, además del estado de sincronización (Activo, Inactivo o Sincronizando). Pasos: En la pantalla Base de conocimiento, localice el catálogo deseado. Haga clic en el menú de opciones (icono de tres puntos) y seleccione Abrir. Al abrir el catálogo, se mostrará el listado completo de archivos y URLs, permitiendo consultar detalles y utilizar el menú de acciones. Menú de acciones (icono de tres puntos) disponible para cada ítem: Abrir: Muestra el contenido del ítem seleccionado; Descargar: Realiza la descarga del archivo en el formato original a su dispositivo; Actualizar: Sustituye el contenido existente por una nueva versión; Restaurar: Revierte el contenido a la versión anterior más reciente guardada en Blip; Activar/Desactivar: Define si el contenido estará disponible para su uso por el agente de IA; Eliminar: Elimina permanentemente el contenido del catálogo. Gestionar URLs vinculadas Muestra todas las páginas asociadas a una URL pública registrada en el catálogo. Solo las URLs accesibles sin autenticación o bloqueos pueden sincronizarse correctamente. Pasos: En el contenido de tipo URL, haga clic en Abrir. Active o desactive la sincronización de cada página. Elimine páginas cuando sea necesario. Use la búsqueda para localizar páginas específicas. Configurando la Base de Conocimiento en la pestaña Herramientas La pestaña Herramientas permite que su agente interactúe con recursos externos y consulte información específica para enriquecer sus respuestas. Actualmente, la base de conocimiento está conectada al agente como una herramienta, permitiendo que el agente tenga acceso a múltiples contextos de forma organizada. Cómo añadir una Base de Conocimiento Al hacer clic en Añadir herramienta, se mostrará una lista de opciones. En el submenú Consultar, seleccione la opción Base de Conocimiento.A diferencia de versiones anteriores, ahora su agente puede tener una o varias herramientas de este tipo. Esto es útil para separar asuntos diferentes (ej: una base para "Dudas Técnicas" y otra para "Políticas de RR.HH."), permitiendo una referencia más precisa en las instrucciones del agente. Configuraciones Principales Para cada herramienta de base de conocimiento, será necesario definir los siguientes campos: Nombre: Un nombre único que ayude a identificar la herramienta. Descripción: Este campo es fundamental. Es aquí donde explicará al agente cuándo debe consultar esta base y qué encontrará en ella. Ejemplo: "Utilice esta herramienta para responder a dudas sobre precios, planes y métodos de pago." Seleccionando los Contenidos (Catálogos) Para que la herramienta tenga información para consultar, necesita Catálogos. Los catálogos centralizan sus archivos y URLs. Haga clic en Añadir catálogo. En la ventana que se abrirá, puede seleccionar catálogos ya existentes o hacer clic en Crear catálogo para ser redireccionado al área de gestión de contenidos. Consejo Práctico: Puede seleccionar un catálogo entero o solo contenidos específicos dentro de él, marcando las casillas de verificación (checkboxes). Esto le da un control total sobre lo que cada herramienta puede "leer". Optimización y Definiciones de Consulta Para garantizar que el agente responda de forma rápida y económica, la plataforma utiliza la tecnología de RAG (Retrieval Augmented Generation). Esto significa que, en lugar de leer todos los documentos a la vez, el agente busca solo los fragmentos más relevantes para el contexto del usuario. En la sección Definiciones de la Consulta, es posible ajustar: Fragmentos retornados (Chunks): Define cuántos "pedazos" de información recibe el agente por consulta. Recomendación: El valor predeterminado es 3. Añadir más fragmentos puede ayudar al agente a responder mejor, pero consume más tokens y puede exceder la ventana de contexto del modelo. Potencie su Base de Conocimiento con Preprocesamiento El preprocesamiento optimiza los documentos de su base de conocimiento antes de que estén disponibles para los agentes del Studio. Este proceso mejora la calidad de la información, la precisión de las búsquedas y la eficiencia de las respuestas generadas. Ofrecemos tres tipos de preprocesamiento que pueden habilitarse de acuerdo con su necesidad. 1. Optimización (Limpieza de Ruidos) ¿Qué es? La Optimización es un proceso automático de limpieza que elimina "ruidos" y formateos innecesarios del texto de sus documentos. El objetivo es estandarizar el contenido, garantizando que la IA se enfoque solo en la información relevante. ¿Cómo funciona? Este procesador aplica un conjunto de reglas para refinar el texto. Con base en su configuración estándar, ejecuta las siguientes acciones en cada fragmento del documento: Corrección de Unicode: Repara caracteres que fueron corrompidos o mal codificados. Eliminación de HTML: Elimina todas las etiquetas HTML (ej: <div>, <p>, <span>) que pueden estar presentes en documentos extraídos de la web. Normalización de Espacios: Elimina espacios múltiples, tabulaciones y saltos de línea excesivos, sustituyéndolos por un único espacio o salto de línea, respectivamente. Ejemplo Práctico: Texto Original: <p>A Reunião será na terça. Confira o tópico principal.</p>Texto Optimizado: A Reunião será na terça. Confira o tópico principal. 2. Indexación (Resúmenes y Tags con IA) ¿Qué es? La Indexación utiliza un AI Agente para enriquecer cada fragmento (chunk) de su documento con un resumen conciso y palabras clave relevantes. Esto crea un "índice semántico" que mejora drásticamente la capacidad del sistema para encontrar la información exacta que el usuario busca. ¿Cómo funciona? Un agente de IA especializado en síntesis de conocimiento analiza cada fragmento de texto y genera: Resumen: Un sumario corto (2-3 sentencias) que explica el tópico específico de aquel fragmento. Palabras clave: Una lista de 5 a 8 términos esenciales, entidades o jergas técnicas encontrados en el texto. El proceso se realiza en el mismo idioma del documento original para mantener la consistencia. Ejemplo Práctico: Texto del Chunk: "El Artículo 14 del contrato de servicio estipula que la parte contratada debe notificar a la contratante con 30 días de antelación sobre cualquier interrupción programada. El incumplimiento de esta cláusula resultará en penalidades financieras, conforme se detalla en el Anexo B." Resultado de la Indexación: Resumen: "Este fragmento detalla la cláusula del Artículo 14 sobre la obligatoriedad de notificación previa de 30 días para interrupciones de servicio. El incumplimiento de la notificación acarrea multas financieras." Palabras clave: "contrato de servicio, Artículo 14, notificación previa, interrupción programada, cláusula, penalidades financieras, Anexo B" ¿Cuándo usar? En documentos que funcionan como una colección de informaciones independientes, donde cada fragmento tiene valor por sí solo. Ideal para: Bases de Preguntas y Respuestas (FAQ): Donde cada par de pregunta/respuesta es un "hecho" que necesita ser encontrado de forma aislada. Contenido tabular o dividido: Documentos en los que la información ya está segmentada en bloques, como una planilla con descripciones de productos o una lista de políticas internas. Artículos o posts de blog: Donde cada párrafo o sección aborda un subtópico específico que puede ser resumido para facilitar la búsqueda. Beneficio principal Crea un "índice" rico que permite al buscador encontrar fragmentos específicos con alta precisión, incluso si la búsqueda del usuario utiliza sinónimos o términos relacionados. Costo Consume tokens de IA de acuerdo con el tamaño del documento. 3. Contextualización (Lectura Semántica Global con IA) ¿Qué es? La Contextualización es el preprocesamiento más avanzado. Utiliza un AI Agent para realizar una "lectura semántica global" de todo el documento. Para cada fragmento de texto, la IA describe dónde encaja en el contexto general del documento, actuando como un "GPS" para el motor de búsqueda. ¿Cómo funciona? A diferencia de la Indexación, que se enfoca en el contenido del fragmento, la Contextualización se enfoca en su ubicación y propósito. El agente de IA lee el documento completo para entender su estructura (capítulos, secciones, flujo de ideas) y, luego, genera una frase corta (15-25 palabras) para cada fragmento, describiendo su papel contextual. Ejemplo Práctico: Documento: "Manual de Seguridad de TI de la Empresa" Texto del Chunk: "Todos los empleados deben usar contraseñas con un mínimo de 12 caracteres, incluyendo letras mayúsculas, minúsculas, números y símbolos." Resultado de la Contextualización: Contexto Generado: "Sección de 'Política de Contraseñas' del manual, especificando los requisitos de complejidad para las credenciales de acceso de los empleados." ¿Cuándo usar? En documentos largos, continuos y estructurados, donde la posición de una información dentro del todo es crucial para su significado. Ideal para: Manuales técnicos y guías de usuario: Donde es importante saber si un fragmento está en la sección de "Instalación", "Solución de Problemas" o "Configuraciones Avanzadas". Contratos y documentos jurídicos: Donde el contexto de una cláusula (ej: "Cláusula de Rescisión", "Anexo de Penalidades") es fundamental. Artículos científicos e informes de investigación: Donde la estructura (Introducción, Metodología, Resultados, Conclusión) da sentido a cada parte del texto. Beneficio principal Actúa como un "GPS" para la búsqueda, informando al sistema no solo lo que está en el fragmento, sino dónde encaja en el flujo de información del documento. Costo Consume tokens de IA de acuerdo con el tamaño del documento. Tabla Comparativa Opción Ideal para... Benefício Principal Costo de IA Optimización Todos los tipos de archivo, especialmente los "sucios". Garantiza la calidad y consistencia del texto base. No Indexación Contenido segmentado (FAQs, tablas, artículos cortos). Hace que cada fragmento sea "encontrable" por su contenido específico. Sí Contextualización Documentos largos y estructurados (manuales, contratos). Localiza la información dentro de la estructura general del documento. Sí Regla de Oro Si sus documentos son una colección de hechos, donde cada uno puede leerse de forma independiente, elija la Indexación. Si sus documentos cuentan una historia o siguen una estructura lógica, donde el contexto es el rey, elija la Contextualización. La Optimización es como arreglar la casa antes de decorar: úsela siempre que sea posible. Cómo usar el Preprocesamiento en el Studio Ahora, al hacer clic en “Importar archivos” dentro del catálogo, se abrirá un menú lateral:En este menú lateral, es posible cargar múltiples archivos y elegir qué preprocesamiento desea aplicar en cada uno de ellos. Basta con seleccionar la casilla de verificación del preprocesamiento deseado y luego hacer clic en guardar:Las bases se cargarán y se preprocesarán. El tiempo de procesamiento puede variar según el tamaño de la base y las configuraciones seleccionadas. Buenas prácticas Mantenga los contenidos siempre actualizados. Utilice nombres claros y estandarizados para facilitar las búsquedas. Revise las URLs periódicamente para evitar enlaces rotos. Blip Academy ¿Quiere aprender cómo funciona y cómo trabajar con Blip Studio? Acceda a Blip Academy y aprenda de forma gratuita. Para obtener más información, acceda a la discusión sobre el tema en nuestra comunidad o los vídeos en nuestro canal. 😃 Artículos relacionados Studio: Primeros Pasos - Configuraciones Básicas Cómo programar un mensaje con la extensión scheduler Envío de mensajes activos de WhatsApp en Blip Desk Activación de Números Adicionales en Blip - WhatsApp Embedded SignUp Cómo usar variables en las respuestas rápidas de Blip Desk