📚Función principal

Base de conocimiento

Centraliza los documentos y el contenido web de tu equipo, y deja que la IA los busque, recupere y cite automáticamente. El conocimiento vive en carpetas que tú organizas, compartes y adjuntas a agentes — y es la base de cada respuesta de IA fundamentada.

Cómo funciona

Cuando añades un documento, YOffice lo procesa mediante una canalización de cuatro etapas que hace que su contenido sea buscable por la IA.

📤Subir documentoArchivo o sitio web
✂️Extraer y dividirFragmentos semánticos
🧠Vectorizarpgvector
💬Citado en respuestasRecuperación híbrida
De un documento en bruto a una respuesta de IA citada, automáticamente
1📤
Añadir una fuente

Sube un archivo o enlaza un sitio web. Cada fuente se procesa de forma independiente.

2✂️
Extraer y dividir

Se extrae el texto del archivo y se divide en fragmentos semánticos.

3🧠
Vectorizar

Cada fragmento se convierte en un vector de incrustación y se escribe en pgvector junto a su texto.

4💬
Recuperar y citar

Cuando haces una pregunta, se recuperan los fragmentos más relevantes y se citan en la respuesta.

Carpetas
📁Todos los documentos
📂Especificaciones de producto
📁Ingeniería
📁Incorporación
📁Legal y cumplimiento
Nueva carpeta
Product Specs
+ Add
📄Product Roadmap.pdf2.4 MBReady
📝API Reference.docx840 KBReady
📊Pricing Model.xlsx156 KBEmbedding
📑Launch Deck.pptx5.1 MBProcessing
🌐docs.example.comReady
Carpetas de conocimiento (izquierda) y lista de documentos con insignias de estado de procesamiento (derecha)

Tipos de archivo compatibles

YOffice extrae texto de una amplia variedad de formatos de documento. Las hojas de cálculo se convierten a un formato estructurado optimizado para LLM (y se hacen consultables), para que la IA pueda razonar sobre datos tabulares, no solo sobre texto.

📄PDF📝DOCX / DOC / ODT📑PPTX📊XLSX / XLS / ODS🔤TXT / MD / RTF🧾CSV / TSV🌐HTML🔧JSON / YAML / XML✉️EML🪵LOG
ℹ️
Funciona mejor con fuentes basadas en texto

El conversor lee el texto ya presente en el archivo, por lo que los documentos basados en texto ofrecen la recuperación más fiable. Para una página escaneada o fotografiada (PDF de solo imagen), proporciona una versión basada en texto para que su contenido sea completamente buscable.

Recuperación semántica con pgvector

Los fragmentos se vectorizan y almacenan en pgvector. En el momento de la consulta, YOffice combina similitud vectorial (coseno) con coincidencia de palabras clave — una búsqueda híbrida — para encontrar los fragmentos más relevantes, que la IA cita en línea. Cada carpeta y documento tiene un interruptor de contexto de IA, para que controles exactamente en qué puede basarse la IA.

Modelo de incrustaciónProveedor
text-embedding-3-smallOpenAI (default)
text-embedding-004Google
nomic-embed-textOllama / Ollama Cloud
ℹ️
Usa un solo modelo de incrustación por carpeta

Los diferentes modelos de incrustación producen vectores de distintas dimensiones, por lo que YOffice no cambia de proveedor de forma silenciosa — el contenido de una carpeta se vectoriza con un único modelo. Elige tu proveedor de incrustación de forma deliberada a nivel de organización.

Carpetas, uso compartido y límites

Las carpetas son la forma de organizar y compartir el conocimiento. Cada carpeta admite:

1,000 docs
Número máximo de documentos por carpeta — para que la recuperación sea rápida y relevante
  • Cuatro ámbitos de uso compartido — Privada, Personas y agentes específicos, Espacios de trabajo y Organización — cada uno con permiso de visualización o administración. Consulta Miembros y roles.
  • Un límite de 1.000 documentos por carpeta para mantener la recuperación rápida y relevante.
  • Vigilantes de carpeta — apunta un vigilante a una fuente y los nuevos documentos se incorporan automáticamente a medida que llegan.
  1. Abrir Conocimiento

    Haz clic en Conocimiento en el panel de navegación. La pestaña Conocimiento muestra tus carpetas.

  2. Crear una carpeta

    Haz clic en Nueva carpeta y dale un nombre descriptivo como "Manuales de ingeniería".

  3. Añadir fuentes

    Sube archivos o enlaza un sitio web. Cada fuente se procesa de forma independiente — un PDF grande no bloqueará los más pequeños.

  4. Configurar el uso compartido

    Elige un ámbito de uso compartido y un permiso. Puedes cambiarlo en cualquier momento.

Sitio web como fuente de conocimiento

Además de archivos, puedes enlazar un sitio web como fuente de IA. YOffice rastrea el sitio dentro de límites configurables, genera un resumen de IA en la incorporación e indexa el contenido según el modo RAG que elijas.

Resumen de IA siempre activo

En la incorporación, YOffice genera un resumen real de IA del sitio mediante un proceso de reducción de mapa sobre los fragmentos de página — resume los fragmentos y luego resume los resúmenes. Es un resumen genuino generado por un modelo, no un truncamiento simple, por lo que incluso en el modo más ligero la IA tiene una imagen fiel de la fuente.

Tres modos RAG

El modo controla qué se indexa para la recuperación:

ModoQué se indexaÚsalo cuando…
ResumenPredeterminadoSolo el resumen de IAQuieres una visión general compacta y rápida del sitio.
Resumen + completoEl resumen y el texto completo de la páginaQuieres la visión general más la posibilidad de recuperar detalles específicos.
CompletoEl texto completo rastreadoNecesitas la máxima recuperación sobre todo el contenido del sitio.

Límites de rastreo

El rastreo está acotado por límites validados — páginas máximas, bytes máximos por página y profundidad de rastreo. Cada uno tiene un mínimo positivo estricto para que una fuente de sitio web no consuma tu presupuesto de forma descontrolada.

Uso del conocimiento en el chat de IA

Una vez indexada una carpeta, la IA puede utilizarla de dos maneras:

  • Ámbito por chat — abre la herramienta Conocimiento en la barra de herramientas del chat y elige carpetas para esa sesión, o añade una carpeta con #.
  • Conocimiento siempre activo — las carpetas compartidas en toda la organización (y marcadas para contexto de IA) están disponibles entre sesiones, ideal para una wiki corporativa o documentación de producto.

Adjuntar carpetas a agentes

Adjunta una o más carpetas de conocimiento a un agente y ese agente recuperará de ellas automáticamente cuando se ejecute — un agente de soporte vinculado a tu carpeta "Documentos de soporte" responde preguntas sin ninguna búsqueda manual. Las carpetas también se pueden compartir con un agente.

💡
Buenas prácticas para una Base de conocimiento útil

Organiza por tema o equipo en lugar de por fecha. Usa nombres de carpeta descriptivos. Mantén el contenido actualizado — los documentos obsoletos inducen a error a la IA. Para documentos externos que cambian con frecuencia, enlaza la fuente del sitio web para que el contenido se mantenga fresco, y elige el modo RAG que corresponda al nivel de detalle que realmente necesitas recuperar.