Centraliza los documentos y el contenido web de tu equipo, y deja que la IA los busque, recupere y cite automáticamente. El conocimiento vive en carpetas que tú organizas, compartes y adjuntas a agentes — y es la base de cada respuesta de IA fundamentada.
Cuando añades un documento, YOffice lo procesa mediante una canalización de cuatro etapas que hace que su contenido sea buscable por la IA.
Sube un archivo o enlaza un sitio web. Cada fuente se procesa de forma independiente.
Se extrae el texto del archivo y se divide en fragmentos semánticos.
Cada fragmento se convierte en un vector de incrustación y se escribe en pgvector junto a su texto.
Cuando haces una pregunta, se recuperan los fragmentos más relevantes y se citan en la respuesta.
YOffice extrae texto de una amplia variedad de formatos de documento. Las hojas de cálculo se convierten a un formato estructurado optimizado para LLM (y se hacen consultables), para que la IA pueda razonar sobre datos tabulares, no solo sobre texto.
El conversor lee el texto ya presente en el archivo, por lo que los documentos basados en texto ofrecen la recuperación más fiable. Para una página escaneada o fotografiada (PDF de solo imagen), proporciona una versión basada en texto para que su contenido sea completamente buscable.
Los fragmentos se vectorizan y almacenan en pgvector. En el momento de la consulta, YOffice combina similitud vectorial (coseno) con coincidencia de palabras clave — una búsqueda híbrida — para encontrar los fragmentos más relevantes, que la IA cita en línea. Cada carpeta y documento tiene un interruptor de contexto de IA, para que controles exactamente en qué puede basarse la IA.
| Modelo de incrustación | Proveedor |
|---|---|
| text-embedding-3-small | OpenAI (default) |
| text-embedding-004 | |
| nomic-embed-text | Ollama / Ollama Cloud |
Los diferentes modelos de incrustación producen vectores de distintas dimensiones, por lo que YOffice no cambia de proveedor de forma silenciosa — el contenido de una carpeta se vectoriza con un único modelo. Elige tu proveedor de incrustación de forma deliberada a nivel de organización.
Las carpetas son la forma de organizar y compartir el conocimiento. Cada carpeta admite:
Haz clic en Conocimiento en el panel de navegación. La pestaña Conocimiento muestra tus carpetas.
Haz clic en Nueva carpeta y dale un nombre descriptivo como "Manuales de ingeniería".
Sube archivos o enlaza un sitio web. Cada fuente se procesa de forma independiente — un PDF grande no bloqueará los más pequeños.
Elige un ámbito de uso compartido y un permiso. Puedes cambiarlo en cualquier momento.
Además de archivos, puedes enlazar un sitio web como fuente de IA. YOffice rastrea el sitio dentro de límites configurables, genera un resumen de IA en la incorporación e indexa el contenido según el modo RAG que elijas.
En la incorporación, YOffice genera un resumen real de IA del sitio mediante un proceso de reducción de mapa sobre los fragmentos de página — resume los fragmentos y luego resume los resúmenes. Es un resumen genuino generado por un modelo, no un truncamiento simple, por lo que incluso en el modo más ligero la IA tiene una imagen fiel de la fuente.
El modo controla qué se indexa para la recuperación:
| Modo | Qué se indexa | Úsalo cuando… |
|---|---|---|
| ResumenPredeterminado | Solo el resumen de IA | Quieres una visión general compacta y rápida del sitio. |
| Resumen + completo | El resumen y el texto completo de la página | Quieres la visión general más la posibilidad de recuperar detalles específicos. |
| Completo | El texto completo rastreado | Necesitas la máxima recuperación sobre todo el contenido del sitio. |
El rastreo está acotado por límites validados — páginas máximas, bytes máximos por página y profundidad de rastreo. Cada uno tiene un mínimo positivo estricto para que una fuente de sitio web no consuma tu presupuesto de forma descontrolada.
Una vez indexada una carpeta, la IA puede utilizarla de dos maneras:
Adjunta una o más carpetas de conocimiento a un agente y ese agente recuperará de ellas automáticamente cuando se ejecute — un agente de soporte vinculado a tu carpeta "Documentos de soporte" responde preguntas sin ninguna búsqueda manual. Las carpetas también se pueden compartir con un agente.
Organiza por tema o equipo en lugar de por fecha. Usa nombres de carpeta descriptivos. Mantén el contenido actualizado — los documentos obsoletos inducen a error a la IA. Para documentos externos que cambian con frecuencia, enlaza la fuente del sitio web para que el contenido se mantenga fresco, y elige el modo RAG que corresponda al nivel de detalle que realmente necesitas recuperar.