Vincula un sitio web como fuente de conocimiento para la IA: Your Office AI lo rastrea, genera un resumen y lo indexa para que el asistente pueda citarlo junto a tus documentos subidos. Usa la misma canalización de recuperación que Conocimiento; gestiona tus fuentes desde la pestaña Contexto de sitio web en Integraciones o desde Conocimiento.
En Integraciones, cambia a la pestaña Contexto de sitio web (o añade una fuente web desde Conocimiento).
Introduce el sitio o la página que quieres que la IA use como fuente.
Elige la amplitud del rastreo y qué representación indexar. Los valores predeterminados razonables ya están rellenos.
Your Office AI rastrea dentro de los límites, genera el resumen de IA e indexa la fuente para su recuperación.
Sea cual sea el modo que elijas, Your Office AI siempre genera un resumen de IA real de la fuente en el momento de la ingestión. Se produce mediante un proceso map-reduce sobre los fragmentos de página rastreados: cada fragmento se resume y luego los resúmenes se combinan, no mediante truncamiento simple. Esto significa que incluso un sitio grande se destila en una visión general fiel sobre la que la IA puede razonar.
El resumen se genera cada vez. El modo RAG solo decide qué se almacena en el índice de recuperación: el resumen, el texto completo o ambos.
El modo RAG controla qué representación de las páginas rastreadas se incluye en el índice de conocimiento usado para la recuperación:
| Modo | Qué se indexa | Cuándo usarlo |
|---|---|---|
Resumen (predeterminado)summary | Solo el resumen de IA de la fuente: el índice más pequeño. | Ideal cuando quieres lo esencial de un sitio para fundamentación sin indexar cada página. |
Resumen + completosummaryPlusFull | Tanto el resumen de IA como el texto completo de la página. | Ideal cuando quieres fundamentación de alto nivel más la capacidad de recuperar pasajes exactos. |
Completofull | Solo el texto completo de la página, sin documento de resumen. | Ideal cuando necesitas recuperación precisa a nivel de pasaje de todo lo rastreado. |
El rastreo está acotado por tres límites que estableces por fuente. Se validan al guardar y la fuente los recuerda para que puedas ver la amplitud con la que fue rastreada por última vez:
| Límite | Qué controla |
|---|---|
| Páginas máximas | El número máximo de páginas que una sola ingestión o actualización obtendrá del sitio. |
| Bytes máximos por página | Cuánto texto sin procesar se indexa por página cuando se usa el texto completo. |
| Profundidad de rastreo | Cuántos saltos de enlace se siguen desde la URL registrada. Profundidad 0 significa no rastrear: solo se indexa la página que registraste. |
Establece la profundidad de rastreo a 0 para indexar solo la página que registraste sin seguir ningún enlace: útil para una página de documentación o un artículo concreto.
Una vez indexada, una fuente web funciona como cualquier otro conocimiento:
#, del mismo modo que adjuntas una carpeta de conocimiento o un documento.Las fuentes web comparten la canalización de recuperación de Conocimiento de extremo a extremo. Para subidas de documentos, modelos de incrustación y compartición de carpetas, consulta Base de conocimiento.