🌐Website-Kontext

Website-Kontext

Verknüpfen Sie eine Website als KI-Wissensquelle: Your Office AI crawlt sie, erstellt eine Zusammenfassung und indexiert sie, damit der Assistent sie neben Ihren hochgeladenen Dokumenten zitieren kann. Es handelt sich um dieselbe Abrufpipeline wie bei Wissen – verwalten Sie Ihre Quellen im Tab Website-Kontext unter Integrationen oder über Wissen.

🔗URL hinzufügenQuelle registrieren

🕷️CrawlenInnerhalb Ihrer Limits

📝KI-ZusammenfassungMap-Reduce, immer

🧠IndexierenGemäß RAG-Modus

💬Im Chat zitiertFundierte Antworten

Von einer URL zu zitierten Antworten – die Website-Kontext-Ingestionspipeline.

Eine Website verknüpfen

Website-Kontext öffnen
Wechseln Sie in Integrationen zum Tab „Website-Kontext" (oder fügen Sie eine Website-Quelle über Wissen hinzu).
URL einfügen
Geben Sie die Website oder Seite ein, die die KI als Quelle verwenden soll.
Crawl-Limits und RAG-Modus festlegen
Wählen Sie die Crawl-Tiefe und die zu indexierende Darstellung. Sinnvolle Standardwerte sind vorausgefüllt.
Ingestieren
Your Office AI crawlt innerhalb der Limits, erstellt die KI-Zusammenfassung und indexiert die Quelle für den Abruf.

Eine KI-Zusammenfassung, immer

Egal welchen Modus Sie wählen – Your Office AI erstellt immer eine echte KI-Zusammenfassung der Quelle beim Ingestieren. Sie wird durch ein Map-Reduce-Verfahren über die gecrawlten Seitenblöcke erzeugt: Jeder Block wird zusammengefasst, dann werden die Zusammenfassungen kombiniert – nicht durch einfaches Kürzen. So destilliert selbst eine große Website zu einem verlässlichen Überblick, über den die KI schlussfolgern kann.

ℹ️

Zusammenfassung und Index sind getrennt

Die Zusammenfassung wird jedes Mal erstellt. Der RAG-Modus entscheidet nur, was im Abrufindex gespeichert wird – die Zusammenfassung, der vollständige Text oder beides.

Drei RAG-Modi

Der RAG-Modus bestimmt, welche Darstellung der gecrawlten Seiten in den für den Abruf verwendeten Wissensindex gelangt:

Modus	Was indexiert wird	Wann verwenden
Zusammenfassung (Standard) `summary`	Nur die KI-Zusammenfassung der Quelle – der kleinste Index.	Optimal, wenn Sie den Kern einer Website für die Fundierung benötigen, ohne jede Seite zu indexieren.
Zusammenfassung + Volltext `summaryPlusFull`	Sowohl die KI-Zusammenfassung als auch der vollständige Seitentext.	Optimal, wenn Sie übergeordnete Fundierung und die Fähigkeit benötigen, genaue Passagen abzurufen.
Volltext `full`	Nur der vollständige Seitentext – kein Zusammenfassungsdokument.	Optimal, wenn Sie präzisen, passagengenauen Abruf über alles Gecrawlte benötigen.

Crawl-Limits

Das Crawlen ist durch drei Limits begrenzt, die Sie pro Quelle festlegen. Sie werden beim Speichern validiert, und die Quelle merkt sie sich, damit Sie die Crawl-Tiefe des letzten Laufs nachvollziehen können:

Limit	Was es steuert
Max. Seiten	Die maximale Anzahl Seiten, die eine einzelne Ingestion oder Aktualisierung von der Website abruft.
Max. Bytes pro Seite	Wie viel Rohtext pro Seite indexiert wird, wenn Volltext verwendet wird.
Crawl-Tiefe	Wie viele Link-Hops von der registrierten URL aus verfolgt werden, nur innerhalb desselben Ursprungs. Die Crawl-Tiefe spielt erst eine Rolle, sobald „Max. Seiten" mehr als eine Seite zulässt.

💡

Max. Seiten = 1: einzelne Seite

Setzen Sie Max. Seiten auf 1, um nur die registrierte Seite zu indexieren, ohne Links zu folgen – praktisch für eine einzelne Dokumentationsseite oder einen Artikel. Die Crawl-Tiefe gilt weiterhin, aber ein Limit von 1 Seite stoppt den Crawl, bevor er irgendetwas verfolgen kann.

Eine Website-Quelle verwenden

Nach der Indexierung verhält sich eine Website-Quelle wie jedes andere Wissen:

Der Assistent ruft beim Antworten die relevantesten Passagen ab und zitiert sie – über pgvector-Semantiksuche.
Hängen Sie sie als Kontext im Chat per # an – genauso wie einen Wissensordner oder ein Dokument.
Eine erneute Ingestion aktualisiert das Crawlen, regeneriert die Zusammenfassung und aktualisiert den Index.

ℹ️

Teil von Wissen

Website-Quellen teilen die Wissen-Abrufpipeline von Anfang bis Ende. Für Dokument-Uploads, Einbettungsmodelle und Ordnerfreigaben siehe Wissensdatenbank.

← ZurückCustom integrations Weiter →Organization Settings