Zum Hauptinhalt springen

Daten-Upload via Datensammlung vs. Prompt-Library

In diesem Artikel erfährst du, wann du deine Dateien in eine Datensammlung und wann in die Prompt Library hochladen solltest.

Fabio Duó avatar
Verfasst von Fabio Duó
Vor über 3 Wochen aktualisiert

Bei PeakPrivacy spielen wir extractive und generative KI effizient Hand in Hand. Denn das Zusammenspiel ist mächtig und bringt viele Vorteile. Wenn wir eigene Daten (RAG) hochladen möchten, so gibt es mehrere Möglichkeiten:

Prompt-Library

Der Prompt eignet sich besonders, wenn alle Informationen vollständig und direkt verarbeitet werden müssen.

Beste Einsatzszenarien

  • Wenn die kompletten Informationen zwingend berücksichtigt werden müssen

  • Bei überschaubaren Datenmengen innerhalb des Kontextfensters

  • Bei Kernwissen, das durchgehend präsent sein muss

📎 Beispiel: Bei PeakPrivacy nutzen wir Prompts zum Beispiel für die Verarbeitung von Rechnungen, wo jedes Detail exakt berücksichtigt werden muss.

Datensammlung

Die Datensammlung ist die beste Wahl für grosse Dokumentenmengen und spezifische Informationsabfragen. Diese Art von KI zieht Informationen direkt aus vorhandenem Text oder Daten.

Sie identifiziert:

  • Schlüsselphrasen

  • Fakten

  • Zusammenfassungen

  • Relevante Inhalte und "zieht" sie heraus.

Wichtiger Hinweis:

Sie verändert den ursprünglichen Text nicht, sondern extrahiert nur Teile davon. Denk an eine Suchmaschine, die dir relevante Artikel aufzählt, oder eine Zusammenfassungsfunktion, die dir die wichtigsten Punkte eines langen Textes liefert.

Ideale Anwendungsfälle

  • Für umfangreiche Dokumentensammlungen (Richtlinien, Handbücher etc.)

  • Bei spezifischen Fragen zu einem grossen Wissenskorpus

  • Wenn Quellenangaben wichtig sind

  • Bei häufigen Aktualisierungen der Wissensbasis

📎 Beispiel: PeakPrivacy verwendet die Datensammlung etwa für die Verarbeitung grosser Mengen an Compliance-Dokumenten, wo gezielte Informationen aus tausenden Seiten extrahiert werden müssen.

Dieser Screenshot zeigt die PeakPrivacy Plattform und die Funktion Datensammlung anzulegen.

Kostenaspekte

  • System Prompts können bei grossen Datenmengen kostenintensiv sein

  • Wissensbox optimiert die Kosten durch gezielte Informationsauswahl

Hat dies deine Frage beantwortet?