Zum Hauptinhalt springen

Neue KI-Modelle verfügbar: Entdecke unsere aktualisierte LLM-Auswahl

Seit letztem Freitag 11.04.2025 (Q1 Release) steht euch eine überarbeitete und verbesserte Auswahl an KI-Modellen zur Verfügung.

Fabio Duó avatar
Verfasst von Fabio Duó
Vor über 2 Monaten aktualisiert

In den letzten Monaten hat unser Team intensiv daran gearbeitet, die aktuell leistungsfähigsten und relevantesten Modelle für eure Bedürfnisse zu evaluieren, zu testen und zu integrieren. Diese Aktualisierung stellt sicher, dass ihr stets Zugriff auf modernste KI-Technologie habt, die optimal auf verschiedene Anwendungsfälle zugeschnitten ist.

Kontext: Warum neue Modelle?

Die Welt der künstlichen Intelligenz entwickelt sich rasant. Um euch die besten Werkzeuge an die Hand zu geben, überprüfen wir regelmässig den Markt, testen vielversprechende neue Modelle und integrieren die leistungsstärksten Kandidaten in unsere Plattform. Dabei achten wir nicht nur auf die reine Performance, sondern auch auf Geschwindigkeit, Effizienz beim Hosting (insbesondere auf unseren Schweizer Servern für Open-Source-Modelle) und die Qualität der generierten Antworten in Bezug auf Korrektheit und potenzielle Biases. Diese sorgfältige Auswahl führte nun zu einer strategischen Neuausrichtung, bei der wir unter anderem stark auf das neue Gemma-Modell für unsere Schweizer Variante setzen.

Unsere Top-Empfehlungen im Überblick:

Hier ist eine kurze Erklärung der wichtigsten neuen und aktualisierten Modelle:


Gemma 3 Swiss (Hosting: Schweiz)

  • Was es ist: Unser neues Top-Modell für Schweizerdeutsch und Deutsch, basierend auf Googles Gemma-Architektur. Es ersetzt das bisherige Llama 3 Swiss.

  • Stärken: Deutlich verbesserte Antwortqualität und vor allem extrem schnell (bis zu 120 Tokens/Sekunde). Hervorragend geeignet für allgemeine Aufgaben und besonders effektiv für RAG-Anwendungen (Retrieval-Augmented Generation), bei denen das Modell mit euren spezifischen Daten (die ihr hochlädt oder einkopiert) arbeitet.

  • Wichtiger Hinweis: Für optimale Ergebnisse, insbesondere bei der Arbeit mit eigenen Daten oder spezifischen Anweisungen (Konstruktoren), empfehlen wir dringend, die Temperatur (Kreativität) auf einen niedrigen Wert (z.B. 0.2 oder 0.3) zu setzen. Höhere Standardwerte (wie 0.7 oder 0.8) können bei diesem Modell zu unerwünschten oder falschen Ergebnissen führen.

  • Datenschutz/ Hosting: Wird auf unseren Servern in der Schweiz betrieben.

DeepSeek R1 (Hosting: Europa)

  • Was es ist: Ein hochmodernes Modell eines chinesischen Entwicklers, das mit den weltweit besten Modellen mithalten kann.

  • Stärken: DeepSeek ist ein sogenanntes "Thinking"-Modell. Es analysiert die Anfrage zuerst gründlich ("denkt nach"), bevor es mit der Generierung der Antwort beginnt. Dies führt zu einer leichten Startverzögerung, resultiert aber oft in besonders durchdachten und qualitativ hochwertigen Ergebnissen. Ideal für das Schreiben von Konzepten, längeren Texten oder komplexeren Aufgaben, die Reflexion erfordern.

  • Datenschutz/ Hosting: Wir hosten die vollständige Version dieses Modells auf Servern in Europa. Ihre Daten verlassen somit nicht den europäischen Raum, im Gegensatz zur direkten Nutzung über die Anbieter-Webseite oder andere Dienste, die es eventuell über chinesische Server routen.

Gemini 2.5 Pro (Hosting: Google)

  • Was es ist: Das aktuellste und leistungsfähigste Modell von Google, das als eines der weltweiten Top-Modelle gilt.

  • Stärken: Liefert herausragende Ergebnisse bei sehr komplexen Aufgaben. Exzellent für Programmierung, das Verfassen und Überarbeiten anspruchsvoller Texte, konzeptionelle Arbeit und Internet-Recherche.

  • Hinweis: Startet eventuell etwas langsamer als andere Modelle.

  • Datenschutz/ Hosting: Da es bei Google gehostet wird, werden deine Anfragen dorthin gesendet. Es ist daher weniger geeignet für Aufgaben, bei denen hochsensible Daten direkt verarbeitet werden sollen (z.B. klassische RAG-Anwendungen mit internen Dokumenten).

Weitere verfügbare Modelle:

  • GPT-4o, etc. von OpenAI (Hosting USA): Wir bieten weiterhin ausgewählte Modelle von OpenAI an (wie GPT-4o und die aktuellsten Top-Varianten). Denn diese Modelle sind bei vielen Leuten bekannt und beliebt. Wir haben die Auswahl jedoch reduziert, da sie vergleichsweise teuer sind und nicht mehr in allen Bereichen die Spitze darstellen.

  • Mistral Swiss (Hosting Schweiz): Dieses ebenfalls in der Schweiz gehostete Modell hat kürzlich ein grosses Update erhalten und stellt eine gute Alternative dar.

  • Claude Sonnet von Anthropic (Hosting USA): Weiterhin verfügbar, sehr schnell und gut in den Antworten. Für viele Anwendungsfälle empfehlen wir aktuell Gemini 2.5 Pro oder DeepSeek empfehlen.

  • Gemma 3 (Hosting Deutschland): Eine zusätzliche Variante von Gemma 3, die in Deutschland gehostet wird und eine kosteneffizientere Option darstellen kann.

Zusammenfassung der Empfehlungen:

  • Schnell & Gut (Schweiz): Gemma 3 Swiss (Temperatur beachten -> stelle sie auf 0.2 für bessere Ergebnisse)

  • Hohe Qualität & Konzeptarbeit (Europa): DeepSeek R1

  • Maximale Leistung & Komplexität (Global): Gemini 2.5 Pro

Wir sind überzeugt, dass wir euch mit dieser neuen Auswahl wieder eine hervorragende Basis für Ihre KI-gestützten Aufgaben bieten. Probiert die neuen Modelle aus und gebt uns gerne Feedback!

Hinweise für KI-Change Makers / Ambassadors: Modell-Auswahl einschränken!

Falls du zu den Firmen / Organisationsinternen Change Makers / Ambassadors gehörst: Hast du gewusst, dass du die Auswahl der Modelle einschränken kannst? Dies war ein langersehnter Wunsch von PeakPrivacy Usern dem wir nun nachgekommen sind. Denn eine zu grosse Modell-Auswahl kann überfordern, gerade wenn KI noch "Neuland" ist.

-> Anleitung dazu folgt

Wie wähle ich das "richtige" Modell für meine Anwendungen aus?

Je nach Use Cases sind die Anforderungen an das LLM und an den Datenschutz unterschiedlich. Wir versuchen dich mit diesem Artikel bestmöglich, inkl. Beispielen, darin zu unterstützen die für dich passenden Modelle zu finden.

Wir können dich bei der Auswahl jederzeit unterstützen!

Hat dies deine Frage beantwortet?