Die besten Open-Source-KIs auf Abruf in einer unabhängigen Cloud

Entdecken Sie die besten Open-Source-Alternativen zu ChatGPT, Gemini, Midjourney oder Claude, um sensible Daten in vollständigem Einklang mit europäischem und schweizerischem Recht zu verarbeiten.

LLM↓

Einbettungen↓

Audio↓

Image↓

Grosse Sprachmodelle (LLM)

Die besten Open-Source-Alternativen zu ChatGPT, Gemini und Microsoft Copilot für die Interaktion, Analyse und Generierung von Inhalten mit KI.

Qwen/Qwen3.5-122B-A10B-FP8

Am effizientesten

Kostenlos starten

API-Dokumentation konsultieren

●
Entwickelt für komplexe Aufgaben, die ein breites Kontextfenster und eine hohe Präzision beim logischen Denken erfordern.
●
Optimierte Architektur für schnellere Inferenzen und geringeren Energieverbrauch, wodurch erhebliche Rechenressourcen freigesetzt werden.
●
Mit Millionen von Agenten und Aufgaben zunehmender Komplexität trainiert, um eine robuste Anpassungsfähigkeit an die reale Welt zu gewährleisten.

Modalität

Image-Text to Text

Max. Token-Input

200’000

Sprachen

100+ Sprachen

Funktionsaufruf

Kategorie der Vorlage

chat_large

Kostenlos starten

API-Dokumentation konsultieren

●
Entwickelt für komplexe Aufgaben, die ein breites Kontextfenster und eine hohe Präzision beim logischen Denken erfordern.
●
Optimierte Architektur für schnellere Inferenzen und geringeren Energieverbrauch, wodurch erhebliche Rechenressourcen freigesetzt werden.
●
Mit Millionen von Agenten und Aufgaben zunehmender Komplexität trainiert, um eine robuste Anpassungsfähigkeit an die reale Welt zu gewährleisten.

Modalität

Image-Text to Text

Max. Token-Input

200’000

Sprachen

100+ Sprachen

Funktionsaufruf

Kategorie der Vorlage

chat_large

Apertus-70B-Instruct-2509

Am ethischsten

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Ideal für mehrsprachige Abteilungen, Behörden und FuE-Teams, die ein zuverlässiges und anpassungsfähiges Modell benötigen
●
Dokumentierte Daten und Methoden für bislang einmalige Transparenz
●
Entspricht dem AI Act und achtet die Privatsphäre und geistiges Eigentum
●
Eine 70B-Variante mit einer Leistung, die mit den aktuellen Marktführern vergleichbar ist

Modalität

Text to Text

Max. Token-Input

65’536

Sprachen

100+ Sprachen

Funktionsaufruf

Nein

Kategorie der Vorlage

chat_medium

Kostenlos starten

API-Dokumentation konsultieren

●
Ideal für mehrsprachige Abteilungen, Behörden und FuE-Teams, die ein zuverlässiges und anpassungsfähiges Modell benötigen
●
Dokumentierte Daten und Methoden für bislang einmalige Transparenz
●
Entspricht dem AI Act und achtet die Privatsphäre und geistiges Eigentum
●
Eine 70B-Variante mit einer Leistung, die mit den aktuellen Marktführern vergleichbar ist

Modalität

Text to Text

Max. Token-Input

65’536

Sprachen

100+ Sprachen

Funktionsaufruf

Nein

Kategorie der Vorlage

chat_medium

google/gemma-4-31B-it

Der ideale Kompromiss

Kostenlos starten

API-Dokumentation konsultieren

●
Der ideale Kompromiss zwischen Reaktionsgeschwindigkeit und Leistungsstärke – entwickelt für herausragende Leistungen beim logischen Denken, gründlicher Dokumentenanalyse und der Erstellung zuverlässiger Codes.
●
Nutzt eine hochmoderne Architektur, um ein differenziertes Verständnis für umfangreiche Kontexte und komplexe Anweisungen zu ermöglichen.
●
Ideal für komplexe Chatbots und Unternehmensworkflows, die eine hohe Flexibilität ohne Verlangsamung der Ausführung erfordern.

Modalität

Text-zu-Text (anweisungsoptimiert)

Max. Token-Input

100’000

Sprachen

140+ Sprachen

Funktionsaufruf

Ja (nativ und optimiert)

Kategorie der Vorlage

chat_medium

Kostenlos starten

API-Dokumentation konsultieren

●
Der ideale Kompromiss zwischen Reaktionsgeschwindigkeit und Leistungsstärke – entwickelt für herausragende Leistungen beim logischen Denken, gründlicher Dokumentenanalyse und der Erstellung zuverlässiger Codes.
●
Nutzt eine hochmoderne Architektur, um ein differenziertes Verständnis für umfangreiche Kontexte und komplexe Anweisungen zu ermöglichen.
●
Ideal für komplexe Chatbots und Unternehmensworkflows, die eine hohe Flexibilität ohne Verlangsamung der Ausführung erfordern.

Modalität

Text-zu-Text (anweisungsoptimiert)

Max. Token-Input

100’000

Sprachen

140+ Sprachen

Funktionsaufruf

Ja (nativ und optimiert)

Kategorie der Vorlage

chat_medium

moonshotai/Kimi-K2.6

Am leistungsstärksten für Vibe-Coding

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Native Multimodalität: Wandelt Text, Bilder oder Modelle in voll funktionsfähigen Code um.
●
Konzipiert für gross angelegte Entwicklungen: Umfasst ein erweitertes Kontextfenster mit bis zu 256k Tokens zur Verwaltung komplexer Projekte
●
Optimiert für Vibe-Coding: schnell, flüssig und kreativ – konzipiert für Entwickler und Produktdesigner
●
Kompatibel mit agentenbasierten Workflows: Automatisiert die Analyse, die Codegenerierung und die End-to-End-Ausführung

Modalität

Image-Text to Text

Max. Token-Input

256’000

Sprachen

Mehrsprachig

Funktionsaufruf

Kategorie der Vorlage

code

Kostenlos starten

API-Dokumentation konsultieren

●
Native Multimodalität: Wandelt Text, Bilder oder Modelle in voll funktionsfähigen Code um.
●
Konzipiert für gross angelegte Entwicklungen: Umfasst ein erweitertes Kontextfenster mit bis zu 256k Tokens zur Verwaltung komplexer Projekte
●
Optimiert für Vibe-Coding: schnell, flüssig und kreativ – konzipiert für Entwickler und Produktdesigner
●
Kompatibel mit agentenbasierten Workflows: Automatisiert die Analyse, die Codegenerierung und die End-to-End-Ausführung

Modalität

Image-Text to Text

Max. Token-Input

256’000

Sprachen

Mehrsprachig

Funktionsaufruf

Kategorie der Vorlage

code

mistralai/Ministral-3-14B-Instruct-2512

Der Allrounder

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Optimiert für eine schnelle und kostengünstige Bereitstellung – ideal für Chatbots, Dokumentenanalyse und spezielle Aufgaben.
●
Bietet eine mit Mistral Small 3.2 24B vergleichbare Leistung – bei minimalem Ressourcenverbrauch.
●
Kann Bilder analysieren und neben Text auch Informationen auf der Grundlage des visuellen Inhalts liefern.

Modalität

Image-Text to Text

Max. Token-Input

100’000

Sprachen

EN, ES, FR, DE, IT...

Funktionsaufruf

Kategorie der Vorlage

chat_small

Kostenlos starten

API-Dokumentation konsultieren

●
Optimiert für eine schnelle und kostengünstige Bereitstellung – ideal für Chatbots, Dokumentenanalyse und spezielle Aufgaben.
●
Bietet eine mit Mistral Small 3.2 24B vergleichbare Leistung – bei minimalem Ressourcenverbrauch.
●
Kann Bilder analysieren und neben Text auch Informationen auf der Grundlage des visuellen Inhalts liefern.

Modalität

Image-Text to Text

Max. Token-Input

100’000

Sprachen

EN, ES, FR, DE, IT...

Funktionsaufruf

Kategorie der Vorlage

chat_small

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Die effizienteste Architektur

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Eine innovative Hybridarchitektur, die die Leistung eines grossen Modells mit der Geschwindigkeit und den Kosten eines kleinen Modells verbindet.
●
Zeigt dank des Trainings mit hochwertigen technischen Datensätzen hervorragende Leistungen beim logischen Denken, bei der Zusammenfassung komplexer Daten und bei der Erstellung strukturierten Codes.
●
Ideal für gross angelegte Implementierungen, bei denen ein Gleichgewicht zwischen Höchstleistung und kontrollierten Infrastrukturkosten erforderlich ist.

Modalität

Text to Text

Max. Token-Input

1’000’000

Sprachen

EN, ES, FR, DE, IT, JP

Funktionsaufruf

Kategorie der Vorlage

chat_medium

Kostenlos starten

API-Dokumentation konsultieren

●
Eine innovative Hybridarchitektur, die die Leistung eines grossen Modells mit der Geschwindigkeit und den Kosten eines kleinen Modells verbindet.
●
Zeigt dank des Trainings mit hochwertigen technischen Datensätzen hervorragende Leistungen beim logischen Denken, bei der Zusammenfassung komplexer Daten und bei der Erstellung strukturierten Codes.
●
Ideal für gross angelegte Implementierungen, bei denen ein Gleichgewicht zwischen Höchstleistung und kontrollierten Infrastrukturkosten erforderlich ist.

Modalität

Text to Text

Max. Token-Input

1’000’000

Sprachen

EN, ES, FR, DE, IT, JP

Funktionsaufruf

Kategorie der Vorlage

chat_medium

mistralai/Mistral-Small-4-119B-2603

Am effizientesten für Lernen und logisches Denken

Kostenlos starten

API-Dokumentation konsultieren

●
Ein vielseitiges Modell, das mühelos zwischen allgemeinen Anweisungen und komplexem logischen Denken wechseln kann.
●
Geeignet für anspruchsvolle agentenbasierte Workflows und Unternehmensanwendungen, die höchste Zuverlässigkeit und Kohärenz erfordern.
●
Übertrifft Mistral Small 3 in Bezug auf Latenz und Abfrage-Durchsatz bei Weitem.

Modalität

Image-Text to Text

Max. Token-Input

256’000

Sprachen

Mehrsprachig

Funktionsaufruf

Kategorie der Vorlage

chat_large

Kostenlos starten

API-Dokumentation konsultieren

●
Ein vielseitiges Modell, das mühelos zwischen allgemeinen Anweisungen und komplexem logischen Denken wechseln kann.
●
Geeignet für anspruchsvolle agentenbasierte Workflows und Unternehmensanwendungen, die höchste Zuverlässigkeit und Kohärenz erfordern.
●
Übertrifft Mistral Small 3 in Bezug auf Latenz und Abfrage-Durchsatz bei Weitem.

Modalität

Image-Text to Text

Max. Token-Input

256’000

Sprachen

Mehrsprachig

Funktionsaufruf

Kategorie der Vorlage

chat_large

Qwen/Qwen3.5-397B-A17B-FP8

Der Leistungsfähigste

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Eine hochmoderne MoE-Architektur, die für Aufgaben von extremer Komplexität entwickelt wurde und unübertroffene Präzision bei wissenschaftlichen Berechnungen, mehrstufiger Planung und der Ausführung von Tools bietet.
●
Nutzen Sie eine erheblich erweiterte globale Wissensdatenbank, um ein umfassenderes Allgemeinwissen zu erwerben und komplexe Codes zu generieren.
●
Übertrifft die Vorgängermodelle bei strengen Leistungsvergleichen.

Modalität

Image-Text to Text

Max. Token-Input

200’000

Sprachen

Über 100 Sprachen

Funktionsaufruf

Kategorie der Vorlage

chat_large

Kostenlos starten

API-Dokumentation konsultieren

●
Eine hochmoderne MoE-Architektur, die für Aufgaben von extremer Komplexität entwickelt wurde und unübertroffene Präzision bei wissenschaftlichen Berechnungen, mehrstufiger Planung und der Ausführung von Tools bietet.
●
Nutzen Sie eine erheblich erweiterte globale Wissensdatenbank, um ein umfassenderes Allgemeinwissen zu erwerben und komplexe Codes zu generieren.
●
Übertrifft die Vorgängermodelle bei strengen Leistungsvergleichen.

Modalität

Image-Text to Text

Max. Token-Input

200’000

Sprachen

Über 100 Sprachen

Funktionsaufruf

Kategorie der Vorlage

chat_large

Modelle zur Rangfolgen-Optimierung

Die besten kompatiblen Open-Source-Alternativen zur Optimierung der Relevanz Ihrer Suchergebnisse. Verfeinern Sie die Klassifizierung Ihrer Dokumente, verbessern Sie die Genauigkeit Ihrer RAG-Systeme und sorgen Sie für eine intelligentere und kontextbezogene Informationsgewinnung.

BAAI/bge-reranker-v2-m3

Der Allrounder

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Ein mehrsprachiges Experten-Modell, das gleichzeitig kurze Anfragen, Absätze und lange Dokumente mit einer Länge von bis zu 8192 Tokens verarbeiten kann
●
Kombiniert die lexikalische (Schlüsselwörter) und semantische (Bedeutung) Analyse für eine unübertroffen genaue Klassifizierung bei komplexen Korpora
●
Ideale Lösung für Unternehmenssuchmaschinen und RAG-Anwendungen, die ein tiefgreifendes Verständnis des Kontexts erfordern

Modalität

Text to Text

Max. Token-Input

8192

Sprachen

Über 100 Sprachen

Funktionsaufruf

Nein

Typ

Rangfolge neu festlegen

Kostenlos starten

API-Dokumentation konsultieren

●
Ein mehrsprachiges Experten-Modell, das gleichzeitig kurze Anfragen, Absätze und lange Dokumente mit einer Länge von bis zu 8192 Tokens verarbeiten kann
●
Kombiniert die lexikalische (Schlüsselwörter) und semantische (Bedeutung) Analyse für eine unübertroffen genaue Klassifizierung bei komplexen Korpora
●
Ideale Lösung für Unternehmenssuchmaschinen und RAG-Anwendungen, die ein tiefgreifendes Verständnis des Kontexts erfordern

Modalität

Text to Text

Max. Token-Input

8192

Sprachen

Über 100 Sprachen

Funktionsaufruf

Nein

Typ

Rangfolge neu festlegen

Qwen/Qwen3-Reranker-0.6B

Am effektivsten

Beta

Kostenlos starten

API-Dokumentation konsultieren

●
Ultraschlanke Architektur (0,6 Milliarden Parameter), entwickelt für Inferenzen mit sehr geringer Latenz und minimalem Energieverbrauch
●
Behält eine hohe Relevanzgenauigkeit bei, selbst bei einem erweiterten Kontextfenster von bis zu 32768 Tokens
●
Ideal für Echtzeit-Datenströme, autonome Agenten und Bereitstellung im grossen Massstab

Modalität

Text to Text

Max. Token-Input

32768

Sprachen

Über 100 Sprachen

Funktionsaufruf

Nein

Typ

Rangfolge neu festlegen

Kostenlos starten

API-Dokumentation konsultieren

●
Ultraschlanke Architektur (0,6 Milliarden Parameter), entwickelt für Inferenzen mit sehr geringer Latenz und minimalem Energieverbrauch
●
Behält eine hohe Relevanzgenauigkeit bei, selbst bei einem erweiterten Kontextfenster von bis zu 32768 Tokens
●
Ideal für Echtzeit-Datenströme, autonome Agenten und Bereitstellung im grossen Massstab

Modalität

Text to Text

Max. Token-Input

32768

Sprachen

Über 100 Sprachen

Funktionsaufruf

Nein

Typ

Rangfolge neu festlegen

Einbettungsmodelle

Die besten Open-Source-Einbettungsmodelle, um Ihre Daten in intelligente Vektoren zu verwandeln. Verbessern Sie die Genauigkeit Ihrer Suche, passen Sie Ihre Empfehlungen individuell an, vereinfachen Sie die Datenanalyse, loten Sie semantische Links aus und klassifizieren Sie Text auf einfache Weise.

Bge Multilingual Gemma2

Der / die / das hochwertigste

Kostenlos starten

API-Dokumentation konsultieren

●
Das leistungsstärkste Open-Source-Einbettungsmodell des Marktes
●
Der Massstab für semantische Suchaufgaben und Augmented Search (ASS)
●
Ideal für die fortgeschrittene Nutzung von Einbettungsvektoren in verschiedenen Anwendungsfällen
●
Aussergewöhnliche Leistung unabhängig von der Sprache des Textes (100+ Sprachen)

Max. Token-Input

8192

Einstellungen

9.2 B

Abmessungen

3584

Sprachen

EN, ES, FR, DE, IT...

Typ

Text

Kostenlos starten

API-Dokumentation konsultieren

●
Das leistungsstärkste Open-Source-Einbettungsmodell des Marktes
●
Der Massstab für semantische Suchaufgaben und Augmented Search (ASS)
●
Ideal für die fortgeschrittene Nutzung von Einbettungsvektoren in verschiedenen Anwendungsfällen
●
Aussergewöhnliche Leistung unabhängig von der Sprache des Textes (100+ Sprachen)

Max. Token-Input

8192

Einstellungen

9.2 B

Abmessungen

3584

Sprachen

EN, ES, FR, DE, IT...

Typ

Text

All MiniLM L12 v2

Das beste Preis-Leistungs-Verhältnis

Kostenlos starten

API-Dokumentation konsultieren

●
Dieses Modell ist das Ergebnis einer Gemeinschaftsarbeit auf Grundlage eines von Microsoft veröffentlichten Modells
●
Hervorragendes Preis-Leistungs-Verhältnis: ideal für die Erstellung von Prototypen und einfache Aufgaben mit begrenzten Ressourcen
●
Interessante Leistung für vergleichsweise einfache Aufgaben unabhängig von der Sprache des Textes
●
Extreme Geschwindigkeit zur Indizierung riesiger Datenbanken oder Echtzeitverarbeitung
●
Hohe Energieeffizienz zur Verringerung der Umweltauswirkungen

Max. Token-Input

512

Einstellungen

33 M

Abmessungen

384

Sprachen

EN, ES, FR, DE, IT...

Typ

Text

Kostenlos starten

API-Dokumentation konsultieren

●
Dieses Modell ist das Ergebnis einer Gemeinschaftsarbeit auf Grundlage eines von Microsoft veröffentlichten Modells
●
Hervorragendes Preis-Leistungs-Verhältnis: ideal für die Erstellung von Prototypen und einfache Aufgaben mit begrenzten Ressourcen
●
Interessante Leistung für vergleichsweise einfache Aufgaben unabhängig von der Sprache des Textes
●
Extreme Geschwindigkeit zur Indizierung riesiger Datenbanken oder Echtzeitverarbeitung
●
Hohe Energieeffizienz zur Verringerung der Umweltauswirkungen

Max. Token-Input

512

Einstellungen

33 M

Abmessungen

384

Sprachen

EN, ES, FR, DE, IT...

Typ

Text

Spracherkennung

Die besten Open-Source-KIs, um Audiodateien in Text umzuwandeln oder realistische menschliche Stimmen zu erzeugen.

Whisper V3

Für komplexe Transkriptionen

Kostenlos starten

API-Dokumentation konsultieren

●
Auf über 1 Million Stunden an Daten basierendes Modell
●
Bis zu 20% weniger Transkriptionsfehler im Vergleich zu Whisper V2
●
Bessere Bewältigung von Akzenten, Hintergrundgeräuschen und komplexer Ausdrucksweise (z. B. bei Anrufen oder Videokonferenzen)
●
Verbesserte mehrsprachige Unterstützung und Übersetzung von Transkriptionen in andere Sprachen als Englisch

Maximale Dateigrösse

25 MB

Unterstützte Formate

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Kostenlos starten

API-Dokumentation konsultieren

●
Auf über 1 Million Stunden an Daten basierendes Modell
●
Bis zu 20% weniger Transkriptionsfehler im Vergleich zu Whisper V2
●
Bessere Bewältigung von Akzenten, Hintergrundgeräuschen und komplexer Ausdrucksweise (z. B. bei Anrufen oder Videokonferenzen)
●
Verbesserte mehrsprachige Unterstützung und Übersetzung von Transkriptionen in andere Sprachen als Englisch

Maximale Dateigrösse

25 MB

Unterstützte Formate

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Bildgenerierung und -bearbeitung

Die besten Open-Source-Alternativen zu Midjourney, Microsoft Copilot Designer oder Gemini, um Bilder zu generieren, zusammenzuführen oder zu interpretieren.

Photomaker V2

Ideal für Bildgenerierung

Kostenlos starten

API-Dokumentation konsultieren

●
Die beste Kombination aus Qualität und Geschwindigkeit bei der Bildgenerierung durch eine generative KI
●
Schnelle Generierung fotorealistischer Bilder aus Prompts in 1, 2, 4 oder 8 Schritten
●
Funktioniert durch Destillation, was die Energieeffizienz erhöht und hervorragende Qualität garantiert
●
Optimiert für Englisch, mit begrenzten Kenntnissen in anderen Sprachen (FR, DE, ES, IT usw.)

Max. Token-Input

Max. Bild-Output

Sprachen

Maximale Auflösung

1024x1024, 1792x1024, 1024x1792

Kostenlos starten

API-Dokumentation konsultieren

●
Die beste Kombination aus Qualität und Geschwindigkeit bei der Bildgenerierung durch eine generative KI
●
Schnelle Generierung fotorealistischer Bilder aus Prompts in 1, 2, 4 oder 8 Schritten
●
Funktioniert durch Destillation, was die Energieeffizienz erhöht und hervorragende Qualität garantiert
●
Optimiert für Englisch, mit begrenzten Kenntnissen in anderen Sprachen (FR, DE, ES, IT usw.)

Max. Token-Input

Max. Bild-Output

Sprachen

Maximale Auflösung

1024x1024, 1792x1024, 1024x1792

Flux schnell

Ideal zum Bearbeiten und Zusammenführen von Personenporträts

Kostenlos starten

API-Dokumentation konsultieren

●
Erstellen von Fotos in mehreren Stilen aus einem oder mehreren Profilfotos
●
Leistungsstark und flexibel: Rekontextualisierung, Kolorierung, Alters- und Geschlechtswechsel, Mischung von Identitäten usw.

Max. Token-Input

Max. Bild-Input

Max. Bild-Output

Sprachen

Maximale Auflösung

1024x1024, 1792x1024, 1024x1792

Kostenlos starten

API-Dokumentation konsultieren

●
Erstellen von Fotos in mehreren Stilen aus einem oder mehreren Profilfotos
●
Leistungsstark und flexibel: Rekontextualisierung, Kolorierung, Alters- und Geschlechtswechsel, Mischung von Identitäten usw.

Max. Token-Input

Max. Bild-Input

Max. Bild-Output

Sprachen

Maximale Auflösung

1024x1024, 1792x1024, 1024x1792