Die besten Open-Source-KIs auf Abruf in einer unabhängigen Cloud
Entdecken Sie die besten Open-Source-Alternativen zu ChatGPT, Gemini, Midjourney oder Claude, um sensible Daten in vollständigem Einklang mit europäischem und schweizerischem Recht zu verarbeiten.
LLM↓
Einbettungen↓
Audio↓
Image↓
Grosse Sprachmodelle (LLM)
Die besten Open-Source-Alternativen zu ChatGPT, Gemini und Microsoft Copilot für die Interaktion, Analyse und Generierung von Inhalten mit KI.
Mistral-Small-24B-Instruct-2501
Am effektivsten
- ●
Ideal für Anwendungen, die sofortige Antworten und Interaktionen erfordern
- ●
Ausgezeichnet in komplexen Verständnis- und Denkprozessen wie Programmieren
- ●
Unterstützt die wichtigsten Sprachen Europas
Max. Token-Input
32’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/03
Funktionsaufruf
Ja (bald verfügbar)
- ●
Ideal für Anwendungen, die sofortige Antworten und Interaktionen erfordern
- ●
Ausgezeichnet in komplexen Verständnis- und Denkprozessen wie Programmieren
- ●
Unterstützt die wichtigsten Sprachen Europas
Max. Token-Input
32’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/03
Funktionsaufruf
Ja (bald verfügbar)
DeepSeek-R1-distilled-qwen-32B
Am effizientesten und durchdachtesten
- ●
Eine vergleichbare Leistung wie ChatGPT o1 mini, zu einem viel günstigeren Preis
- ●
Ein Modell, das darauf ausgelegt ist, Informationen präzise zu argumentieren, zu analysieren und zu strukturieren.
- ●
Ideal zum Erzeugen, Optimieren und Korrigieren von Code sowie zum Lösen von logischen und mathematischen Problemen
- ●
Optimiert, um Text sinnvoll zu verstehen, umzuformulieren und zu generieren
Max. Token-Input
32’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/03
Funktionsaufruf
Ja (bald verfügbar)
- ●
Eine vergleichbare Leistung wie ChatGPT o1 mini, zu einem viel günstigeren Preis
- ●
Ein Modell, das darauf ausgelegt ist, Informationen präzise zu argumentieren, zu analysieren und zu strukturieren.
- ●
Ideal zum Erzeugen, Optimieren und Korrigieren von Code sowie zum Lösen von logischen und mathematischen Problemen
- ●
Optimiert, um Text sinnvoll zu verstehen, umzuformulieren und zu generieren
Max. Token-Input
32 ’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/03
Funktionsaufruf
Ja (bald verfügbar)
Llama 3.3
Der Leistungsfähigste
- ●
Optimiert für die Verarbeitung grosser Textmengen unter Wahrung der Einheitlichkeit über mehrere Quellen hinweg
- ●
Hervorragende Leistungen bei Aufgaben in den Bereichen Entwicklung, Programmierung und akademische Forschung
- ●
Hohe sprachliche Flexibilität mit mehr als 30 unterstützten Sprachen
- ●
Geeignet für Künstler*innen und Content Creation inkl. Storytelling
Max. Token-Input
128’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/01
Funktionsaufruf
Ja (bald verfügbar)
- ●
Optimiert für die Verarbeitung grosser Textmengen unter Wahrung der Einheitlichkeit über mehrere Quellen hinweg
- ●
Hervorragende Leistungen bei Aufgaben in den Bereichen Entwicklung, Programmierung und akademische Forschung
- ●
Hohe sprachliche Flexibilität mit mehr als 30 unterstützten Sprachen
- ●
Geeignet für Künstler*innen und Content Creation inkl. Storytelling
Max. Token-Input
128’000
Sprachen
EN, ES, FR, DE, IT...
Training
2025/01
Funktionsaufruf
Ja (bald verfügbar)
granite-3.1-8b
Für Unternehmen konzipiert
- ●
Konzipiert für sichere professionelle Anwendungen, die sich an die Bedürfnisse von Unternehmen anpassen lassen
- ●
Optimierte Embeddings zur Verbesserung der semantischen Suche und der Genauigkeit der Ergebnisse in RAG-Systemen
- ●
Leistungsstark, zuverlässig und verantwortungsbewusst im Hinblick auf den Schutz des geistigen Eigentums
- ●
Ideal für komplexe Recherchen, Beantwortung von dokumentenbasierten Fragen, Wissensmanagement usw.
Max. Token-Input
100’000
Sprachen
FR, EN, DE, ES, IT, PT, NL, JA, KO, AN, CS, ZH
Training
2024/07
Funktionsaufruf
Ja (bald verfügbar)
- ●
Konzipiert für sichere professionelle Anwendungen, die sich an die Bedürfnisse von Unternehmen anpassen lassen
- ●
Optimierte Embeddings zur Verbesserung der semantischen Suche und der Genauigkeit der Ergebnisse in RAG-Systemen
- ●
Leistungsstark, zuverlässig und verantwortungsbewusst im Hinblick auf den Schutz des geistigen Eigentums
- ●
Ideal für komplexe Recherchen, Beantwortung von dokumentenbasierten Fragen, Wissensmanagement usw.
Max. Token-Input
100’000
Sprachen
FR, EN, DE, ES, IT, PT, NL, JA, KO, AN, CS, ZH
Training
2024/07
Funktionsaufruf
Ja (bald verfügbar)
Einbettungsmodelle
Die besten Open-Source-Einbettungsmodelle, um Ihre Daten in intelligente Vektoren zu verwandeln. Verbessern Sie die Genauigkeit Ihrer Suche, passen Sie Ihre Empfehlungen individuell an, vereinfachen Sie die Datenanalyse, loten Sie semantische Links aus und klassifizieren Sie Text auf einfache Weise.
Bge Multilingual Gemma2
Der / die / das hochwertigste
- ●
Das leistungsstärkste Open-Source-Einbettungsmodell des Marktes
- ●
Der Massstab für semantische Suchaufgaben und Augmented Search (ASS)
- ●
Ideal für die fortgeschrittene Nutzung von Einbettungsvektoren in verschiedenen Anwendungsfällen
- ●
Aussergewöhnliche Leistung unabhängig von der Sprache des Textes (100+ Sprachen)
Max. Token-Input
8192
Einstellungen
9.2 B
Abmessungen
3584
Sprachen
EN, ES, FR, DE, IT...
Typ
Text
- ●
Das leistungsstärkste Open-Source-Einbettungsmodell des Marktes
- ●
Der Massstab für semantische Suchaufgaben und Augmented Search (ASS)
- ●
Ideal für die fortgeschrittene Nutzung von Einbettungsvektoren in verschiedenen Anwendungsfällen
- ●
Aussergewöhnliche Leistung unabhängig von der Sprache des Textes (100+ Sprachen)
Max. Token-Input
8192
Einstellungen
9.2 B
Abmessungen
3584
Sprachen
EN, ES, FR, DE, IT...
Typ
Text
All MiniLM L12 v2
Das beste Preis-Leistungs-Verhältnis
- ●
Dieses Modell ist das Ergebnis einer Gemeinschaftsarbeit auf Grundlage eines von Microsoft veröffentlichten Modells
- ●
Hervorragendes Preis-Leistungs-Verhältnis: ideal für die Erstellung von Prototypen und einfache Aufgaben mit begrenzten Ressourcen
- ●
Interessante Leistung für vergleichsweise einfache Aufgaben unabhängig von der Sprache des Textes
- ●
Extreme Geschwindigkeit zur Indizierung riesiger Datenbanken oder Echtzeitverarbeitung
- ●
Hohe Energieeffizienz zur Verringerung der Umweltauswirkungen
Max. Token-Input
512
Einstellungen
33 M
Abmessungen
384
Sprachen
EN, ES, FR, DE, IT...
Typ
Text
- ●
Dieses Modell ist das Ergebnis einer Gemeinschaftsarbeit auf Grundlage eines von Microsoft veröffentlichten Modells
- ●
Hervorragendes Preis-Leistungs-Verhältnis: ideal für die Erstellung von Prototypen und einfache Aufgaben mit begrenzten Ressourcen
- ●
Interessante Leistung für vergleichsweise einfache Aufgaben unabhängig von der Sprache des Textes
- ●
Extreme Geschwindigkeit zur Indizierung riesiger Datenbanken oder Echtzeitverarbeitung
- ●
Hohe Energieeffizienz zur Verringerung der Umweltauswirkungen
Max. Token-Input
512
Einstellungen
33 M
Abmessungen
384
Sprachen
EN, ES, FR, DE, IT...
Typ
Text
Spracherkennung
Die besten Open-Source-KIs, um Audiodateien in Text umzuwandeln oder realistische menschliche Stimmen zu erzeugen.
Whisper V3
Für komplexe Transkriptionen
- ●
Auf über 1 Million Stunden an Daten basierendes Modell
- ●
Bis zu 20% weniger Transkriptionsfehler im Vergleich zu Whisper V2
- ●
Bessere Bewältigung von Akzenten, Hintergrundgeräuschen und komplexer Ausdrucksweise (z. B. bei Anrufen oder Videokonferenzen)
- ●
Verbesserte mehrsprachige Unterstützung und Übersetzung von Transkriptionen in andere Sprachen als Englisch
Maximale Dateigrösse
25 MB
Unterstützte Formate
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
- ●
Auf über 1 Million Stunden an Daten basierendes Modell
- ●
Bis zu 20% weniger Transkriptionsfehler im Vergleich zu Whisper V2
- ●
Bessere Bewältigung von Akzenten, Hintergrundgeräuschen und komplexer Ausdrucksweise (z. B. bei Anrufen oder Videokonferenzen)
- ●
Verbesserte mehrsprachige Unterstützung und Übersetzung von Transkriptionen in andere Sprachen als Englisch
Maximale Dateigrösse
25 MB
Unterstützte Formate
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
Whisper V2
Für die meisten Transkriptionen
- ●
Audiotranskription in über 57 Sprachen und Übersetzung des transkribierten Textes ins Englische
- ●
Modell basiert auf 680.000 Stunden an Daten in 98 Sprachen
- ●
Automatische Erkennung der Ausgangssprache
Maximale Dateigrösse
25 MB
Unterstützte Formate
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
- ●
Audiotranskription in über 57 Sprachen und Übersetzung des transkribierten Textes ins Englische
- ●
Modell basiert auf 680.000 Stunden an Daten in 98 Sprachen
- ●
Automatische Erkennung der Ausgangssprache
Maximale Dateigrösse
25 MB
Unterstützte Formate
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
Bildgenerierung und -bearbeitung
Die besten Open-Source-Alternativen zu Midjourney, Microsoft Copilot Designer oder Gemini, um Bilder zu generieren, zusammenzuführen oder zu interpretieren.
Photomaker V2
Ideal für Bildgenerierung
- ●
Die beste Kombination aus Qualität und Geschwindigkeit bei der Bildgenerierung durch eine generative KI
- ●
Schnelle Generierung fotorealistischer Bilder aus Prompts in 1, 2, 4 oder 8 Schritten
- ●
Funktioniert durch Destillation, was die Energieeffizienz erhöht und hervorragende Qualität garantiert
- ●
Optimiert für Englisch, mit begrenzten Kenntnissen in anderen Sprachen (FR, DE, ES, IT usw.)
Max. Token-Input
77
Max. Bild-Output
5
Sprachen
EN
Maximale Auflösung
1024x1024, 1792x1024, 1024x1792
- ●
Die beste Kombination aus Qualität und Geschwindigkeit bei der Bildgenerierung durch eine generative KI
- ●
Schnelle Generierung fotorealistischer Bilder aus Prompts in 1, 2, 4 oder 8 Schritten
- ●
Funktioniert durch Destillation, was die Energieeffizienz erhöht und hervorragende Qualität garantiert
- ●
Optimiert für Englisch, mit begrenzten Kenntnissen in anderen Sprachen (FR, DE, ES, IT usw.)
Max. Token-Input
77
Max. Bild-Output
5
Sprachen
EN
Maximale Auflösung
1024x1024, 1792x1024, 1024x1792
Flux schnell
Ideal zum Bearbeiten und Zusammenführen von Personenporträts
- ●
Erstellen von Fotos in mehreren Stilen aus einem oder mehreren Profilfotos
- ●
Leistungsstark und flexibel: Rekontextualisierung, Kolorierung, Alters- und Geschlechtswechsel, Mischung von Identitäten usw.
Max. Token-Input
77
Max. Bild-Input
6
Max. Bild-Output
5
Sprachen
EN
Maximale Auflösung
1024x1024, 1792x1024, 1024x1792
- ●
Erstellen von Fotos in mehreren Stilen aus einem oder mehreren Profilfotos
- ●
Leistungsstark und flexibel: Rekontextualisierung, Kolorierung, Alters- und Geschlechtswechsel, Mischung von Identitäten usw.
Max. Token-Input
77
Max. Bild-Input
6
Max. Bild-Output
5
Sprachen
EN
Maximale Auflösung
1024x1024, 1792x1024, 1024x1792