Les meilleures IA open source à la demande dans un Cloud souverain

Découvrez les meilleures alternatives open source à ChatGPT, Gemini, Midjourney ou Claude pour traiter des données sensibles en parfaite conformité avec le droit européen et suisse.

LLM

Embeddings

Audio

Image

Grands modèles de langage (LLM)

Les meilleures alternatives open source à ChatGPT, Gemini et Microsoft Copilot pour interagir, analyser et générer du contenu avec l’IA.

moonshotai/Kimi-K2.6

moonshotai/Kimi-K2.6

Le plus puissant pour le vibe coding

Beta

  • Multimodal natif : convertit du texte, des images ou des maquettes en code pleinement fonctionnel.

  • Conçu pour le développement à grande échelle : intègre une fenêtre de contexte étendue jusqu’à 256k tokens pour gérer des projets complexes

  • Optimisé pour le vibe coding : expérience rapide, fluide et créative, pensée pour les développeurs et les concepteurs de produits

  • Compatible avec les workflows agentiques : automatise l’analyse, la génération de code et son exécution de bout en bout

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

code

  • Multimodal natif : convertit du texte, des images ou des maquettes en code pleinement fonctionnel.

  • Conçu pour le développement à grande échelle : intègre une fenêtre de contexte étendue jusqu’à 256k tokens pour gérer des projets complexes

  • Optimisé pour le vibe coding : expérience rapide, fluide et créative, pensée pour les développeurs et les concepteurs de produits

  • Compatible avec les workflows agentiques : automatise l’analyse, la génération de code et son exécution de bout en bout

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

code

Apertus-70B-Instruct-2509

Apertus-70B-Instruct-2509

Le plus éthique

Beta

  • Idéal pour les services multilingues, les administrations, et les équipes R&D cherchant un modèle fiable et adaptable

  • Données et méthodes documentées pour une transparence inédite

  • Conforme à l'AI Act et respectueux de la vie privée et de la propriété intellectuelle

  • Une déclinaison 70B aux performances comparables aux leaders actuels du marché

Modalité

Text to Text

Max input tokens

65’536

Langues

100+ langues

Appel de fonctions

Non

Catégorie du modèle

chat_medium

  • Idéal pour les services multilingues, les administrations, et les équipes R&D cherchant un modèle fiable et adaptable

  • Données et méthodes documentées pour une transparence inédite

  • Conforme à l'AI Act et respectueux de la vie privée et de la propriété intellectuelle

  • Une déclinaison 70B aux performances comparables aux leaders actuels du marché

Modalité

Text to Text

Max input tokens

65’536

Langues

100+ langues

Appel de fonctions

Non

Catégorie du modèle

chat_medium

Modèles d’embedding

Les meilleurs modèles open source d’embedding pour transformer vos données en vecteurs intelligents. Améliorez la précision de vos recherches, personnalisez vos recommandations, simplifiez l’analyse des données, explorez des liens sémantiques et classez facilement du texte.

Bge Multilingual Gemma2

Bge Multilingual Gemma2

Le plus qualitatif

  • Le modèle d’embedding open source le plus puissant du marché

  • La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)

  • Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage

  • Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

  • Le modèle d’embedding open source le plus puissant du marché

  • La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)

  • Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage

  • Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

All MiniLM L12 v2

All MiniLM L12 v2

Le meilleur rapport qualité-prix

  • Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft

  • Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées

  • Performances intéressantes pour des tâches relativement simples quelque soit la langue du texte

  • Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel

  • Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

  • Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft

  • Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées

  • Performances intéressantes pour des tâches relativement simples quelque soit la langue du texte

  • Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel

  • Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

Reconnaissance vocale

Les meilleures IA open source pour transcrire des fichiers audio en texte ou générer des voix humaines réalistes.

Whisper V3

Whisper V3

Pour les transcriptions complexes

  • Modèle formé sur plus de 1 million d’heures de données

  • Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2

  • Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)

  • Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

  • Modèle formé sur plus de 1 million d’heures de données

  • Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2

  • Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)

  • Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Génération et traitement d’images

Les meilleures alternatives open source à Midjourney, Microsoft Copilot Designer ou Gemini pour générer, fusionner ou interpréter des images.

Photomaker V2

Photomaker V2

Idéal pour générer des images

  • La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative

  • Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts

  • Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité

  • Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

  • La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative

  • Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts

  • Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité

  • Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Flux schnell

Flux schnell

Idéal pour modifier et fusionner des portraits de personnes

  • Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil

  • Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

77

Max input image

6

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

  • Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil

  • Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

77

Max input image

6

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792