Les meilleures IA open source à la demande dans un Cloud souverain

Découvrez les meilleures alternatives open source à ChatGPT, Gemini, Midjourney ou Claude pour traiter des données sensibles en parfaite conformité avec le droit européen et suisse.

LLM↓

Embeddings↓

Audio↓

Image↓

Grands modèles de langage (LLM)

Les meilleures alternatives open source à ChatGPT, Gemini et Microsoft Copilot pour interagir, analyser et générer du contenu avec l’IA.

Qwen/Qwen3.5-122B-A10B-FP8

Le plus efficient

Démarrer gratuitement

Consulter la documentation API

●
Conçu pour les tâches complexes nécessitant une grande fenêtre de contexte et une précision accrue dans le raisonnement logique.
●
Architecture optimisée pour une inférence plus rapide et une empreinte énergétique réduite, libérant d'importantes ressources de calcul.
●
Entraîné sur des millions d'agents et des tâches de complexité croissante pour une adaptabilité robuste au monde réel.

Modalité

Image-Text to Text

Max input tokens

200’000

Langues

100+ langues

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Démarrer gratuitement

Consulter la documentation API

●
Conçu pour les tâches complexes nécessitant une grande fenêtre de contexte et une précision accrue dans le raisonnement logique.
●
Architecture optimisée pour une inférence plus rapide et une empreinte énergétique réduite, libérant d'importantes ressources de calcul.
●
Entraîné sur des millions d'agents et des tâches de complexité croissante pour une adaptabilité robuste au monde réel.

Modalité

Image-Text to Text

Max input tokens

200’000

Langues

100+ langues

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Apertus-70B-Instruct-2509

Le plus éthique

Beta

Démarrer gratuitement

Consulter la documentation API

●
Idéal pour les services multilingues, les administrations, et les équipes R&D cherchant un modèle fiable et adaptable
●
Données et méthodes documentées pour une transparence inédite
●
Conforme à l'AI Act et respectueux de la vie privée et de la propriété intellectuelle
●
Une déclinaison 70B aux performances comparables aux leaders actuels du marché

Modalité

Text to Text

Max input tokens

65’536

Langues

100+ langues

Appel de fonctions

Non

Catégorie du modèle

chat_medium

Démarrer gratuitement

Consulter la documentation API

●
Idéal pour les services multilingues, les administrations, et les équipes R&D cherchant un modèle fiable et adaptable
●
Données et méthodes documentées pour une transparence inédite
●
Conforme à l'AI Act et respectueux de la vie privée et de la propriété intellectuelle
●
Une déclinaison 70B aux performances comparables aux leaders actuels du marché

Modalité

Text to Text

Max input tokens

65’536

Langues

100+ langues

Appel de fonctions

Non

Catégorie du modèle

chat_medium

google/gemma-4-31B-it

L'équilibre parfait

Démarrer gratuitement

Consulter la documentation API

●
Le compromis idéal entre réactivité et puissance, conçu pour exceller dans le raisonnement logique, l'analyse documentaire approfondie et la génération de code fiable.
●
Tire parti d'une architecture de pointe pour offrir une compréhension nuancée des contextes étendus et des instructions complexes.
●
Parfait pour les agents conversationnels avancés et les workflows d'entreprise nécessitant une grande polyvalence sans sacrifier la vitesse d'exécution.

Modalité

Text-to-Text (optimisé pour l'instruction)

Max input tokens

100’000

Langues

140+ langues

Appel de fonctions

Oui (natif et optimisé)

Catégorie du modèle

chat_medium

Démarrer gratuitement

Consulter la documentation API

●
Le compromis idéal entre réactivité et puissance, conçu pour exceller dans le raisonnement logique, l'analyse documentaire approfondie et la génération de code fiable.
●
Tire parti d'une architecture de pointe pour offrir une compréhension nuancée des contextes étendus et des instructions complexes.
●
Parfait pour les agents conversationnels avancés et les workflows d'entreprise nécessitant une grande polyvalence sans sacrifier la vitesse d'exécution.

Modalité

Text-to-Text (optimisé pour l'instruction)

Max input tokens

100’000

Langues

140+ langues

Appel de fonctions

Oui (natif et optimisé)

Catégorie du modèle

chat_medium

moonshotai/Kimi-K2.6

Le plus puissant pour le vibe coding

Beta

Démarrer gratuitement

Consulter la documentation API

●
Multimodal natif : convertit du texte, des images ou des maquettes en code pleinement fonctionnel.
●
Conçu pour le développement à grande échelle : intègre une fenêtre de contexte étendue jusqu’à 256k tokens pour gérer des projets complexes
●
Optimisé pour le vibe coding : expérience rapide, fluide et créative, pensée pour les développeurs et les concepteurs de produits
●
Compatible avec les workflows agentiques : automatise l’analyse, la génération de code et son exécution de bout en bout

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

code

Démarrer gratuitement

Consulter la documentation API

●
Multimodal natif : convertit du texte, des images ou des maquettes en code pleinement fonctionnel.
●
Conçu pour le développement à grande échelle : intègre une fenêtre de contexte étendue jusqu’à 256k tokens pour gérer des projets complexes
●
Optimisé pour le vibe coding : expérience rapide, fluide et créative, pensée pour les développeurs et les concepteurs de produits
●
Compatible avec les workflows agentiques : automatise l’analyse, la génération de code et son exécution de bout en bout

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

code

mistralai/Ministral-3-14B-Instruct-2512

Le plus polyvalent

Beta

Démarrer gratuitement

Consulter la documentation API

●
Optimisé pour un déploiement rapide et économique, idéal pour les agents conversationnels, l'analyse de documents et les tâches spécialisées.
●
Offre des performances comparables à Mistral Small 3.2 24B avec un minimum de ressources.
●
Capable d'analyser des images et de fournir des informations basées sur le contenu visuel, en plus du texte.

Modalité

Image-Text to Text

Max input tokens

100’000

Langues

EN, ES, FR, DE, IT...

Appel de fonctions

Oui

Catégorie du modèle

chat_small

Démarrer gratuitement

Consulter la documentation API

●
Optimisé pour un déploiement rapide et économique, idéal pour les agents conversationnels, l'analyse de documents et les tâches spécialisées.
●
Offre des performances comparables à Mistral Small 3.2 24B avec un minimum de ressources.
●
Capable d'analyser des images et de fournir des informations basées sur le contenu visuel, en plus du texte.

Modalité

Image-Text to Text

Max input tokens

100’000

Langues

EN, ES, FR, DE, IT...

Appel de fonctions

Oui

Catégorie du modèle

chat_small

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

L'architecture la plus efficace

Beta

Démarrer gratuitement

Consulter la documentation API

●
Architecture hybride innovante délivrant la puissance d’un grand modèle avec la vitesse et le coût d’un petit modèle.
●
Excelle dans le raisonnement logique, la synthèse de données complexes et la génération de code structuré grâce à un entraînement sur des corpus techniques de haute qualité.
●
Idéal pour les déploiements à grande échelle nécessitant un équilibre entre performance de pointe et maîtrise des coûts d’infrastructure.

Modalité

Text to Text

Max input tokens

1’000’000

Langues

EN, ES, FR, DE, IT, JP

Appel de fonctions

Oui

Catégorie du modèle

chat_medium

Démarrer gratuitement

Consulter la documentation API

●
Architecture hybride innovante délivrant la puissance d’un grand modèle avec la vitesse et le coût d’un petit modèle.
●
Excelle dans le raisonnement logique, la synthèse de données complexes et la génération de code structuré grâce à un entraînement sur des corpus techniques de haute qualité.
●
Idéal pour les déploiements à grande échelle nécessitant un équilibre entre performance de pointe et maîtrise des coûts d’infrastructure.

Modalité

Text to Text

Max input tokens

1’000’000

Langues

EN, ES, FR, DE, IT, JP

Appel de fonctions

Oui

Catégorie du modèle

chat_medium

mistralai/Mistral-Small-4-119B-2603

Le plus efficace pour l'instruction et le raisonnement

Démarrer gratuitement

Consulter la documentation API

●
Modèle polyvalent capable de basculer facilement entre instruction générale et raisonnement complexe.
●
Destiné aux workflows agentiques avancés et aux applications d'entreprise nécessitant une fiabilité et une cohérence maximales.
●
Surpasse largement Mistral Small 3 en termes de latence et de débits de requêtes.

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Démarrer gratuitement

Consulter la documentation API

●
Modèle polyvalent capable de basculer facilement entre instruction générale et raisonnement complexe.
●
Destiné aux workflows agentiques avancés et aux applications d'entreprise nécessitant une fiabilité et une cohérence maximales.
●
Surpasse largement Mistral Small 3 en termes de latence et de débits de requêtes.

Modalité

Image-Text to Text

Max input tokens

256’000

Langues

Multilingue

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Qwen/Qwen3.5-397B-A17B-FP8

Le plus puissant

Beta

Démarrer gratuitement

Consulter la documentation API

●
Architecture MoE de pointe conçue pour les tâches d'une complexité extrême, offrant une précision inégalée dans le raisonnement scientifique, la planification multi-étapes et l'exécution d'outils.
●
Bénéficie d'une base de connaissances mondiale considérablement élargie pour une meilleure maîtrise des savoirs généraux étendus et de la génération de code complexe.
●
Surpasse les modèles précédents sur les benchmarks d'intelligence rigoureuse.

Modalité

Image-Text to Text

Max input tokens

200’000

Langues

100+ langues

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Démarrer gratuitement

Consulter la documentation API

●
Architecture MoE de pointe conçue pour les tâches d'une complexité extrême, offrant une précision inégalée dans le raisonnement scientifique, la planification multi-étapes et l'exécution d'outils.
●
Bénéficie d'une base de connaissances mondiale considérablement élargie pour une meilleure maîtrise des savoirs généraux étendus et de la génération de code complexe.
●
Surpasse les modèles précédents sur les benchmarks d'intelligence rigoureuse.

Modalité

Image-Text to Text

Max input tokens

200’000

Langues

100+ langues

Appel de fonctions

Oui

Catégorie du modèle

chat_large

Modèles de re-ranking

Les meilleures alternatives open source compatibles pour optimiser la pertinence de vos résultats de recherche. Affinez le classement de vos documents, améliorez la précision de vos systèmes RAG et garantissez une récupération d'information plus intelligente et contextuelle.

BAAI/bge-reranker-v2-m3

Le plus polyvalent

Beta

Démarrer gratuitement

Consulter la documentation API

●
Modèle multilingue expert capable de traiter simultanément des requêtes courtes, des paragraphes et des documents longs jusqu'à 8192 tokens
●
Combine l'analyse lexicale (mots-clés) et sémantique (sens) pour une précision de classement inégalée sur des corpus complexes
●
Solution idéale pour les moteurs de recherche d'entreprise et les applications RAG exigeant une compréhension fine du contexte

Modalité

Text to Text

Max input tokens

8192

Langues

100+ langues

Appel de fonctions

Non

Type

rerank

Démarrer gratuitement

Consulter la documentation API

●
Modèle multilingue expert capable de traiter simultanément des requêtes courtes, des paragraphes et des documents longs jusqu'à 8192 tokens
●
Combine l'analyse lexicale (mots-clés) et sémantique (sens) pour une précision de classement inégalée sur des corpus complexes
●
Solution idéale pour les moteurs de recherche d'entreprise et les applications RAG exigeant une compréhension fine du contexte

Modalité

Text to Text

Max input tokens

8192

Langues

100+ langues

Appel de fonctions

Non

Type

rerank

Qwen/Qwen3-Reranker-0.6B

Le plus efficace

Beta

Démarrer gratuitement

Consulter la documentation API

●
Architecture ultra-légère (0.6B paramètres) conçue pour une inférence à très faible latence et une empreinte énergétique minimale
●
Maintient une haute précision de pertinence même avec une fenêtre de contexte étendue jusqu'à 32768 tokens
●
Parfait pour les flux de données en temps réel, les agents autonomes et les déploiements à grande échelle

Modalité

Text to Text

Max input tokens

32768

Langues

100+ langues

Appel de fonctions

Non

Type

rerank

Démarrer gratuitement

Consulter la documentation API

●
Architecture ultra-légère (0.6B paramètres) conçue pour une inférence à très faible latence et une empreinte énergétique minimale
●
Maintient une haute précision de pertinence même avec une fenêtre de contexte étendue jusqu'à 32768 tokens
●
Parfait pour les flux de données en temps réel, les agents autonomes et les déploiements à grande échelle

Modalité

Text to Text

Max input tokens

32768

Langues

100+ langues

Appel de fonctions

Non

Type

rerank

Modèles d’embedding

Les meilleurs modèles open source d’embedding pour transformer vos données en vecteurs intelligents. Améliorez la précision de vos recherches, personnalisez vos recommandations, simplifiez l’analyse des données, explorez des liens sémantiques et classez facilement du texte.

Bge Multilingual Gemma2

Le plus qualitatif

Démarrer gratuitement

Consulter la documentation API

●
Le modèle d’embedding open source le plus puissant du marché
●
La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)
●
Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage
●
Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

Démarrer gratuitement

Consulter la documentation API

●
Le modèle d’embedding open source le plus puissant du marché
●
La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)
●
Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage
●
Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

All MiniLM L12 v2

Le meilleur rapport qualité-prix

Démarrer gratuitement

Consulter la documentation API

●
Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft
●
Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées
●
Performances intéressantes pour des tâches relativement simples quelque soit la langue du texte
●
Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel
●
Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

Démarrer gratuitement

Consulter la documentation API

●
Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft
●
Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées
●
Performances intéressantes pour des tâches relativement simples quelque soit la langue du texte
●
Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel
●
Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

Reconnaissance vocale

Les meilleures IA open source pour transcrire des fichiers audio en texte ou générer des voix humaines réalistes.

Whisper V3

Pour les transcriptions complexes

Démarrer gratuitement

Consulter la documentation API

●
Modèle formé sur plus de 1 million d’heures de données
●
Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2
●
Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)
●
Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Démarrer gratuitement

Consulter la documentation API

●
Modèle formé sur plus de 1 million d’heures de données
●
Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2
●
Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)
●
Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Génération et traitement d’images

Les meilleures alternatives open source à Midjourney, Microsoft Copilot Designer ou Gemini pour générer, fusionner ou interpréter des images.

Photomaker V2

Idéal pour générer des images

Démarrer gratuitement

Consulter la documentation API

●
La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative
●
Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts
●
Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité
●
Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

Max output image

Langues

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Démarrer gratuitement

Consulter la documentation API

●
La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative
●
Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts
●
Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité
●
Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

Max output image

Langues

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Flux schnell

Idéal pour modifier et fusionner des portraits de personnes

Démarrer gratuitement

Consulter la documentation API

●
Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil
●
Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

Max input image

Max output image

Langues

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Démarrer gratuitement

Consulter la documentation API

●
Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil
●
Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

Max input image

Max output image

Langues

Résolution maximale

1024x1024, 1792x1024, 1024x1792