Les meilleures IA open source à la demande dans un Cloud souverain

Découvrez les meilleures alternatives open source à ChatGPT, Gemini, Midjourney ou Claude pour traiter des données sensibles en parfaite conformité avec le droit européen et suisse.

LLM

Embeddings

Audio

Image

Grands modèles de langage (LLM)

Les meilleures alternatives open source à ChatGPT, Gemini et Microsoft Copilot pour interagir, analyser et générer du contenu avec l’IA.

LLama 3.2

LLama 3.2

Le plus puissant

  • Optimisé pour traiter de grandes quantités de texte en veillant à la cohérence entre plusieurs sources

  • Excelle dans les tâches liées au développement, à la programmation et à la recherche académique

  • Grande flexibilité multilingue avec plus de 30 langues supportées

  • Adapté pour les artistes et la création de contenu, y compris le storytelling

Max input tokens

100’000

Max output token

8’000

Langues

EN, ES, FR, DE, IT...

Entrainement

2024/07

Appel de fonctions

Non

  • Optimisé pour traiter de grandes quantités de texte en veillant à la cohérence entre plusieurs sources

  • Excelle dans les tâches liées au développement, à la programmation et à la recherche académique

  • Grande flexibilité multilingue avec plus de 30 langues supportées

  • Adapté pour les artistes et la création de contenu, y compris le storytelling

Max input tokens

100’000

Max output token

8’000

Langues

EN, ES, FR, DE, IT...

Entrainement

2024/07

Appel de fonctions

Non

Mixtral 8x22B

Mixtral 8x22B

Le plus polyvalent

  • Corpus d’entraînement plus important que Mixtral 8x7B pour des tâches plus complexes

  • Capable d’analyser des données non structurées pour aider à la prise de décision et générer du contenu

  • Gestion des subtilités conversationnelles pour alimenter des discussions complexes

  • Optimisé pour l’exploration logique (combinaison d’informations complexes) et la génération d’idées (scénarios, etc.)

Max input tokens

23’000

Max output token

23’000

Langues

FR, EN, DE, ES, IT

Entrainement

2024/07

Appel de fonctions

Oui

  • Corpus d’entraînement plus important que Mixtral 8x7B pour des tâches plus complexes

  • Capable d’analyser des données non structurées pour aider à la prise de décision et générer du contenu

  • Gestion des subtilités conversationnelles pour alimenter des discussions complexes

  • Optimisé pour l’exploration logique (combinaison d’informations complexes) et la génération d’idées (scénarios, etc.)

Max input tokens

23’000

Max output token

23’000

Langues

FR, EN, DE, ES, IT

Entrainement

2024/07

Appel de fonctions

Oui

Mixtral 8x7B

Mixtral 8x7B

Le plus rapide et économique

  • Économique et très rapide pour un grand nombre de tâches courantes

  • Idéal pour résumer, modérer du contenu, calculer, coder et extraire des données de sources non structurées

  • Adapté pour interpréter en temps réel des données et pour faire des raisonnements logiques

  • Facile à ajuster et à contextualiser pour limiter les résultats indésirables

Max input tokens

30’000

Max output token

30’000

Langues

EN, ES, FR, DE, IT...

Entrainement

2024/07

Appel de fonctions

Non

  • Économique et très rapide pour un grand nombre de tâches courantes

  • Idéal pour résumer, modérer du contenu, calculer, coder et extraire des données de sources non structurées

  • Adapté pour interpréter en temps réel des données et pour faire des raisonnements logiques

  • Facile à ajuster et à contextualiser pour limiter les résultats indésirables

Max input tokens

30’000

Max output token

30’000

Langues

EN, ES, FR, DE, IT...

Entrainement

2024/07

Appel de fonctions

Non

Modèles d’embedding

Les meilleurs modèles open source d’embedding pour transformer vos données en vecteurs intelligents. Améliorez la précision de vos recherches, personnalisez vos recommandations, simplifiez l’analyse des données, explorez des liens sémantiques et classez facilement du texte.

Bge Multilingual Gemma2

Bge Multilingual Gemma2

Le plus qualitatif

  • Le modèle d’embedding open source le plus puissant du marché

  • La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)

  • Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage

  • Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

  • Le modèle d’embedding open source le plus puissant du marché

  • La référence pour les tâches de recherche sémantique et de recherche augmentée (RAG)

  • Idéal pour une utilisation avancée des vecteurs d’embedding dans divers cas d’usage

  • Des performances exceptionnelles, quelle que soit la langue du texte (100 langues)

Max input tokens

8192

Paramètres

9.2 B

Dimensions

3584

Langues

EN, ES, FR, DE, IT...

Type

Texte

All MiniLM L12 v2

All MiniLM L12 v2

Le meilleur rapport qualité-prix

  • Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft

  • Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées

  • Performances intéressantes pour des tâches relativement simple quelque soit la langue du texte

  • Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel

  • Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

  • Ce modèle est le résultat d’un travail communautaire sur la base d’un modèle publié par Microsoft

  • Excellent rapport qualité-prix, idéal pour le prototypage et les tâches simples avec des ressources limitées

  • Performances intéressantes pour des tâches relativement simple quelque soit la langue du texte

  • Rapidité extrême pour indexer d’énormes bases de données ou des traitements en temps réel

  • Grande efficience énergétique pour réduire son impact environnemental

Max input tokens

512

Paramètres

33 M

Dimensions

384

Langues

EN, ES, FR, DE, IT...

Type

Texte

Reconnaissance vocale

Les meilleures IA open source pour transcrire des fichiers audio en texte ou générer des voix humaines réalistes.

Whisper V3

Whisper V3

Pour les transcriptions complexes

  • Modèle formé sur plus de 1 million d’heures de données

  • Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2

  • Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)

  • Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

  • Modèle formé sur plus de 1 million d’heures de données

  • Réduction des erreurs de transcriptions jusqu’à 20 % par rapport à Whisper V2

  • Meilleure gestion des accents, du bruit de fond et des discours complexes (ex. : appels ou visioconférences)

  • Support multilingue amélioré et traduction des transcriptions dans d’autres langues que l’anglais

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Whisper V2

Whisper V2

Pour la plupart des transcriptions

  • Transcription audio dans plus de 57 langues et traduction du texte transcrit en anglais

  • Modèle formé sur 680 000 heures de données dans 98 langues

  • Identification automatique de la langue d’origine

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

  • Transcription audio dans plus de 57 langues et traduction du texte transcrit en anglais

  • Modèle formé sur 680 000 heures de données dans 98 langues

  • Identification automatique de la langue d’origine

Taille maximum d’un fichier

25 Mo

Formats pris en charge

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Génération et traitement d’images

Les meilleures alternatives open source à Midjourney, Microsoft Copilot Designer ou Gemini pour générer, fusionner ou interpréter des images.

SDXL-Lightning

SDXL-Lightning

Idéal pour générer des images

  • La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative

  • Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts

  • Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité

  • Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

  • La meilleure combinaison de qualité et de vitesse dans la création d’images par IA générative

  • Génération rapide d’images photoréalistes en 1, 2, 4 ou 8 étapes à partir de prompts

  • Fonctionne par distillation, ce qui augmente l’efficacité énergétique en garantissant une excellente qualité

  • Optimisé pour l’anglais, avec des connaissances limitées dans les autres langues (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Photomaker V2

Photomaker V2

Idéal pour modifier et fusionner des portraits de personnes

  • Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil

  • Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

77

Max input image

6

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

  • Création de photos dans plusieurs styles à partir d'une ou plusieurs photos de profil

  • Puissant et flexible : recontextualisation, colorisation, changement d'âge et de genre, mélange d'identités...

Max input tokens

77

Max input image

6

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

Flux schnell

Flux schnell

Pour générer des images en haute qualité

  • Qualité d’image exceptionnelle pouvant surpasser DALL·E 3 et MidJourney dans certains domaines

  • Fidélité aux prompts et interprétation précise de scènes complexes

  • Grande diversité des styles

Max input tokens

76

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792

  • Qualité d’image exceptionnelle pouvant surpasser DALL·E 3 et MidJourney dans certains domaines

  • Fidélité aux prompts et interprétation précise de scènes complexes

  • Grande diversité des styles

Max input tokens

76

Max output image

5

Langues

EN

Résolution maximale

1024x1024, 1792x1024, 1024x1792