As melhores IAs de código aberto, disponíveis sob demanda em uma nuvem soberana

Descubra as melhores alternativas de código aberto para ChatGPT, Gemini, Midjourney ou Claude, para processar dados confidenciais em total conformidade com a legislação europeia e suíça.

LLM↓

Incorporação↓

Áudio↓

Imagem↓

Modelos de linguagem de grande porte (LLM)

As melhores alternativas de código aberto ao ChatGPT, Gemini e Microsoft Copilot para interagir, analisar e gerar conteúdo com IA.

moonshotai/Kimi-K2.6

O mais potente para vibe coding

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.
●
Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos
●
Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos
●
Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

code

Comece gratuitamente

Consulte a documentação da API

●
Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.
●
Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos
●
Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos
●
Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

code

Qwen/Qwen3.5-397B-A17B-FP8

O mais potente

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura MoE de ponta concebida para tarefas de extrema complexidade, oferecendo uma precisão inigualável no raciocínio científico, no planeamento em várias etapas e na execução de ferramentas.
●
Beneficia de uma base de conhecimento global consideravelmente alargada, permitindo um melhor domínio de conhecimentos gerais abrangentes e a geração de código complexo.
●
Supera os modelos anteriores em testes de desempenho rigorosos.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura MoE de ponta concebida para tarefas de extrema complexidade, oferecendo uma precisão inigualável no raciocínio científico, no planeamento em várias etapas e na execução de ferramentas.
●
Beneficia de uma base de conhecimento global consideravelmente alargada, permitindo um melhor domínio de conhecimentos gerais abrangentes e a geração de código complexo.
●
Supera os modelos anteriores em testes de desempenho rigorosos.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

Qwen/Qwen3.5-122B-A10B-FP8

O mais eficiente

Comece gratuitamente

Consulte a documentação da API

●
Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.
●
Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.
●
Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

Comece gratuitamente

Consulte a documentação da API

●
Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.
●
Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.
●
Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

mistralai/Mistral-Small-4-119B-2603

O mais eficaz para a aprendizagem e o raciocínio

Comece gratuitamente

Consulte a documentação da API

●
Modelo versátil capaz de alternar facilmente entre instrução geral e raciocínio complexo.
●
Destinado a fluxos de trabalho agênicos avançados e a aplicações empresariais que exigem a máxima fiabilidade e consistência.
●
Supera largamente o Mistral Small 3 em termos de latência e de taxas de resposta às consultas.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

chat_large

Comece gratuitamente

Consulte a documentação da API

●
Modelo versátil capaz de alternar facilmente entre instrução geral e raciocínio complexo.
●
Destinado a fluxos de trabalho agênicos avançados e a aplicações empresariais que exigem a máxima fiabilidade e consistência.
●
Supera largamente o Mistral Small 3 em termos de latência e de taxas de resposta às consultas.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

chat_large

swiss-ai/Apertus-v1.5-70B

O mais ético

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Ideal para administrações públicas, setores regulamentados e investigação que exigem um rigoroso cumprimento das normas éticas.
●
Total transparência quanto aos pesos e aos dados de treino, com o respeito rigoroso pelo consentimento dos titulares dos dados e pela privacidade.
●
Compreende e analisa de forma nativa o texto, as imagens e os ficheiros de áudio, permitindo interações mais ricas e intuitivas.

Modalidade

Image-Audio-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_medium

Comece gratuitamente

Consulte a documentação da API

●
Ideal para administrações públicas, setores regulamentados e investigação que exigem um rigoroso cumprimento das normas éticas.
●
Total transparência quanto aos pesos e aos dados de treino, com o respeito rigoroso pelo consentimento dos titulares dos dados e pela privacidade.
●
Compreende e analisa de forma nativa o texto, as imagens e os ficheiros de áudio, permitindo interações mais ricas e intuitivas.

Modalidade

Image-Audio-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_medium

google/gemma-4-31B-it

O equilíbrio perfeito

Comece gratuitamente

Consulte a documentação da API

●
O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.
●
Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.
●
Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.

Modalidade

Texto para texto (otimizado para a instrução)

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 140 idiomas

Chamada de função

Sim (nativo e otimizado)

Categoria do modelo

chat_medium

Comece gratuitamente

Consulte a documentação da API

●
O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.
●
Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.
●
Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.

Modalidade

Texto para texto (otimizado para a instrução)

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 140 idiomas

Chamada de função

Sim (nativo e otimizado)

Categoria do modelo

chat_medium

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

A arquitetura mais eficiente

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura híbrida inovadora que oferece a potência de um modelo de grande porte com a velocidade e o custo de um modelo de pequeno porte.
●
Destaca-se no raciocínio lógico, na síntese de dados complexos e na geração de código estruturado, graças ao treino com corpora técnicos de alta qualidade.
●
Ideal para implementações em grande escala que exigem um equilíbrio entre desempenho de ponta e controlo dos custos de infraestrutura.

Modalidade

Text to Text

Número máximo de tokens de entrada

1’000’000

Idiomas

EN, ES, FR, DE, IT, JP

Chamada de função

Sim

Categoria do modelo

chat_medium

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura híbrida inovadora que oferece a potência de um modelo de grande porte com a velocidade e o custo de um modelo de pequeno porte.
●
Destaca-se no raciocínio lógico, na síntese de dados complexos e na geração de código estruturado, graças ao treino com corpora técnicos de alta qualidade.
●
Ideal para implementações em grande escala que exigem um equilíbrio entre desempenho de ponta e controlo dos custos de infraestrutura.

Modalidade

Text to Text

Número máximo de tokens de entrada

1’000’000

Idiomas

EN, ES, FR, DE, IT, JP

Chamada de função

Sim

Categoria do modelo

chat_medium

mistralai/Ministral-3-14B-Instruct-2512

O mais versátil

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.
●
Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.
●
Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

EN, ES, FR, DE, IT...

Chamada de função

Sim

Categoria do modelo

chat_small

Comece gratuitamente

Consulte a documentação da API

●
Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.
●
Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.
●
Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

EN, ES, FR, DE, IT...

Chamada de função

Sim

Categoria do modelo

chat_small

Modelos de reclassificação

As melhores alternativas de código aberto compatíveis para otimizar a relevância dos seus resultados de pesquisa. Aperfeiçoe a classificação dos seus documentos, melhore a precisão dos seus sistemas RAG e garanta uma recuperação de informação mais inteligente e contextual.

BAAI/bge-reranker-v2-m3

O mais versátil

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens
●
Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos
●
Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto

Modalidade

Text to Text

Número máximo de tokens de entrada

8’192

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Comece gratuitamente

Consulte a documentação da API

●
Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens
●
Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos
●
Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto

Modalidade

Text to Text

Número máximo de tokens de entrada

8’192

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Qwen/Qwen3-Reranker-0.6B

O mais eficiente

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo
●
Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens
●
Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala

Modalidade

Text to Text

Número máximo de tokens de entrada

32’768

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Comece gratuitamente

Consulte a documentação da API

●
Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo
●
Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens
●
Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala

Modalidade

Text to Text

Número máximo de tokens de entrada

32’768

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Modelos de incorporação

Os melhores modelos de embedding de código aberto para transformar seus dados em vetores inteligentes. Melhore a precisão das suas pesquisas, personalize suas recomendações, simplifique a análise de dados, explore as relações semânticas e classifique textos facilmente.

Qwen/Qwen3-Embedding-8B

Desempenho superior para aplicações multilingues

Versão Beta

Comece gratuitamente

Consulte a documentação da API

●
Modelo de embedding de última geração otimizado para a compreensão semântica avançada
●
Suporte nativo a mais de 100 idiomas com um desempenho consistente
●
Arquitetura de 8 bits que oferece um equilíbrio ideal entre precisão e eficiência
●
Contexto alargado de 32K tokens para a análise de documentos longos e complexos
●
Dimensões de incorporação configuráveis até 4096, para uma flexibilidade máxima

Número máximo de tokens de entrada

8’192

Configurações

8 B

Dimensões

4096

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Comece gratuitamente

Consulte a documentação da API

●
Modelo de embedding de última geração otimizado para a compreensão semântica avançada
●
Suporte nativo a mais de 100 idiomas com um desempenho consistente
●
Arquitetura de 8 bits que oferece um equilíbrio ideal entre precisão e eficiência
●
Contexto alargado de 32K tokens para a análise de documentos longos e complexos
●
Dimensões de incorporação configuráveis até 4096, para uma flexibilidade máxima

Número máximo de tokens de entrada

8’192

Configurações

8 B

Dimensões

4096

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Bge Multilingual Gemma2

A mais alta qualidade

Comece gratuitamente

Consulte a documentação da API

●
O modelo de embedding de código aberto mais potente do mercado
●
O padrão de referência para tarefas de pesquisa semântica e pesquisa aumentada (RAG)
●
Ideal para o uso avançado de vetores de incorporação em diversos casos de uso
●
Desempenho excepcional, independentemente do idioma do texto (100+ idiomas)

Número máximo de tokens de entrada

8’000

Configurações

9.2 B

Dimensões

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Comece gratuitamente

Consulte a documentação da API

●
O modelo de embedding de código aberto mais potente do mercado
●
O padrão de referência para tarefas de pesquisa semântica e pesquisa aumentada (RAG)
●
Ideal para o uso avançado de vetores de incorporação em diversos casos de uso
●
Desempenho excepcional, independentemente do idioma do texto (100+ idiomas)

Número máximo de tokens de entrada

8’000

Configurações

9.2 B

Dimensões

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

All MiniLM L12 v2

O melhor custo-benefício

Comece gratuitamente

Consulte a documentação da API

●
Este modelo é o resultado de um esforço colaborativo, baseado em um modelo publicado pela Microsoft.
●
Excelente relação custo-benefício, ideal para a criação de protótipos e tarefas simples com recursos limitados
●
Bom desempenho em tarefas relativamente simples, independentemente do idioma do texto
●
Velocidade extrema para indexar enormes bancos de dados ou para processamento em tempo real
●
Alta eficiência energética para reduzir o impacto ambiental

Número máximo de tokens de entrada

128

Configurações

33 M

Dimensões

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Comece gratuitamente

Consulte a documentação da API

●
Este modelo é o resultado de um esforço colaborativo, baseado em um modelo publicado pela Microsoft.
●
Excelente relação custo-benefício, ideal para a criação de protótipos e tarefas simples com recursos limitados
●
Bom desempenho em tarefas relativamente simples, independentemente do idioma do texto
●
Velocidade extrema para indexar enormes bancos de dados ou para processamento em tempo real
●
Alta eficiência energética para reduzir o impacto ambiental

Número máximo de tokens de entrada

128

Configurações

33 M

Dimensões

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Reconhecimento de voz

As melhores IAs de código aberto para transcrever arquivos de áudio em texto ou gerar vozes humanas realistas.

Whisper V3

Para transcrições complexas

Comece gratuitamente

Consulte a documentação da API

●
Modelo treinado com mais de 1 milhão de horas de dados
●
Redução de até 20% nos erros de transcrição em comparação com o Whisper V2
●
Melhor tratamento de sotaques, ruído de fundo e discursos complexos (por exemplo, em chamadas ou videoconferências)
●
Suporte multilíngue aprimorado e tradução de transcrições para idiomas diferentes do inglês

Tamanho máximo de um arquivo

25 MB

Formatos suportados

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Comece gratuitamente

Consulte a documentação da API

●
Modelo treinado com mais de 1 milhão de horas de dados
●
Redução de até 20% nos erros de transcrição em comparação com o Whisper V2
●
Melhor tratamento de sotaques, ruído de fundo e discursos complexos (por exemplo, em chamadas ou videoconferências)
●
Suporte multilíngue aprimorado e tradução de transcrições para idiomas diferentes do inglês

Tamanho máximo de um arquivo

25 MB

Formatos suportados

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Geração e processamento de imagens

As melhores alternativas de código aberto ao Midjourney, Microsoft Copilot Designer ou Gemini para gerar, combinar ou interpretar imagens.

Photomaker V2

Ideal para gerar imagens

Comece gratuitamente

Consulte a documentação da API

●
A melhor combinação de qualidade e velocidade na criação de imagens por meio de IA generativa
●
Geração rápida de imagens fotorrealistas em 1, 2, 4 ou 8 etapas, a partir de prompts
●
Funciona por destilação, o que aumenta a eficiência energética e garante uma excelente qualidade
●
Otimizado para o inglês, com conhecimento limitado de outros idiomas (FR, DE, ES, IT, etc.)

Número máximo de tokens de entrada

Imagem de saída máxima

Idiomas

Resolução máxima

1024x1024, 1792x1024, 1024x1792

Comece gratuitamente

Consulte a documentação da API

●
A melhor combinação de qualidade e velocidade na criação de imagens por meio de IA generativa
●
Geração rápida de imagens fotorrealistas em 1, 2, 4 ou 8 etapas, a partir de prompts
●
Funciona por destilação, o que aumenta a eficiência energética e garante uma excelente qualidade
●
Otimizado para o inglês, com conhecimento limitado de outros idiomas (FR, DE, ES, IT, etc.)

Número máximo de tokens de entrada

Imagem de saída máxima

Idiomas

Resolução máxima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Ideal para editar e combinar retratos de pessoas

Comece gratuitamente

Consulte a documentação da API

●
Crie fotos em diversos estilos a partir de uma ou mais fotos de perfil
●
Poderoso e flexível: recontextualização, colorização, alteração de idade e gênero, combinação de identidades, etc.

Número máximo de tokens de entrada

Tamanho máximo da imagem de entrada

Imagem de saída máxima

Idiomas

Resolução máxima

1024x1024, 1792x1024, 1024x1792

Comece gratuitamente

Consulte a documentação da API

●
Crie fotos em diversos estilos a partir de uma ou mais fotos de perfil
●
Poderoso e flexível: recontextualização, colorização, alteração de idade e gênero, combinação de identidades, etc.

Número máximo de tokens de entrada

Tamanho máximo da imagem de entrada

Imagem de saída máxima

Idiomas

Resolução máxima

1024x1024, 1792x1024, 1024x1792