As melhores IAs de código aberto, disponíveis sob demanda em uma nuvem soberana

Descubra as melhores alternativas de código aberto para ChatGPT, Gemini, Midjourney ou Claude, para processar dados confidenciais em total conformidade com a legislação europeia e suíça.

LLM

Incorporação

Áudio

Imagem

Modelos de linguagem de grande porte (LLM)

As melhores alternativas de código aberto ao ChatGPT, Gemini e Microsoft Copilot para interagir, analisar e gerar conteúdo com IA.

Qwen/Qwen3.5-122B-A10B-FP8

Qwen/Qwen3.5-122B-A10B-FP8

O mais potente

Versão Beta

  • Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.

  • Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.

  • Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

  • Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.

  • Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.

  • Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

200’000

Idiomas

Mais de 100 idiomas

Chamada de função

Sim

Categoria do modelo

chat_large

Apertus-70B-Instruct-2509

Apertus-70B-Instruct-2509

O mais ético

Versão Beta

  • Ideal para serviços multilíngues, órgãos governamentais e equipes de P&D que procuram um modelo confiável e adaptável

  • Dados e métodos documentados para uma transparência sem precedentes

  • Em conformidade com a Lei de IA e respeitando a privacidade e a propriedade intelectual

  • Uma versão 70B com desempenho comparável aos líderes atuais do mercado

Modalidade

Text to Text

Número máximo de tokens de entrada

65’536

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Categoria do modelo

chat_medium

  • Ideal para serviços multilíngues, órgãos governamentais e equipes de P&D que procuram um modelo confiável e adaptável

  • Dados e métodos documentados para uma transparência sem precedentes

  • Em conformidade com a Lei de IA e respeitando a privacidade e a propriedade intelectual

  • Uma versão 70B com desempenho comparável aos líderes atuais do mercado

Modalidade

Text to Text

Número máximo de tokens de entrada

65’536

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Categoria do modelo

chat_medium

google/gemma-4-31B-it

google/gemma-4-31B-it

O equilíbrio perfeito

Versão Beta

  • O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.

  • Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.

  • Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.

Modalidade

Texto para texto (otimizado para a instrução)

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 140 idiomas

Chamada de função

Sim (nativo e otimizado)

Categoria do modelo

chat_medium

  • O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.

  • Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.

  • Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.

Modalidade

Texto para texto (otimizado para a instrução)

Número máximo de tokens de entrada

100’000

Idiomas

Mais de 140 idiomas

Chamada de função

Sim (nativo e otimizado)

Categoria do modelo

chat_medium

moonshotai/Kimi-K2.6

moonshotai/Kimi-K2.6

O mais potente para vibe coding

Versão Beta

  • Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.

  • Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos

  • Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos

  • Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

code

  • Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.

  • Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos

  • Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos

  • Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

256’000

Idiomas

Multilíngue

Chamada de função

Sim

Categoria do modelo

code

mistralai/Ministral-3-14B-Instruct-2512

mistralai/Ministral-3-14B-Instruct-2512

O mais versátil

Versão Beta

  • Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.

  • Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.

  • Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

EN, ES, FR, DE, IT...

Chamada de função

Sim

Categoria do modelo

chat_small

  • Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.

  • Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.

  • Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.

Modalidade

Image-Text to Text

Número máximo de tokens de entrada

100’000

Idiomas

EN, ES, FR, DE, IT...

Chamada de função

Sim

Categoria do modelo

chat_small

Modelos de reclassificação

As melhores alternativas de código aberto compatíveis para otimizar a relevância dos seus resultados de pesquisa. Aperfeiçoe a classificação dos seus documentos, melhore a precisão dos seus sistemas RAG e garanta uma recuperação de informação mais inteligente e contextual.

BAAI/bge-reranker-v2-m3

BAAI/bge-reranker-v2-m3

O mais versátil

  • Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens

  • Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos

  • Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto

Modalidade

Text to Text

Número máximo de tokens de entrada

8192

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

  • Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens

  • Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos

  • Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto

Modalidade

Text to Text

Número máximo de tokens de entrada

8192

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Qwen/Qwen3-Reranker-0.6B

Qwen/Qwen3-Reranker-0.6B

O mais eficiente

  • Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo

  • Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens

  • Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala

Modalidade

Text to Text

Número máximo de tokens de entrada

32768

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

  • Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo

  • Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens

  • Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala

Modalidade

Text to Text

Número máximo de tokens de entrada

32768

Idiomas

Mais de 100 idiomas

Chamada de função

Não

Tipo

Classificação

Modelos de incorporação

Os melhores modelos de embedding de código aberto para transformar seus dados em vetores inteligentes. Melhore a precisão das suas pesquisas, personalize suas recomendações, simplifique a análise de dados, explore as relações semânticas e classifique textos facilmente.

Bge Multilingual Gemma2

Bge Multilingual Gemma2

A mais alta qualidade

  • O modelo de embedding de código aberto mais potente do mercado

  • O padrão de referência para tarefas de pesquisa semântica e pesquisa aumentada (RAG)

  • Ideal para o uso avançado de vetores de incorporação em diversos casos de uso

  • Desempenho excepcional, independentemente do idioma do texto (100+ idiomas)

Número máximo de tokens de entrada

8192

Configurações

9.2 B

Dimensões

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

  • O modelo de embedding de código aberto mais potente do mercado

  • O padrão de referência para tarefas de pesquisa semântica e pesquisa aumentada (RAG)

  • Ideal para o uso avançado de vetores de incorporação em diversos casos de uso

  • Desempenho excepcional, independentemente do idioma do texto (100+ idiomas)

Número máximo de tokens de entrada

8192

Configurações

9.2 B

Dimensões

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

All MiniLM L12 v2

All MiniLM L12 v2

O melhor custo-benefício

  • Este modelo é o resultado de um esforço colaborativo, baseado em um modelo publicado pela Microsoft.

  • Excelente relação custo-benefício, ideal para a criação de protótipos e tarefas simples com recursos limitados

  • Bom desempenho em tarefas relativamente simples, independentemente do idioma do texto

  • Velocidade extrema para indexar enormes bancos de dados ou para processamento em tempo real

  • Alta eficiência energética para reduzir o impacto ambiental

Número máximo de tokens de entrada

512

Configurações

33 M

Dimensões

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

  • Este modelo é o resultado de um esforço colaborativo, baseado em um modelo publicado pela Microsoft.

  • Excelente relação custo-benefício, ideal para a criação de protótipos e tarefas simples com recursos limitados

  • Bom desempenho em tarefas relativamente simples, independentemente do idioma do texto

  • Velocidade extrema para indexar enormes bancos de dados ou para processamento em tempo real

  • Alta eficiência energética para reduzir o impacto ambiental

Número máximo de tokens de entrada

512

Configurações

33 M

Dimensões

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Reconhecimento de voz

As melhores IAs de código aberto para transcrever arquivos de áudio em texto ou gerar vozes humanas realistas.

Whisper V3

Whisper V3

Para transcrições complexas

  • Modelo treinado com mais de 1 milhão de horas de dados

  • Redução de até 20% nos erros de transcrição em comparação com o Whisper V2

  • Melhor tratamento de sotaques, ruído de fundo e discursos complexos (por exemplo, em chamadas ou videoconferências)

  • Suporte multilíngue aprimorado e tradução de transcrições para idiomas diferentes do inglês

Tamanho máximo de um arquivo

25 MB

Formatos suportados

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

  • Modelo treinado com mais de 1 milhão de horas de dados

  • Redução de até 20% nos erros de transcrição em comparação com o Whisper V2

  • Melhor tratamento de sotaques, ruído de fundo e discursos complexos (por exemplo, em chamadas ou videoconferências)

  • Suporte multilíngue aprimorado e tradução de transcrições para idiomas diferentes do inglês

Tamanho máximo de um arquivo

25 MB

Formatos suportados

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Geração e processamento de imagens

As melhores alternativas de código aberto ao Midjourney, Microsoft Copilot Designer ou Gemini para gerar, combinar ou interpretar imagens.

Photomaker V2

Photomaker V2

Ideal para gerar imagens

  • A melhor combinação de qualidade e velocidade na criação de imagens por meio de IA generativa

  • Geração rápida de imagens fotorrealistas em 1, 2, 4 ou 8 etapas, a partir de prompts

  • Funciona por destilação, o que aumenta a eficiência energética e garante uma excelente qualidade

  • Otimizado para o inglês, com conhecimento limitado de outros idiomas (FR, DE, ES, IT, etc.)

Número máximo de tokens de entrada

77

Imagem de saída máxima

5

Idiomas

EN

Resolução máxima

1024x1024, 1792x1024, 1024x1792

  • A melhor combinação de qualidade e velocidade na criação de imagens por meio de IA generativa

  • Geração rápida de imagens fotorrealistas em 1, 2, 4 ou 8 etapas, a partir de prompts

  • Funciona por destilação, o que aumenta a eficiência energética e garante uma excelente qualidade

  • Otimizado para o inglês, com conhecimento limitado de outros idiomas (FR, DE, ES, IT, etc.)

Número máximo de tokens de entrada

77

Imagem de saída máxima

5

Idiomas

EN

Resolução máxima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Flux schnell

Ideal para editar e combinar retratos de pessoas

  • Crie fotos em diversos estilos a partir de uma ou mais fotos de perfil

  • Poderoso e flexível: recontextualização, colorização, alteração de idade e gênero, combinação de identidades, etc.

Número máximo de tokens de entrada

77

Tamanho máximo da imagem de entrada

6

Imagem de saída máxima

5

Idiomas

EN

Resolução máxima

1024x1024, 1792x1024, 1024x1792

  • Crie fotos em diversos estilos a partir de uma ou mais fotos de perfil

  • Poderoso e flexível: recontextualização, colorização, alteração de idade e gênero, combinação de identidades, etc.

Número máximo de tokens de entrada

77

Tamanho máximo da imagem de entrada

6

Imagem de saída máxima

5

Idiomas

EN

Resolução máxima

1024x1024, 1792x1024, 1024x1792