As melhores IAs de código aberto, disponíveis sob demanda em uma nuvem soberana
Descubra as melhores alternativas de código aberto para ChatGPT, Gemini, Midjourney ou Claude, para processar dados confidenciais em total conformidade com a legislação europeia e suíça.
LLM↓
Incorporação↓
Áudio↓
Imagem↓
Modelos de linguagem de grande porte (LLM)
As melhores alternativas de código aberto ao ChatGPT, Gemini e Microsoft Copilot para interagir, analisar e gerar conteúdo com IA.
Qwen/Qwen3.5-122B-A10B-FP8
O mais potente
- ●
Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.
- ●
Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.
- ●
Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
200’000
Idiomas
Mais de 100 idiomas
Chamada de função
Sim
Categoria do modelo
chat_large
- ●
Concebido para tarefas complexas que exigem uma ampla visão do contexto e uma maior precisão no raciocínio lógico.
- ●
Arquitetura otimizada para uma inferência mais rápida e um consumo energético reduzido, libertando importantes recursos computacionais.
- ●
Treinado com milhões de agentes e tarefas de complexidade crescente para garantir uma adaptabilidade robusta ao mundo real.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
200’000
Idiomas
Mais de 100 idiomas
Chamada de função
Sim
Categoria do modelo
chat_large
Apertus-70B-Instruct-2509
O mais ético
Versão Beta
- ●
Ideal para serviços multilíngues, órgãos governamentais e equipes de P&D que procuram um modelo confiável e adaptável
- ●
Dados e métodos documentados para uma transparência sem precedentes
- ●
Em conformidade com a Lei de IA e respeitando a privacidade e a propriedade intelectual
- ●
Uma versão 70B com desempenho comparável aos líderes atuais do mercado
Modalidade
Text to Text
Número máximo de tokens de entrada
65’536
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Categoria do modelo
chat_medium
- ●
Ideal para serviços multilíngues, órgãos governamentais e equipes de P&D que procuram um modelo confiável e adaptável
- ●
Dados e métodos documentados para uma transparência sem precedentes
- ●
Em conformidade com a Lei de IA e respeitando a privacidade e a propriedade intelectual
- ●
Uma versão 70B com desempenho comparável aos líderes atuais do mercado
Modalidade
Text to Text
Número máximo de tokens de entrada
65’536
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Categoria do modelo
chat_medium
google/gemma-4-31B-it
O equilíbrio perfeito
- ●
O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.
- ●
Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.
- ●
Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.
Modalidade
Texto para texto (otimizado para a instrução)
Número máximo de tokens de entrada
100’000
Idiomas
Mais de 140 idiomas
Chamada de função
Sim (nativo e otimizado)
Categoria do modelo
chat_medium
- ●
O equilíbrio ideal entre rapidez de resposta e potência, concebido para se destacar no raciocínio lógico, na análise documental aprofundada e na geração de código fiável.
- ●
Aproveita uma arquitetura de ponta para oferecer uma compreensão detalhada de contextos abrangentes e instruções complexas.
- ●
Ideal para assistentes de conversação avançados e fluxos de trabalho empresariais que exigem grande versatilidade sem comprometer a velocidade de execução.
Modalidade
Texto para texto (otimizado para a instrução)
Número máximo de tokens de entrada
100’000
Idiomas
Mais de 140 idiomas
Chamada de função
Sim (nativo e otimizado)
Categoria do modelo
chat_medium
moonshotai/Kimi-K2.6
O mais potente para vibe coding
Versão Beta
- ●
Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.
- ●
Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos
- ●
Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos
- ●
Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
256’000
Idiomas
Multilíngue
Chamada de função
Sim
Categoria do modelo
code
- ●
Multimodalidade nativa: converte texto, imagens ou protótipos em código totalmente funcional.
- ●
Projetado para desenvolvimento em larga escala: inclui uma janela de contexto estendida de até 256k tokens para gerenciar projetos complexos
- ●
Otimizado para o "vibe coding": uma experiência rápida, fluida e criativa, projetada para desenvolvedores e designers de produtos
- ●
Compatível com fluxos de trabalho baseados em agentes: automatiza a análise, a geração de código e a execução completa
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
256’000
Idiomas
Multilíngue
Chamada de função
Sim
Categoria do modelo
code
mistralai/Ministral-3-14B-Instruct-2512
O mais versátil
Versão Beta
- ●
Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.
- ●
Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.
- ●
Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
100’000
Idiomas
EN, ES, FR, DE, IT...
Chamada de função
Sim
Categoria do modelo
chat_small
- ●
Otimizado para uma implementação rápida e económica, ideal para assistentes conversacionais, análise de documentos e tarefas especializadas.
- ●
Oferece um desempenho comparável ao do Mistral Small 3.2 24B com um mínimo de recursos.
- ●
Capaz de analisar imagens e fornecer informações com base no conteúdo visual, além do texto.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
100’000
Idiomas
EN, ES, FR, DE, IT...
Chamada de função
Sim
Categoria do modelo
chat_small
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8
A arquitetura mais eficiente
Versão Beta
- ●
Arquitetura híbrida inovadora que oferece a potência de um modelo de grande porte com a velocidade e o custo de um modelo de pequeno porte.
- ●
Destaca-se no raciocínio lógico, na síntese de dados complexos e na geração de código estruturado, graças ao treino com corpora técnicos de alta qualidade.
- ●
Ideal para implementações em grande escala que exigem um equilíbrio entre desempenho de ponta e controlo dos custos de infraestrutura.
Modalidade
Text to Text
Número máximo de tokens de entrada
1’000’000
Idiomas
EN, ES, FR, DE, IT, JP
Chamada de função
Sim
Categoria do modelo
chat_medium
- ●
Arquitetura híbrida inovadora que oferece a potência de um modelo de grande porte com a velocidade e o custo de um modelo de pequeno porte.
- ●
Destaca-se no raciocínio lógico, na síntese de dados complexos e na geração de código estruturado, graças ao treino com corpora técnicos de alta qualidade.
- ●
Ideal para implementações em grande escala que exigem um equilíbrio entre desempenho de ponta e controlo dos custos de infraestrutura.
Modalidade
Text to Text
Número máximo de tokens de entrada
1’000’000
Idiomas
EN, ES, FR, DE, IT, JP
Chamada de função
Sim
Categoria do modelo
chat_medium
mistralai/Mistral-Small-4-119B-2603
O mais eficaz para a aprendizagem e o raciocínio
- ●
Modelo versátil capaz de alternar facilmente entre instrução geral e raciocínio complexo.
- ●
Destinado a fluxos de trabalho agênicos avançados e a aplicações empresariais que exigem a máxima fiabilidade e consistência.
- ●
Supera largamente o Mistral Small 3 em termos de latência e de taxas de resposta às consultas.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
256’000
Idiomas
Multilíngue
Chamada de função
Sim
Categoria do modelo
chat_large
- ●
Modelo versátil capaz de alternar facilmente entre instrução geral e raciocínio complexo.
- ●
Destinado a fluxos de trabalho agênicos avançados e a aplicações empresariais que exigem a máxima fiabilidade e consistência.
- ●
Supera largamente o Mistral Small 3 em termos de latência e de taxas de resposta às consultas.
Modalidade
Image-Text to Text
Número máximo de tokens de entrada
256’000
Idiomas
Multilíngue
Chamada de função
Sim
Categoria do modelo
chat_large
Modelos de reclassificação
As melhores alternativas de código aberto compatíveis para otimizar a relevância dos seus resultados de pesquisa. Aperfeiçoe a classificação dos seus documentos, melhore a precisão dos seus sistemas RAG e garanta uma recuperação de informação mais inteligente e contextual.
BAAI/bge-reranker-v2-m3
O mais versátil
Versão Beta
- ●
Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens
- ●
Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos
- ●
Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto
Modalidade
Text to Text
Número máximo de tokens de entrada
8192
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Tipo
Classificação
- ●
Modelo multilingue avançado capaz de processar simultaneamente consultas curtas, parágrafos e documentos longos com até 8192 s de tokens
- ●
Combina a análise lexical (palavras-chave) e semântica (significado) para uma precisão de classificação inigualável em corpora complexos
- ●
Solução ideal para motores de busca empresariais e aplicações RAG que exigem uma compreensão detalhada do contexto
Modalidade
Text to Text
Número máximo de tokens de entrada
8192
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Tipo
Classificação
Qwen/Qwen3-Reranker-0.6B
O mais eficiente
Versão Beta
- ●
Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo
- ●
Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens
- ●
Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala
Modalidade
Text to Text
Número máximo de tokens de entrada
32768
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Tipo
Classificação
- ●
Arquitetura ultraleve (0,6 mil milhões de parâmetros) concebida para uma inferência com latência muito baixa e um consumo energético mínimo
- ●
Mantém uma elevada precisão de relevância, mesmo com uma janela de contexto alargada até 32768 tokens
- ●
Ideal para fluxos de dados em tempo real, agentes autónomos e implementações em grande escala
Modalidade
Text to Text
Número máximo de tokens de entrada
32768
Idiomas
Mais de 100 idiomas
Chamada de função
Não
Tipo
Classificação
Modelos de incorporação
Os melhores modelos de embedding de código aberto para transformar seus dados em vetores inteligentes. Melhore a precisão das suas pesquisas, personalize suas recomendações, simplifique a análise de dados, explore as relações semânticas e classifique textos facilmente.
Bge Multilingual Gemma2
A mais alta qualidade
- ●
O modelo de embedding de código aberto mais potente do mercado
- ●
O padrão de referência para tarefas de pesquisa semântica e pesquisa aumentada (RAG)
- ●
Ideal para o uso avançado de vetores de incorporação em diversos casos de uso


