Las mejores IA open source bajo demanda en un Cloud soberano

Descubre las mejores alternativas open source a ChatGPT, Gemini, Midjourney o Claude para procesar datos confidenciales en total conformidad con la legislación europea y suiza.

LLM↓

Embeddings↓

Audio↓

Imagen↓

Grandes modelos de lenguaje (LLM)

Las mejores alternativas open source a ChatGPT, Gemini y Microsoft Copilot para interactuar, analizar y generar contenido con IA.

moonshotai/Kimi-K2.6

El más potente para el vibe coding

Beta

Empezar gratis

Consultar la documentación API

●
Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.
●
Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos
●
Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos
●
Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Sí

Categoría de modelo

code

Empezar gratis

Consultar la documentación API

●
Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.
●
Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos
●
Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos
●
Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Sí

Categoría de modelo

code

Qwen/Qwen3.5-397B-A17B-FP8

El más potente

Beta

Empezar gratis

Consultar la documentación API

●
Arquitectura MoE de vanguardia diseñada para tareas de extrema complejidad, que ofrece una precisión sin igual en el razonamiento científico, la planificación en varias etapas y la ejecución de herramientas.
●
Aprovecha una base de conocimientos global considerablemente ampliada para mejorar el dominio de conocimientos generales amplios y la generación de código complejo.
●
Supera a los modelos anteriores en benchmarks de razonamiento riguroso.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_large

Empezar gratis

Consultar la documentación API

●
Arquitectura MoE de vanguardia diseñada para tareas de extrema complejidad, que ofrece una precisión sin igual en el razonamiento científico, la planificación en varias etapas y la ejecución de herramientas.
●
Aprovecha una base de conocimientos global considerablemente ampliada para mejorar el dominio de conocimientos generales amplios y la generación de código complejo.
●
Supera a los modelos anteriores en benchmarks de razonamiento riguroso.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_large

Qwen/Qwen3.5-122B-A10B-FP8

El más eficiente

Empezar gratis

Consultar la documentación API

●
Diseñado para tareas complejas que requieren una gran ventana de contexto y una mayor precisión en el razonamiento lógico.
●
Arquitectura optimizada para una inferencia más rápida y una menor huella energética, lo que libera importantes recursos de cálculo.
●
Entrenado con millones de agentes y tareas cada vez más complejas para lograr una adaptabilidad sólida en entornos reales.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_large

Empezar gratis

Consultar la documentación API

●
Diseñado para tareas complejas que requieren una gran ventana de contexto y una mayor precisión en el razonamiento lógico.
●
Arquitectura optimizada para una inferencia más rápida y una menor huella energética, lo que libera importantes recursos de cálculo.
●
Entrenado con millones de agentes y tareas cada vez más complejas para lograr una adaptabilidad sólida en entornos reales.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_large

mistralai/Mistral-Small-4-119B-2603

El más eficiente para instrucciones y razonamiento

Empezar gratis

Consultar la documentación API

●
Modelo versátil capaz de alternar fácilmente entre instrucciones generales y razonamiento complejo.
●
Diseñado para flujos de trabajo avanzados basados en agentes y aplicaciones empresariales que requieren la máxima fiabilidad y coherencia.
●
Supera ampliamente a Mistral Small 3 en latencia y volumen de solicitudes procesadas.

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Sí

Categoría de modelo

chat_large

Empezar gratis

Consultar la documentación API

●
Modelo versátil capaz de alternar fácilmente entre instrucciones generales y razonamiento complejo.
●
Diseñado para flujos de trabajo avanzados basados en agentes y aplicaciones empresariales que requieren la máxima fiabilidad y coherencia.
●
Supera ampliamente a Mistral Small 3 en latencia y volumen de solicitudes procesadas.

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Sí

Categoría de modelo

chat_large

swiss-ai/Apertus-v1.5-70B

El más ético

Beta

Empezar gratis

Consultar la documentación API

●
Ideal para la administración pública, los sectores regulados y la investigación, que exigen un estricto cumplimiento de las normas éticas.
●
Total transparencia en cuanto a los pesos y los datos de entrenamiento, respetando siempre el consentimiento de los propietarios de los datos y la privacidad.
●
Entiende y analiza de forma nativa el texto, las imágenes y los archivos de audio para ofrecer interacciones más completas e intuitivas.

Modalidad

Image-Audio-Text to Text

Max input tokens

100’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_medium

Empezar gratis

Consultar la documentación API

●
Ideal para la administración pública, los sectores regulados y la investigación, que exigen un estricto cumplimiento de las normas éticas.
●
Total transparencia en cuanto a los pesos y los datos de entrenamiento, respetando siempre el consentimiento de los propietarios de los datos y la privacidad.
●
Entiende y analiza de forma nativa el texto, las imágenes y los archivos de audio para ofrecer interacciones más completas e intuitivas.

Modalidad

Image-Audio-Text to Text

Max input tokens

100’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Sí

Categoría de modelo

chat_medium

google/gemma-4-31B-it

El equilibrio perfecto

Empezar gratis

Consultar la documentación API

●
El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.
●
Se apoya en una arquitectura de vanguardia para comprender mejor contextos amplios e instrucciones complejas.
●
Ideal para agentes conversacionales avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.

Modalidad

Texto a texto (optimizado para seguir instrucciones)

Max input tokens

100’000

Idiomas

Más de 140 idiomas

Consulta de funciones

Sí (nativo y optimizado)

Categoría de modelo

chat_medium

Empezar gratis

Consultar la documentación API

●
El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.
●
Se apoya en una arquitectura de vanguardia para comprender mejor contextos amplios e instrucciones complejas.
●
Ideal para agentes conversacionales avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.

Modalidad

Texto a texto (optimizado para seguir instrucciones)

Max input tokens

100’000

Idiomas

Más de 140 idiomas

Consulta de funciones

Sí (nativo y optimizado)

Categoría de modelo

chat_medium

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

La arquitectura más eficiente

Beta

Empezar gratis

Consultar la documentación API

●
Arquitectura híbrida innovadora que ofrece la potencia de un modelo grande con la velocidad y el precio de un modelo pequeño.
●
Destaca en el razonamiento lógico, la síntesis de datos complejos y la generación de código estructurado gracias a su entrenamiento con corpus técnicos de alta calidad.
●
Ideal para implementaciones a gran escala que requieren un equilibrio entre un rendimiento óptimo y el control de los costes de infraestructura.

Modalidad

Text to Text

Max input tokens

1’000’000

Idiomas

EN, ES, FR, DE, IT, JP

Consulta de funciones

Sí

Categoría de modelo

chat_medium

Empezar gratis

Consultar la documentación API

●
Arquitectura híbrida innovadora que ofrece la potencia de un modelo grande con la velocidad y el precio de un modelo pequeño.
●
Destaca en el razonamiento lógico, la síntesis de datos complejos y la generación de código estructurado gracias a su entrenamiento con corpus técnicos de alta calidad.
●
Ideal para implementaciones a gran escala que requieren un equilibrio entre un rendimiento óptimo y el control de los costes de infraestructura.

Modalidad

Text to Text

Max input tokens

1’000’000

Idiomas

EN, ES, FR, DE, IT, JP

Consulta de funciones

Sí

Categoría de modelo

chat_medium

mistralai/Ministral-3-14B-Instruct-2512

El más versátil

Beta

Empezar gratis

Consultar la documentación API

●
Optimizado para una implementación rápida y económica, ideal para agentes conversacionales, análisis de documentos y tareas especializadas.
●
Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un consumo mínimo de recursos.
●
Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.

Modalidad

Image-Text to Text

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Consulta de funciones

Sí

Categoría de modelo

chat_small

Empezar gratis

Consultar la documentación API

●
Optimizado para una implementación rápida y económica, ideal para agentes conversacionales, análisis de documentos y tareas especializadas.
●
Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un consumo mínimo de recursos.
●
Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.

Modalidad

Image-Text to Text

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Consulta de funciones

Sí

Categoría de modelo

chat_small

Modelos de reclasificación

Las mejores alternativas open source compatibles para optimizar la relevancia de tus resultados de búsqueda. Ajusta la clasificación de tus documentos, mejora la precisión de tus sistemas RAG y garantiza una recuperación de información más inteligente y contextual.

BAAI/bge-reranker-v2-m3

El más versátil

Beta

Empezar gratis

Consultar la documentación API

●
Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 tokens
●
Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos
●
La solución ideal para motores de búsqueda empresariales y aplicaciones RAG que requieren una comprensión detallada del contexto

Modalidad

Text to Text

Max input tokens

8’192

Idiomas

Más de 100 idiomas

Consulta de funciones

Tipo

reclasificar

Empezar gratis

Consultar la documentación API

●
Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 tokens
●
Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos
●
La solución ideal para motores de búsqueda empresariales y aplicaciones RAG que requieren una comprensión detallada del contexto

Modalidad

Text to Text

Max input tokens

8’192

Idiomas

Más de 100 idiomas

Consulta de funciones

Tipo

reclasificar

Qwen/Qwen3-Reranker-0.6B

El más eficaz

Beta

Empezar gratis

Consultar la documentación API

●
Arquitectura ultraligera (600 mil millones de parámetros) diseñada para una inferencia con latencia muy baja y una huella energética mínima
●
Mantiene una alta precisión de relevancia incluso con una ventana de contexto ampliada de hasta 32768 tokens
●
Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala

Modalidad

Text to Text

Max input tokens

32’768

Idiomas

Más de 100 idiomas

Consulta de funciones

Tipo

reclasificar

Empezar gratis

Consultar la documentación API

●
Arquitectura ultraligera (600 mil millones de parámetros) diseñada para una inferencia con latencia muy baja y una huella energética mínima
●
Mantiene una alta precisión de relevancia incluso con una ventana de contexto ampliada de hasta 32768 tokens
●
Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala

Modalidad

Text to Text

Max input tokens

32’768

Idiomas

Más de 100 idiomas

Consulta de funciones

Tipo

reclasificar

Modelo de embedding

Los mejores modelos de embedding de código abierto para transformar tus datos en vectores inteligentes. Mejora la precisión de tus búsquedas, personaliza tus recomendaciones, simplifica el análisis de datos, explora los vínculos semánticos y clasifica fácilmente el texto.

Qwen/Qwen3-Embedding-8B

Rendimiento superior para aplicaciones multilingües

Beta

Empezar gratis

Consultar la documentación API

●
Modelo de embedding de última generación optimizado para la comprensión semántica avanzada
●
Compatibilidad nativa con más de 100 idiomas y un rendimiento constante
●
Arquitectura de 8B parámetros que ofrece un equilibrio óptimo entre precisión y eficiencia
●
Contexto ampliado de 32 000 tokens para el análisis de documentos largos y complejos
●
Dimensiones de embedding configurables hasta 4096 para una flexibilidad máxima

Max input tokens

8’192

Parámetros

8 B

Dimensiones

4096

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Empezar gratis

Consultar la documentación API

●
Modelo de embedding de última generación optimizado para la comprensión semántica avanzada
●
Compatibilidad nativa con más de 100 idiomas y un rendimiento constante
●
Arquitectura de 8B parámetros que ofrece un equilibrio óptimo entre precisión y eficiencia
●
Contexto ampliado de 32 000 tokens para el análisis de documentos largos y complejos
●
Dimensiones de embedding configurables hasta 4096 para una flexibilidad máxima

Max input tokens

8’192

Parámetros

8 B

Dimensiones

4096

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Bge Multilingual Gemma2

La más alta calidad

Empezar gratis

Consultar la documentación API

●
El modelo de embedding de código abierto más potente del mercado
●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
●
Ideal para el uso avanzado de vectores de embedding en usos diversos
●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8’000

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Empezar gratis

Consultar la documentación API

●
El modelo de embedding de código abierto más potente del mercado
●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
●
Ideal para el uso avanzado de vectores de embedding en usos diversos
●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8’000

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

All MiniLM L12 v2

La mejor relación calidad-precio

Empezar gratis

Consultar la documentación API

●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
●
Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

128

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Empezar gratis

Consultar la documentación API

●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
●
Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

128

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Reconocimiento de voz

La mejor IA open source para transcribir archivos de audio a texto o generar voces humanas realistas.

Whisper V3

Para las transcripciones complejas

Empezar gratis

Consultar la documentación API

●
Modelo entrenado con más de 1 millón de horas de datos
●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Empezar gratis

Consultar la documentación API

●
Modelo entrenado con más de 1 millón de horas de datos
●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Generación y procesamiento de imágenes

Las mejores alternativas open source a Midjourney, Microsoft Copilot Designer o Gemini para generar, fusionar o interpretar imágenes.

Photomaker V2

Ideal para generar imágenes

Empezar gratis

Consultar la documentación API

●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Empezar gratis

Consultar la documentación API

●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Ideal para modificar y fusionar retratos de personas

Empezar gratis

Consultar la documentación API

●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

Max input image

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Empezar gratis

Consultar la documentación API

●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

Max input image

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792