Las mejores IA open source bajo demanda en un Cloud soberano

Descubre las mejores alternativas open source a ChatGPT, Gemini, Midjourney o Claude para procesar datos confidenciales en total conformidad con la legislación europea y suiza.

LLM↓

Embeddings↓

Audio↓

Imagen↓

Grandes modelos de lenguaje (LLM)

Las mejores alternativas open source a ChatGPT, Gemini y Microsoft Copilot para interactuar, analizar y generar contenido con IA.

Mistral-Small-24B-Instruct-2501

El más eficaz

Empezar gratis

Consultar la documentación API

●
Ideal para aplicaciones que requieren respuestas e interacciones instantáneas
●
Destaca en la comprensión y el razonamiento complejo como la programación
●
Admite las principales lenguas europeas

Max input tokens

32’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2025/03

Consulta de funciones

Sí (disponible próximamente)

Empezar gratis

Consultar la documentación API

●
Ideal para aplicaciones que requieren respuestas e interacciones instantáneas
●
Destaca en la comprensión y el razonamiento complejo como la programación
●
Admite las principales lenguas europeas

Max input tokens

32’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2025/03

Consulta de funciones

Sí (disponible próximamente)

DeepSeek-R1-distilled-qwen-32B

El más eficiente y reflexivo

Empezar gratis

Consultar la documentación API

●
Rendimiento comparable al ChatGPT o1 mini, a un precio mucho menor
●
Un modelo diseñado para razonar, analizar y estructurar la información con precisión
●
Ideal para generar, optimizar y corregir código, así como para resolver problemas lógicos y matemáticos
●
Optimizado para comprender, reformular y generar texto relevante

Max input tokens

128’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2025/01

Consulta de funciones

Sí (disponible próximamente)

Empezar gratis

Consultar la documentación API

●
Rendimiento comparable al ChatGPT o1 mini, a un precio mucho menor
●
Un modelo diseñado para razonar, analizar y estructurar la información con precisión
●
Ideal para generar, optimizar y corregir código, así como para resolver problemas lógicos y matemáticos
●
Optimizado para comprender, reformular y generar texto relevante

Max input tokens

128’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2025/01

Consulta de funciones

Sí (disponible próximamente)

Llama 3.3

El más potente

Empezar gratis

Consultar la documentación API

●
Optimizado para procesar grandes cantidades de texto y garantizar la coherencia entre múltiples fuentes
●
Destaca en tareas de desarrollo, programación e investigación académica
●
Gran flexibilidad multilingüe con más de 30 idiomas admitidos
●
Adecuado para artistas y creación de contenido, incluido el storytelling

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2024/07

Consulta de funciones

Sí (disponible próximamente)

Empezar gratis

Consultar la documentación API

●
Optimizado para procesar grandes cantidades de texto y garantizar la coherencia entre múltiples fuentes
●
Destaca en tareas de desarrollo, programación e investigación académica
●
Gran flexibilidad multilingüe con más de 30 idiomas admitidos
●
Adecuado para artistas y creación de contenido, incluido el storytelling

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Entrenamiento

2024/07

Consulta de funciones

Sí (disponible próximamente)

granite-3.1-8b

Creado para las empresas

Empezar gratis

Consultar la documentación API

●
Creado para aplicaciones profesionales seguras y adaptables a las necesidades empresariales
●
Integraciones optimizadas para mejorar la búsqueda semántica y la precisión de los resultados en los sistemas RAG
●
Eficaces, fiables y responsables a la hora de proteger la propiedad intelectual
●
Ideal para búsquedas complejas, responder a preguntas a partir de documentos, gestionar conocimientos, etc.

Max input tokens

128’000

Idiomas

FR, EN, DE, ES, IT, PT, NL, JA, KO, AN, CS, ZH

Entrenamiento

2024/12

Consulta de funciones

Sí (disponible próximamente)

Empezar gratis

Consultar la documentación API

●
Creado para aplicaciones profesionales seguras y adaptables a las necesidades empresariales
●
Integraciones optimizadas para mejorar la búsqueda semántica y la precisión de los resultados en los sistemas RAG
●
Eficaces, fiables y responsables a la hora de proteger la propiedad intelectual
●
Ideal para búsquedas complejas, responder a preguntas a partir de documentos, gestionar conocimientos, etc.

Max input tokens

128’000

Idiomas

FR, EN, DE, ES, IT, PT, NL, JA, KO, AN, CS, ZH

Entrenamiento

2024/12

Consulta de funciones

Sí (disponible próximamente)

Modelo de embedding

Los mejores modelos de embedding de código abierto para transformar tus datos en vectores inteligentes. Mejora la precisión de tus búsquedas, personaliza tus recomendaciones, simplifica el análisis de datos, explora los vínculos semánticos y clasifica fácilmente el texto.

Bge Multilingual Gemma2

La más alta calidad

Empezar gratis

Consultar la documentación API

●
El modelo de embedding de código abierto más potente del mercado
●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
●
Ideal para el uso avanzado de vectores de embedding en usos diversos
●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8192

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Empezar gratis

Consultar la documentación API

●
El modelo de embedding de código abierto más potente del mercado
●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
●
Ideal para el uso avanzado de vectores de embedding en usos diversos
●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8192

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

All MiniLM L12 v2

La mejor relación calidad-precio

Empezar gratis

Consultar la documentación API

●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
●
Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

512

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Empezar gratis

Consultar la documentación API

●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
●
Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

512

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Reconocimiento de voz

La mejor IA open source para transcribir archivos de audio a texto o generar voces humanas realistas.

Whisper V3

Para las transcripciones complejas

Empezar gratis

Consultar la documentación API

●
Modelo entrenado con más de 1 millón de horas de datos
●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Empezar gratis

Consultar la documentación API

●
Modelo entrenado con más de 1 millón de horas de datos
●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Whisper V2

Para la mayoría de las transcripciones

Empezar gratis

Consultar la documentación API

●
Transcripción de audio en más de 57 idiomas y traducción del texto transcrito al inglés
●
Modelo entrenado con 680.000 horas de datos en 98 idiomas
●
Identificación automática del idioma de origen

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Empezar gratis

Consultar la documentación API

●
Transcripción de audio en más de 57 idiomas y traducción del texto transcrito al inglés
●
Modelo entrenado con 680.000 horas de datos en 98 idiomas
●
Identificación automática del idioma de origen

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Generación y procesamiento de imágenes

Las mejores alternativas open source a Midjourney, Microsoft Copilot Designer o Gemini para generar, fusionar o interpretar imágenes.

Photomaker V2

Ideal para generar imágenes

Empezar gratis

Consultar la documentación API

●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Empezar gratis

Consultar la documentación API

●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Ideal para modificar y fusionar retratos de personas

Empezar gratis

Consultar la documentación API

●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

Max input image

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Empezar gratis

Consultar la documentación API

●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

Max input image

Max output image

Idiomas

Resolución máxima

1024x1024, 1792x1024, 1024x1792