¿Te imaginas poder ejecutar un modelo GPT de decenas de miles de millones de parámetros en tu propio equipo?
OpenAI acaba de romper barreras publicando dos modelos de GPTOSS totalmente abiertos: gpt‑oss‑120B y gpt‑oss‑20B, accesibles bajo licencia Apache 2.0 y con capacidades comparables a sus modelos propietarios. Esta decisión abre nuevas vías para investigadores, startups y empresas que desean controlar sus datos y desplegar inteligencia artificial potente sin depender de la API cerrada de OpenAI.
¿Qué son GPT‑OSS‑120B y GPT‑OSS‑20B?
OpenAI presentó el 5 de agosto de 2025 estos dos modelos abiertos de generación de texto con capacidades avanzadas de razonamiento, disponibles bajo licencia Apache open‑weight, lo que permite descargarlos, modificarlos y ejecutarlos libremente.
El modelo gpt‑oss‑120B cuenta con aproximadamente 117 000 millones de parámetros (aunque activa solo unos 5 200 millones mediante arquitectura Mixture‑of‑Experts), y ofrece un rendimiento cercano al modelo propietario o4‑mini, manejando contextos de hasta 128 000 tokens. El gpt‑oss‑20B, con unos 21 000 millones de parámetros activos, puede funcionar en equipos con 16 GB de VRAM o incluso Macs Apple Silicon, ofreciendo rendimiento similar al o3‑mini.
Ambos modelos soportan razonamiento en cadena de pensamiento (chain‑of‑thought), nivel configurable de esfuerzo de razonamiento (alto, medio, bajo) y llamada a funciones externas como búsqueda web o ejecución de Python.
Ventajas clave para desarrolladores y organizaciones
Control total y personalización local
Estos modelos se pueden ejecutar ai localmente o en infraestructuras propias, lo cual permite control de datos y cumplimiento de requisitos de residencia. Con licencia Apache 2.0, cualquier empresa o individuo puede adaptar, redistribuir y desplegar los modelos para uso comercial o investigación .
Rendimiento destacado en razonamiento
En benchmarks como MMLU, AIME 2024/2025, HealthBench y Codeforces, el gpt‑oss‑120B iguala o supera al modelo o4‑mini, incluso en tareas médicas y matemáticas, mientras que el gpt‑oss‑20B ofrece alta eficiencia para equipos con menor capacidad. Ambos destacan en funciones de razonamiento estructurado y uso de herramientas .
Infraestructura accesible
El modelo de 20 B requiere solo 16 GB de VRAM (utilizando MXFP4 quantization en GPUs Hopper o RTX recientes) y es compatible con frameworks como Transformers, vLLM, Ollama o llama.cpp. El modelo de 120 B puede correr en una sola GPU H100 o entornos multi‑GPU.
Casos de uso y ejemplos prácticos
Empresas como AI Sweden, Orange y Snowflake han colaborado con OpenAI para implementar gpt‑oss en entornos on‑premises, especialmente en sectores que requieren alta confidencialidad de datos.
Por ejemplo, en investigación médica, los modelos permiten automatizar síntesis de información, generación de reportes y análisis complejos sin salir de entornos seguros. También pueden emplearse en asistentes conversacionales personalizados, chatbots autonómicos o sistemas de programación inteligente con integración directa en bases de datos o APIs externas.
¿Cómo empezar a usar GPT‑OSS?
Para iniciarse, puedes descargar los modelos desde Hugging Face o repositorios oficiales, y desplegarlos con frameworks compatibles como Transformers o vLLM. Existen guías paso a paso disponibles en OpenAI Cookbook . Con Transformers puedes ejecutar comandos para servir el modelo localmente con transformers serve o transformers chat, según tus requisitos de aplicación . También plataformas como Ollama facilitan la instalación con comandos simples para descargar y ejecutar .
¿Qué supone este lanzamiento para el ecosistema AI?
La publicación de GPT‑OSS representa un cambio estratégico: desde modelos cerrados hacia un enfoque colaborativo y transparente. La comunidad open‑source de IA recibe una herramienta con rendimiento real, adaptable y éticamente evaluada. OpenAI retoma sus raíces fundacionales de democratización tecnológica.
Además, esta jugada posiciona a OpenAI frente a otros actores como Meta (con LLaMA) o DeepSeek, que también ofrecen modelos abiertos, elevando el nivel competitivo en la industria.
Fuentes consultadas
- OpenAI – Introducing gpt‑oss (blog oficial, 5 ago 2025)
- OpenAI Help Center – OpenAI open-weight models (gpt-oss)
- El País / Cinco Días – OpenAI presenta gpt‑oss‑120B y gpt‑oss‑20B (6 ago 2025)
- Business Insider – Sam Altman launches GPT-OSS… (5 ago 2025)
- Wired – OpenAI Just Released Its First Open‑Weight Models Since GPT‑2 (5 ago 2025)
- Noailabs – gpt‑oss‑120 & 20B: Open Source Models From OpenAI (Medium, ago 2025)
- Hugging Face Model Card – openai/gpt‑oss‑20b
- OpenAI Cookbook – How to run gpt‑oss with Transformers
- Ollama Library – gpt-oss models overview
