OpenAI lanzará modelos Open-Weight: qué son y por qué lo cambia todo
OpenAI acaba de hacer algo que no ha hecho en años: lanzó modelos de lenguaje de código abierto.
La última vez que esto sucedió fue con GPT-2 en 2019. Ahora, tenemos dos nuevos: gpt-oss-120b y gpt-oss-20b.
¿Qué es diferente esta vez? Se publican bajo la licencia Apache 2.0, lo que básicamente significa que cualquiera puede usarlas, modificarlas y ejecutarlas como quiera. Es un movimiento bastante inesperado de una compañía que en su mayoría ha mantenido las cosas cerradas últimamente.
¿Qué son los modelos de peso abierto?
Los modelos de peso abierto son sistemas de IA en los que los “pesos” reales, los números centrales que el modelo aprendió durante el entrenamiento, se hacen públicos. Estos pesos son los que impulsan las predicciones, las respuestas y el comportamiento general del modelo.
A diferencia de los modelos cerrados como GPT-4 o Claude, a los que solo se puede acceder a través de API o servicios web, los modelos de peso abierto brindan a los usuarios una libertad real. Los usuarios pueden:
- Descárguelos y ejecútelos en su propio hardware, ya sea una PC personal, un servidor de oficina o incluso un teléfono
- Ajústelos con sus propios datos para obtener mejores resultados para tareas específicas
- Eche un vistazo debajo del capó y juegue con la arquitectura del modelo en sí
- Úsalos como quieras, sin necesidad de pagar por el acceso o depender de una plataforma de terceros
Dicho esto, “peso abierto” no significa completamente de código abierto. Los usuarios obtienen los pesos del modelo, pero no siempre el código de entrenamiento o el conjunto de datos completo utilizado para construirlo.
Por lo tanto, es un compromiso a medida que los usuarios obtienen control y transparencia, pero las empresas aún mantienen partes del proceso de capacitación en privado, a menudo por razones de propiedad o seguridad.
¿Por qué el movimiento de OpenAI lo cambiará todo?
Hasta ahora, los modelos más poderosos de OpenAI estaban encerrados detrás de API pagas, solo accesibles para grandes empresas o usuarios bien financiados. La compañía citó preocupaciones de seguridad, pero el resultado fue un acceso limitado para la comunidad de desarrolladores e investigadores en general.
Eso está cambiando. Con el lanzamiento de modelos de peso abierto, OpenAI brinda a los desarrolladores, investigadores y nuevas empresas independientes las herramientas para ejecutar IA de vanguardia localmente, ya sea por razones de privacidad, ahorro de costos o simplemente la libertad de jugar.
Estos modelos se pueden ajustar para todo, desde asesoramiento legal y apoyo médico hasta idiomas regionales y tareas de codificación especializadas.
No es necesario esperar el permiso o las actualizaciones de un equipo central, los usuarios pueden personalizar e implementar en sus propios términos.
También es una victoria para la transparencia. Los pesos abiertos permiten a los investigadores profundizar en cómo funcionan los modelos, probar el sesgo y verificar los problemas de seguridad. Ese tipo de visibilidad genera confianza.
Este movimiento también se ve en respuesta a la creciente competencia de Meta, Mistral y DeepSeek. Pero no importa la razón, el resultado es el mismo: más personas, en más lugares, ahora pueden aprovechar la poderosa tecnología de IA y construir cosas que antes no eran posibles.
¿Cómo acceder a los modelos de peso abierto?
OpenAI ha hecho que sus últimos modelos se puedan descargar gratuitamente en Hugging Face y GitHub. Se ejecutan en hardware con 16 a 80 GB de memoria y son totalmente personalizables, ideales para tareas como el razonamiento, el seguimiento de instrucciones y la ejecución de código, y están ajustados para industrias o lenguajes específicos.
Al lanzar estos modelos abiertamente, OpenAI está cambiando el poder de un puñado de grandes empresas tecnológicas a desarrolladores, nuevas empresas e investigadores de todo el mundo.
Eso significa una innovación más rápida, pruebas de seguridad más sólidas y más experimentación antes. Los investigadores ahora pueden inspeccionar cómo funcionan los modelos, encontrar sesgos o crear nuevas funciones sin esperar la hoja de ruta de otra persona.