OpenAI Gym es una biblioteca de Python de código abierto, diseñada específicamente para desarrollar y comparar algoritmos de aprendizaje por refuerzo. Proporciona una API estandarizada para conectar algoritmos de aprendizaje y entornos, y ofrece un conjunto de entornos que cumplen con este estándar de API. Desde su lanzamiento, la API de Gym se ha convertido en el estándar en el campo del aprendizaje por refuerzo.
Cambio en el Estado de Mantenimiento del Proyecto: El equipo que ha mantenido Gym desde 2021 ha transferido todo el trabajo de desarrollo futuro a Gymnasium, que es un reemplazo directo de Gym (se puede usar import gymnasium as gym
). Gym ya no recibirá ninguna actualización futura, y se recomienda a los usuarios que cambien a Gymnasium lo antes posible.
pip install gym
# Instalar dependencias para entornos Atari
pip install gym[atari]
# Instalar dependencias para todos los entornos
pip install gym[all]
# Instalar dependencias para entornos MuJoCo (versión más reciente)
pip install gym[mujoco]
# Instalar dependencias para entornos MuJoCo (versión antigua)
pip install gym[mujoco_py]
import gym
# Crear el entorno
env = gym.make("CartPole-v1")
# Reiniciar el entorno
observation, info = env.reset(seed=42)
# Bucle de interacción con el entorno
for _ in range(1000):
# Seleccionar una acción aleatoria
action = env.action_space.sample()
# Ejecutar la acción
observation, reward, terminated, truncated, info = env.step(action)
# Comprobar si es necesario reiniciar
if terminated or truncated:
observation, info = env.reset()
# Cerrar el entorno
env.close()
CleanRL - Biblioteca de aprendizaje basada en la API de Gym
Tianshou - Biblioteca de aprendizaje para usuarios experimentados
RLlib - Biblioteca de aprendizaje que admite entrenamiento distribuido
PettingZoo - Biblioteca de entornos multiagente
Gym utiliza un control de versiones estricto para garantizar la reproducibilidad:
mujoco-py
mujoco
como dependencia obligatoriaEl documento técnico del proyecto está disponible en arXiv, formato de cita:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
OpenAI Gym, como herramienta pionera en el campo del aprendizaje por refuerzo, ha establecido un estándar de la industria y ha fomentado un vasto ecosistema. Aunque el proyecto original ya no se mantiene activamente, su sucesor, Gymnasium, hereda todas las funciones principales, lo que garantiza el desarrollo continuo de la comunidad. Para los nuevos proyectos, se recomienda encarecidamente utilizar Gymnasium directamente para obtener las últimas funciones y soporte continuo.