OpenAI Gym est une bibliothèque Python open source spécialement conçue pour le développement et la comparaison d'algorithmes d'apprentissage par renforcement. Elle fournit une API standardisée pour connecter les algorithmes d'apprentissage et les environnements, et propose un ensemble d'environnements conformes à cette norme API. Depuis sa publication, l'API de Gym est devenue la norme dans le domaine de l'apprentissage par renforcement.
Changement d'état de la maintenance du projet : L'équipe qui a maintenu Gym depuis 2021 a transféré tous les futurs travaux de développement vers Gymnasium, un remplacement direct de Gym (qui peut être utilisé avec import gymnasium as gym
). Gym ne recevra plus de mises à jour futures et il est recommandé aux utilisateurs de passer à Gymnasium dès que possible.
pip install gym
# Installer les dépendances pour les environnements Atari
pip install gym[atari]
# Installer toutes les dépendances pour tous les environnements
pip install gym[all]
# Installer les dépendances pour les environnements MuJoCo (dernière version)
pip install gym[mujoco]
# Installer les dépendances pour les environnements MuJoCo (ancienne version)
pip install gym[mujoco_py]
import gym
# Créer un environnement
env = gym.make("CartPole-v1")
# Réinitialiser l'environnement
observation, info = env.reset(seed=42)
# Boucle d'interaction avec l'environnement
for _ in range(1000):
# Choisir une action aléatoire
action = env.action_space.sample()
# Exécuter l'action
observation, reward, terminated, truncated, info = env.step(action)
# Vérifier si une réinitialisation est nécessaire
if terminated or truncated:
observation, info = env.reset()
# Fermer l'environnement
env.close()
CleanRL - Bibliothèque d'apprentissage basée sur l'API Gym
Tianshou - Bibliothèque d'apprentissage destinée aux utilisateurs expérimentés
RLlib - Bibliothèque d'apprentissage prenant en charge l'entraînement distribué
PettingZoo - Bibliothèque d'environnements multi-agents
Gym utilise un contrôle de version strict pour garantir la reproductibilité :
mujoco-py
mujoco
comme dépendance requiseLe livre blanc du projet est disponible sur arXiv, format de citation :
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
OpenAI Gym, en tant qu'outil pionnier dans le domaine de l'apprentissage par renforcement, a établi une norme industrielle et a favorisé un vaste écosystème. Bien que le projet original ne soit plus activement maintenu, son successeur, Gymnasium, hérite de toutes les fonctionnalités de base, assurant ainsi le développement continu de la communauté. Pour les nouveaux projets, il est fortement recommandé d'utiliser directement Gymnasium pour bénéficier des dernières fonctionnalités et d'un support continu.