OpenAI Gym は、強化学習アルゴリズムの開発と比較に特化したオープンソースの Python ライブラリです。標準化された API を提供することで、学習アルゴリズムと環境を接続し、その API 標準に準拠した環境の集合を提供します。リリース以来、Gym の API は強化学習分野の標準となっています。
プロジェクトのメンテナンス状況の変更: 2021 年から Gym をメンテナンスしてきたチームは、今後のすべての開発作業を Gymnasium に移行しました。これは Gym の直接的な代替品です ( import gymnasium as gym
を使用できます)。Gym は今後更新を受け付けないため、ユーザーはできるだけ早く Gymnasium に切り替えることをお勧めします。
pip install gym
# Atari 環境の依存関係をインストール
pip install gym[atari]
# すべての環境の依存関係をインストール
pip install gym[all]
# MuJoCo 環境の依存関係をインストール (最新バージョン)
pip install gym[mujoco]
# MuJoCo 環境の依存関係をインストール (旧バージョン)
pip install gym[mujoco_py]
import gym
# 環境を作成
env = gym.make("CartPole-v1")
# 環境をリセット
observation, info = env.reset(seed=42)
# 環境とのインタラクションループ
for _ in range(1000):
# ランダムにアクションを選択
action = env.action_space.sample()
# アクションを実行
observation, reward, terminated, truncated, info = env.step(action)
# リセットが必要かどうかを確認
if terminated or truncated:
observation, info = env.reset()
# 環境を閉じる
env.close()
CleanRL - Gym API に基づく学習ライブラリ
Tianshou - 経験豊富なユーザー向けの学習ライブラリ
RLlib - 分散トレーニングをサポートする学習ライブラリ
PettingZoo - マルチエージェント環境ライブラリ
Gym は再現性を確保するために厳格なバージョン管理を採用しています。
mujoco-py
に依存しないmujoco
を必須の依存関係として使用プロジェクトのホワイトペーパーは arXiv で入手できます。引用形式:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
OpenAI Gym は、強化学習分野の先駆的なツールとして、業界標準を確立し、巨大なエコシステムを育成しました。元のプロジェクトはもはや積極的にメンテナンスされていませんが、その後継である Gymnasium はすべてのコア機能を継承し、コミュニティの継続的な発展を保証します。新しいプロジェクトでは、最新の機能と継続的なサポートを得るために、Gymnasium を直接使用することを強くお勧めします。