OpenAI Gym é uma biblioteca Python de código aberto, dedicada ao desenvolvimento e comparação de algoritmos de aprendizado por reforço. Ela conecta algoritmos de aprendizado e ambientes através de uma API padronizada e fornece um conjunto de ambientes que seguem esse padrão de API. Desde o seu lançamento, a API do Gym se tornou o padrão na área de aprendizado por reforço.
Mudança no Status de Manutenção do Projeto: A equipe que manteve o Gym desde 2021 transferiu todo o trabalho de desenvolvimento futuro para o Gymnasium, que é um substituto direto do Gym (pode ser usado com import gymnasium as gym
). O Gym não receberá mais nenhuma atualização futura, e recomenda-se que os usuários mudem para o Gymnasium o mais rápido possível.
pip install gym
# Instalar dependências para ambientes Atari
pip install gym[atari]
# Instalar dependências para todos os ambientes
pip install gym[all]
# Instalar dependências para ambientes MuJoCo (versão mais recente)
pip install gym[mujoco]
# Instalar dependências para ambientes MuJoCo (versão antiga)
pip install gym[mujoco_py]
import gym
# Criar ambiente
env = gym.make("CartPole-v1")
# Reiniciar ambiente
observation, info = env.reset(seed=42)
# Loop de interação com o ambiente
for _ in range(1000):
# Escolher ação aleatoriamente
action = env.action_space.sample()
# Executar ação
observation, reward, terminated, truncated, info = env.step(action)
# Verificar se precisa reiniciar
if terminated or truncated:
observation, info = env.reset()
# Fechar ambiente
env.close()
CleanRL - Biblioteca de aprendizado baseada na API do Gym
Tianshou - Biblioteca de aprendizado para usuários experientes
RLlib - Biblioteca de aprendizado que suporta treinamento distribuído
PettingZoo - Biblioteca de ambientes multiagente
O Gym adota um controle de versão rigoroso para garantir a reprodutibilidade:
mujoco-py
mujoco
como uma dependência necessáriaO white paper do projeto está disponível no arXiv, formato de citação:
@misc{1606.01540,
Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
Title = {OpenAI Gym},
Year = {2016},
Eprint = {arXiv:1606.01540},
}
OpenAI Gym, como uma ferramenta pioneira na área de aprendizado por reforço, estabeleceu um padrão da indústria e cultivou um vasto ecossistema. Embora o projeto original não esteja mais sendo ativamente mantido, seu sucessor, Gymnasium, herdou todas as funcionalidades principais, garantindo o desenvolvimento contínuo da comunidade. Para novos projetos, é altamente recomendável usar o Gymnasium diretamente para obter os recursos mais recentes e suporte contínuo.