OpenAI Gym — это библиотека Python с открытым исходным кодом, которая предоставляет набор сред и инструментов для разработки и сравнения алгоритмов обучения с подкреплением. Вот несколько методов, связанных с OpenAI Gym:
-
make
: этот метод используется для создания экземпляра среды в OpenAI Gym. Он принимает имя среды в качестве параметра и возвращает соответствующий объект среды. -
reset
: этот метод сбрасывает среду в исходное состояние и возвращает исходное наблюдение. -
step
: методstep
принимает действие в качестве входных данных и выполняет один шаг в среде. Он возвращает следующее наблюдение, награду за предпринятое действие, логическое значение, указывающее, закончился ли эпизод, и дополнительную информацию о шаге. -
render
: этот метод визуализирует текущее состояние среды, позволяя визуализировать его. -
action_space
: этот метод возвращает информацию о пространстве действий среды, например количество возможных действий и их тип данных. -
observation_space
: этот метод предоставляет информацию о пространстве наблюдения среды, включая форму и тип данных наблюдений. -
close
: методclose
закрывает среду и выполняет всю необходимую очистку. -
начальное значение
: этот метод позволяет вам установить случайное начальное значение для воспроизводимости. -
envs
: атрибутenvs
предоставляет список всех доступных сред в OpenAI Gym.