OpenAI Gym — это библиотека Python с открытым исходным кодом, которая предоставляет набор сред и инструментов для разработки и сравнения алгоритмов обучения с подкреплением. Вот несколько методов, связанных с OpenAI Gym:
-
make: этот метод используется для создания экземпляра среды в OpenAI Gym. Он принимает имя среды в качестве параметра и возвращает соответствующий объект среды. -
reset: этот метод сбрасывает среду в исходное состояние и возвращает исходное наблюдение. -
step: методstepпринимает действие в качестве входных данных и выполняет один шаг в среде. Он возвращает следующее наблюдение, награду за предпринятое действие, логическое значение, указывающее, закончился ли эпизод, и дополнительную информацию о шаге. -
render: этот метод визуализирует текущее состояние среды, позволяя визуализировать его. -
action_space: этот метод возвращает информацию о пространстве действий среды, например количество возможных действий и их тип данных. -
observation_space: этот метод предоставляет информацию о пространстве наблюдения среды, включая форму и тип данных наблюдений. -
close: методcloseзакрывает среду и выполняет всю необходимую очистку. -
начальное значение: этот метод позволяет вам установить случайное начальное значение для воспроизводимости. -
envs: атрибутenvsпредоставляет список всех доступных сред в OpenAI Gym.