MC-ProbMC-PrismFiles/HW11/Minigrid/minigrid/envs/mchw11.py


								from __future__ import annotations

								import math


								from numpy.random import default_rng


								from minigrid.core.constants import COLOR_NAMES

								from minigrid.core.grid import Grid

								from minigrid.core.mission import MissionSpace

								from minigrid.envs.lavaslippery import LavaSlipperyEnv

								from minigrid.core.world_object import (

								    Slippery,

								    Lava,

								    Goal,

								    Wall

								 )


								from minigrid.minigrid_env import MiniGridEnv, is_slippery


								import numpy as np


								from loguru import logger


								class MCHW11Env(LavaSlipperyEnv):

								    def __init__(self, *args, **kwargs):

								        super().__init__(*args, **kwargs)


								    def _gen_grid(self, width, height):

								        super()._gen_grid(width, height)


								        self.probability_intended = 0.91


								        slippery = Slippery(probability_intended=self.probability_intended)

								        for x in range(1, self.width - 1):

								            for y in range(1, self.height - 1):

								                self.grid.set(x,y, slippery)


								        self.disable_random_start()


								        self.put_obj(Lava(),4,3)

								        self.put_obj(Wall(),9,3)


								        agent_dir = 1 # We do not consider envs where the robot can turn

								        self.probability_turn_intended = 0.0

								        self.place_agent(agent_pos=np.array((1,1)), agent_dir=agent_dir, spawn_on_slippery=True)

								        self.place_goal(np.array((width - 2, height - 2)))

								        if self.dense_rewards: self.run_bfs()


								    def place_agent(self, spawn_on_slippery=False, agent_pos=None, agent_dir=0):

								        max_tries = 10_000

								        num_tries = 0


								        if self.randomize_start == True:

								            while True:

								                num_tries += 1

								                if num_tries > max_tries:

								                    raise RecursionError("rejection sampling failed in place_agent")

								                x = np.random.randint(0, self.width)

								                y = np.random.randint(0, 3)


								                cell = self.grid.get(*(x,y))

								                if cell is None or (cell.can_overlap() and not isinstance(cell, Lava) and not isinstance(cell, Goal) and (spawn_on_slippery or not is_slippery(cell))):

								                    self.agent_pos = np.array((x, y))

								                    self.agent_dir = np.random.randint(0, 4)

								                    break

								        elif agent_dir is None:

								            #self.agent_pos = np.array((1, 1))

								            self.agent_dir = 0

								        else:

								            self.agent_pos = agent_pos

								            self.agent_dir = agent_dir