Documentation

MDP.Paths.Prob

noncomputable def MDP.Path.Prob {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (๐’ฎ : ๐”–[M]) (ฯ€ : M.Path) :
Equations
Instances For
    @[simp]
    theorem MDP.Path.singleton_Prob {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (x : State) (๐’ฎ : ๐”–[M]) :
    Prob ๐’ฎ {x} = 1
    @[simp]
    theorem MDP.Path.Prob_le_one {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (ฯ€ : M.Path) (๐’ฎ : ๐”–[M]) :
    Prob ๐’ฎ ฯ€ โ‰ค 1
    @[simp]
    theorem MDP.Path.Prob_ne_top {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (ฯ€ : M.Path) (๐’ฎ : ๐”–[M]) :
    Prob ๐’ฎ ฯ€ โ‰  โŠค
    theorem MDP.Path.extend_Prob {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (ฯ€ : M.Path) (s : โ†‘(M.succs_univ ฯ€.last)) (๐’ฎ : ๐”–[M]) :
    Prob ๐’ฎ (ฯ€.extend s) = M.P ฯ€.last (๐’ฎ ฯ€) โ†‘s * Prob ๐’ฎ ฯ€
    theorem MDP.Path.prepend_Prob {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (ฯ€ : M.Path) [DecidableEq State] (๐’ฎ : ๐”–[M]) (s : โ†‘(M.prev_univ ฯ€[0])) :
    Prob ๐’ฎ (ฯ€.prepend s) = M.P (โ†‘s) (๐’ฎ {โ†‘s}) ฯ€[0] * Prob (๐’ฎ.specialize โ†‘s โŸจฯ€[0], โ‹ฏโŸฉ) ฯ€
    theorem MDP.Path.Prob_tail {State : Type u_1} {Act : Type u_2} {M : MDP State Act} (ฯ€ : M.Path) [DecidableEq State] (h : 1 < โ€–ฯ€โ€–) (๐’ฎ : ๐”–[M]) :
    Prob ๐’ฎ ฯ€ = M.P ฯ€[0] (๐’ฎ {ฯ€[0]}) ฯ€[1] * Prob (๐’ฎ.specialize ฯ€[0] โŸจฯ€[1], โ‹ฏโŸฉ) ฯ€.tail
    @[simp]
    theorem MDP.Path.tsum_succs_univ_Prob_eq_one {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {๐’ฎ : ๐”–[M]} (ฯ€ : M.Path) :
    โˆ‘' (ฯ€' : โ†‘ฯ€.succs_univ), Prob ๐’ฎ โ†‘ฯ€' = Prob ๐’ฎ ฯ€
    @[simp]
    theorem MDP.Path.tsum_Prob_eq_one {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {s : State} {๐’ฎ : ๐”–[M]} (n : โ„•) :
    โˆ‘' (ฯ€ : โ†‘Path[M,s,=n + 1]), Prob ๐’ฎ โ†‘ฯ€ = 1
    theorem MDP.Path_eq.tsum_add_left {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {n : โ„•} {s' : State} {๐’ฎ : ๐”–[M]} {a : ENNReal} (f : โ†‘Path[M,s',=n + 1] โ†’ ENNReal) :
    โˆ‘' (ฯ€ : โ†‘Path[M,s',=n + 1]), (Path.Prob ๐’ฎ โ†‘ฯ€ * a + f ฯ€) = a + โˆ‘' (ฯ€ : โ†‘Path[M,s',=n + 1]), f ฯ€
    @[simp]
    theorem MDP.Path.tsum_Prob_eq_one_comp {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {s : State} {๐’ฎ : ๐”–[M]} (n : โ„•) (S : Set โ†‘Path[M,s,=n + 1]) :
    โˆ‘' (ฯ€ : โ†‘S), Prob ๐’ฎ โ†‘โ†‘ฯ€ + โˆ‘' (ฯ€ : โ†‘Sแถœ), Prob ๐’ฎ โ†‘โ†‘ฯ€ = 1
    @[simp]
    theorem MDP.Path.one_sub_tsum_ite_Prob_eq {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {s : State} {๐’ฎ : ๐”–[M]} (n : โ„•) (p : โ†‘Path[M,s,=n + 1] โ†’ Prop) [DecidablePred p] :
    (1 - โˆ‘' (ฯ€ : โ†‘Path[M,s,=n + 1]), if p ฯ€ then Prob ๐’ฎ โ†‘ฯ€ else 0) = โˆ‘' (ฯ€ : โ†‘Path[M,s,=n + 1]), if p ฯ€ then 0 else Prob ๐’ฎ โ†‘ฯ€
    @[simp]
    theorem MDP.Path.one_sub_tsum_ite_Prob_eq' {State : Type u_1} {Act : Type u_2} {M : MDP State Act} {s : State} {๐’ฎ : ๐”–[M]} (n : โ„•) (p : โ†‘Path[M,s,=n + 1] โ†’ Prop) [DecidablePred p] :
    (1 - โˆ‘' (ฯ€ : โ†‘Path[M,s,=n + 1]), if p ฯ€ then 0 else Prob ๐’ฎ โ†‘ฯ€) = โˆ‘' (ฯ€ : โ†‘Path[M,s,=n + 1]), if p ฯ€ then Prob ๐’ฎ โ†‘ฯ€ else 0