various pomdp functionalities

6 years ago · 412e94469c
5 changed files with 77 additions and 0 deletions
--- a/src/mod_pomdp.cpp
+++ b/src/mod_pomdp.cpp
@ -1,5 +1,8 @@
 #include "common.h"
 #include "pomdp/tracker.h"
 #include "pomdp/qualitative_analysis.h"
 #include "pomdp/transformations.h"
 PYBIND11_MODULE(pomdp, m) {
@ -9,5 +12,8 @@ PYBIND11_MODULE(pomdp, m) {
    py::options options;
    options.disable_function_signatures();
 #endif
    define_tracker(m);
    define_qualitative_policy_search<double>(m, "Double");
    define_qualitative_policy_search_nt(m);
    define_transformations<double>(m, "Double");
 }
--- a/src/pomdp/qualitative_analysis.cpp
+++ b/src/pomdp/qualitative_analysis.cpp
@ -0,0 +1,46 @@
 #include "tracker.h"
 #include "src/helpers.h"
 #include <storm-pomdp/analysis/MemlessStrategySearchQualitative.h>
 #include <storm-pomdp/analysis/QualitativeAnalysisOnGraphs.h>
 #include <storm-pomdp/analysis/WinningRegionQueryInterface.h>
 #include <storm/logic/Formula.h>
 template<typename ValueType> using SparsePomdp = storm::models::sparse::Pomdp<ValueType>;
 template<typename ValueType>
 std::shared_ptr<storm::pomdp::MemlessStrategySearchQualitative<ValueType>> createWinningRegionSolver(SparsePomdp<ValueType> const& pomdp, storm::logic::Formula const& formula, storm::pomdp::MemlessSearchOptions const& options) {
    STORM_LOG_TRACE("Run qualitative preprocessing...");
    storm::analysis::QualitativeAnalysisOnGraphs<ValueType> qualitativeAnalysis(pomdp);
    // After preprocessing, this might be done cheaper.
    storm::storage::BitVector targetStates = qualitativeAnalysis.analyseProb1(formula.asProbabilityOperatorFormula());
    storm::storage::BitVector surelyNotAlmostSurelyReachTarget = qualitativeAnalysis.analyseProbSmaller1(formula.asProbabilityOperatorFormula());
    storm::expressions::ExpressionManager expressionManager;
    std::shared_ptr<storm::utility::solver::SmtSolverFactory> smtSolverFactory = std::make_shared<storm::utility::solver::Z3SmtSolverFactory>();
    return std::make_shared<storm::pomdp::MemlessStrategySearchQualitative<ValueType>>(pomdp, targetStates, surelyNotAlmostSurelyReachTarget, smtSolverFactory, options);
 }
 template<typename ValueType>
 void define_qualitative_policy_search(py::module& m, std::string const& vtSuffix) {
    m.def(("create_iterative_qualitative_search_solver_" + vtSuffix).c_str(), &createWinningRegionSolver<ValueType>, "Create solver " ,py::arg("pomdp"), py::arg("formula"), py::arg("options"));
    py::class_<storm::pomdp::MemlessStrategySearchQualitative<ValueType>, std::shared_ptr<storm::pomdp::MemlessStrategySearchQualitative<ValueType>>> mssq(m, ("IterativeQualitativeSearchSolver" + vtSuffix).c_str(), "Solver for POMDPs that solves qualitative queries");
    mssq.def("compute_winning_region", &storm::pomdp::MemlessStrategySearchQualitative<ValueType>::computeWinningRegion, py::arg("lookahead"));
    mssq.def_property_readonly("last_winning_region", &storm::pomdp::MemlessStrategySearchQualitative<ValueType>::getLastWinningRegion, "get the last computed winning region");
    py::class_<storm::pomdp::WinningRegionQueryInterface<ValueType>> wrqi(m, ("BeliefSupportWinningRegionQueryInterface" + vtSuffix).c_str());
    wrqi.def(py::init<SparsePomdp <ValueType> const&, storm::pomdp::WinningRegion const&>(), py::arg("pomdp"), py::arg("BeliefSupportWinningRegion"));
    wrqi.def("query_current_belief", &storm::pomdp::WinningRegionQueryInterface<ValueType>::isInWinningRegion, py::arg("current_belief"));
    wrqi.def("query_action",  &storm::pomdp::WinningRegionQueryInterface<ValueType>::staysInWinningRegion, py::arg("current_belief"), py::arg("action"));
 }
 template void define_qualitative_policy_search<double>(py::module& m, std::string const& vtSuffix);
 void define_qualitative_policy_search_nt(py::module& m) {
    py::class_<storm::pomdp::MemlessSearchOptions> mssqopts(m, "IterativeQualitativeSearchOptions", "Options for the IterativeQualitativeSearch");
    mssqopts.def(py::init<>());
    py::class_<storm::pomdp::WinningRegion> winningRegion(m, "BeliefSupportWinningRegion");
 }
--- a/src/pomdp/qualitative_analysis.h
+++ b/src/pomdp/qualitative_analysis.h
@ -0,0 +1,6 @@
 #pragma once
 #include "common.h"
 template<typename VT>
 void define_qualitative_policy_search(py::module& m, std::string const& vtSuffix);
 void define_qualitative_policy_search_nt(py::module& m);
--- a/src/pomdp/tracker.cpp
+++ b/src/pomdp/tracker.cpp
@ -0,0 +1,15 @@
 #include "tracker.h"
 #include "src/helpers.h"
 #include <storm-pomdp/generator/BeliefSupportTracker.h>
 template<typename ValueType> using SparsePomdp = storm::models::sparse::Pomdp<ValueType>;
 template<typename ValueType> using SparsePomdpTracker = storm::generator::BeliefSupportTracker<double>;
 void define_tracker(py::module& m) {
    py::class_<storm::generator::BeliefSupportTracker<double>> tracker(m, "BeliefSupportTrackerDouble", "Tracker for BeliefSupports");
    tracker.def(py::init<SparsePomdp<double> const&>(), py::arg("pomdp"));
    tracker.def("get_current_belief_support", &SparsePomdpTracker<double>::getCurrentBeliefSupport, "What is the support given the trace so far");
    tracker.def("track", &SparsePomdpTracker<double>::track, py::arg("action"), py::arg("observation"));
 }
--- a/src/pomdp/tracker.h
+++ b/src/pomdp/tracker.h
@ -0,0 +1,4 @@
 #pragma once
 #include "common.h"
 void define_tracker(py::module& m);