code skeleton for multi-dimensional reward unfolding

9 years ago · 7c23aab43c
4 changed files with 206 additions and 61 deletions
--- a/src/storm/modelchecker/multiobjective/pcaa/SparseMdpPcaaWeightVectorChecker.cpp
+++ b/src/storm/modelchecker/multiobjective/pcaa/SparseMdpPcaaWeightVectorChecker.cpp
@ -115,62 +115,33 @@ namespace storm {
                }
            }
            
-            
            template <class SparseMdpModelType>
            void SparseMdpPcaaWeightVectorChecker<SparseMdpModelType>::boundedPhaseWithRewardBounds(std::vector<ValueType> const& weightVector, std::vector<ValueType>& weightedRewardVector) {
-                STORM_LOG_THROW(false, storm::exceptions::NotSupportedException, "Multi-objective model checking with reward bounded objectives is not supported.");
-            }
-            
-            template<class SparseModelType>
-            void SparseMdpPcaaWeightVectorChecker<SparseModelType>::discretizeRewardBounds() {
+                if (!rewardUnfolding) {
+                    rewardUnfolding = std::make_unique<MultiDimensionalRewardUnfolding<ValueType>>(this->model, this->objectives, this->possibleECActions, this->possibleBottomStates);
+                }
+                auto initEpoch = rewardUnfolding->getStartEpoch();
+                auto epochOrder = rewardUnfolding->getEpochComputationOrder(initEpoch);
+                for (auto const& epoch : epochOrder) {
+                    computeEpochSolution(epoch, weightVector);
+                }
                
-                std::map<std::string, uint_fast64_t> rewardModelNameToDimension;
-                objIndexToRewardDimensionMapping = std::vector<uint_fast64_t>(this->objectives.size(), std::numeric_limits<uint_fast64_t>::max());
+                auto solution = rewardUnfolding->getEpochSolution(initEpoch);
+                this->weightedResult = solution.weightedValues;
+                this->objectiveResults = solution.objectiveValues;
                
-                // Collect the reward models that occur as reward bound
-                uint_fast64_t dimensionCount = 0;
-                for (uint_fast64_t objIndex = 0; objIndex < this->objectives.size(); ++objIndex) {
-                    auto const& obj = this->objectives[objIndex];
-                    if (obj.timeBoundReference && obj.timeBoundReference->isRewardBound()) {
-                        auto insertionRes = rewardModelNameToDimension.insert(std::make_pair(obj.timeBoundReference->getRewardName(), dimensionCount));
-                        objIndexToRewardDimensionMapping[objIndex] = insertionRes.first->second;
-                        if (insertionRes.second) {
-                            ++dimensionCount;
-                        }
-                    }
-                }
-
-                // Now discretize each reward
-                discretizedActionRewards.reserve(dimensionCount);
-                discretizedRewardBounds = std::vector<uint_fast64_t>(this->objectives.size(), 0);
-                for (auto const& rewardName : rewardModelNameToDimension) {
-                    STORM_LOG_THROW(this->model.hasRewardModel(rewardName.first), storm::exceptions::IllegalArgumentException, "No reward model with name '" << rewardName.first << "' found.");
-                    auto const& rewardModel = this->model.getRewardModel(rewardName.first);
-                    STORM_LOG_THROW(!rewardModel.hasTransitionRewards(), storm::exceptions::NotSupportedException, "Transition rewards are currently not supported.");
-                    std::vector<typename RewardModelType::ValueType> actionRewards = rewardModel.getTotalRewardVector(this->model.getTransitionMatrix());
-                    auto discretizedRewardsAndFactor = storm::utility::vector::toIntegralVector<typename RewardModelType::ValueType, uint_fast64_t>(actionRewards);
-   
-                    discretizedActionRewards.push_back(std::move(discretizedRewardsAndFactor.first));
-                    // Find all objectives that reffer to this reward model and apply the discretization factor to the reward bounds
-                    for (uint_fast64_t objIndex = 0; objIndex < objIndexToRewardDimensionMapping.size(); ++objIndex) {
-                        if (objIndexToRewardDimensionMapping[objIndex] == rewardName.second) {
-                            auto const& obj = this->objectives[objIndex];
-                            STORM_LOG_THROW(!obj.lowerTimeBound, storm::exceptions::NotSupportedException, "Lower time bounds are not supported.");
-                            STORM_LOG_THROW(obj.upperTimeBound, storm::exceptions::UnexpectedException, "Got formula with a bound reference but no bound.");
-                            STORM_LOG_THROW(!obj.upperTimeBound->getBound().containsVariables(), storm::exceptions::UnexpectedException, "The upper bound of a reward bounded formula still contains variables.");
-                            typename RewardModelType::ValueType discretizedBound = storm::utility::convertNumber<typename RewardModelType::ValueType>(obj.upperTimeBound->getBound().evaluateAsRational());
-                            discretizedBound /= discretizedRewardsAndFactor.second;
-                            if (obj.upperTimeBound->isStrict() && discretizedBound == storm::utility::floor(discretizedBound)) {
-                                discretizedBound = storm::utility::floor(discretizedBound) - storm::utility::one<ValueType>();
-                            } else {
-                                discretizedBound = storm::utility::floor(discretizedBound);
-                            }
-                            discretizedRewardBounds[objIndex] = storm::utility::convertNumber<uint_fast64_t>(discretizedBound);
-                        }
-                    }
+                for (uint64_t objIndex = 0; objIndex < this->objectives.size(); ++objIndex) {
+                    // Todo: we currently assume precise results...
+                    this->offsetsToUnderApproximation[objIndex] = storm::utility::zero<ValueType>();
+                    this->offsetsToOverApproximation[objIndex] = storm::utility::zero<ValueType>();
                }
            }
-            
+    
+            template <class SparseMdpModelType>
+            void SparseMdpPcaaWeightVectorChecker<SparseMdpModelType>::computeEpochSolution(typename MultiDimensionalRewardUnfolding<ValueType>::Epoch const& epoch, std::vector<ValueType> const& weightVector) {
+                // TODO
+            }
+
            
            
            template class SparseMdpPcaaWeightVectorChecker<storm::models::sparse::Mdp<double>>;
--- a/src/storm/modelchecker/multiobjective/pcaa/SparseMdpPcaaWeightVectorChecker.h
+++ b/src/storm/modelchecker/multiobjective/pcaa/SparseMdpPcaaWeightVectorChecker.h
@ -4,6 +4,7 @@
 #include <vector>

 #include "storm/modelchecker/multiobjective/pcaa/SparsePcaaWeightVectorChecker.h"
+#include "storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.h"

 namespace storm {
    namespace modelchecker {
@ -65,18 +66,9 @@ namespace storm {
                 */
                void boundedPhaseWithRewardBounds(std::vector<ValueType> const& weightVector, std::vector<ValueType>& weightedRewardVector);
                
+                void computeEpochSolution(typename MultiDimensionalRewardUnfolding<ValueType>::Epoch const& epoch, std::vector<ValueType> const& weightVector);
                
-                /*!
-                 * Discretizes the reward models that occurr at some bounded formula
-                 */
-                void discretizeRewardBounds();
-                
-                
-                
-                
-                std::vector<uint64_t> objIndexToRewardDimensionMapping;
-                std::vector<std::vector<uint64_t>> discretizedActionRewards;
-                std::vector<uint64_t> discretizedRewardBounds;
+                std::unique_ptr<MultiDimensionalRewardUnfolding<ValueType>> rewardUnfolding;

                
            };
--- a/src/storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.cpp
+++ b/src/storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.cpp
@ -0,0 +1,108 @@
+#include "storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.h"
+
+
+namespace storm {
+    namespace modelchecker {
+        namespace multiobjective {
+            
+            template<typename ValueType>
+            MultiDimensionalRewardUnfolding<ValueType>::MultiDimensionalRewardUnfolding(storm::models::sparse::Mdp<ValueType> const& model, std::vector<storm::modelchecker::multiobjective::Objective<ValueType>> const& objectives, storm::storage::BitVector const& possibleECActions, storm::storage::BitVector const& allowedBottomStates) : model(model), objectives(objectives), possibleECActions(possibleECActions), allowedBottomStates(allowedBottomStates) {
+            
+            
+            
+            }
+    
+            template<typename ValueType>
+            typename MultiDimensionalRewardUnfolding<ValueType>::Epoch MultiDimensionalRewardUnfolding<ValueType>::getStartEpoch() {
+                return Epoch();
+            }
+    
+            template<typename ValueType>
+            std::vector<typename MultiDimensionalRewardUnfolding<ValueType>::Epoch> MultiDimensionalRewardUnfolding<ValueType>::getEpochComputationOrder(Epoch const& startEpoch) {
+                return std::vector<Epoch>();
+            }
+    
+            template<typename ValueType>
+            typename MultiDimensionalRewardUnfolding<ValueType>::EpochModel const& MultiDimensionalRewardUnfolding<ValueType>::getModelForEpoch(Epoch const& epoch) {
+                return EpochModel();
+            }
+    
+            template<typename ValueType>
+            void MultiDimensionalRewardUnfolding<ValueType>::setEpochSolution(Epoch const& epoch, EpochSolution const& solution) {
+        
+            }
+    
+            template<typename ValueType>
+            void MultiDimensionalRewardUnfolding<ValueType>::setEpochSolution(Epoch const& epoch, EpochSolution&& solution) {
+        
+            }
+    
+            template<typename ValueType>
+            typename MultiDimensionalRewardUnfolding<ValueType>::EpochSolution const& MultiDimensionalRewardUnfolding<ValueType>::getEpochSolution(Epoch const& epoch) {
+                return EpochSolution();
+            }
+    
+            template<typename ValueType>
+            typename MultiDimensionalRewardUnfolding<ValueType>::EpochClass MultiDimensionalRewardUnfolding<ValueType>::getClassOfEpoch(Epoch const& epoch) {
+                return 0;
+            }
+    
+    
+            /*
+            template<class SparseModelType>
+            void SparseMdpPcaaWeightVectorChecker<SparseModelType>::discretizeRewardBounds() {
+                
+                std::map<std::string, uint_fast64_t> rewardModelNameToDimension;
+                objIndexToRewardDimensionMapping = std::vector<uint_fast64_t>(this->objectives.size(), std::numeric_limits<uint_fast64_t>::max());
+                
+                // Collect the reward models that occur as reward bound
+                uint_fast64_t dimensionCount = 0;
+                for (uint_fast64_t objIndex = 0; objIndex < this->objectives.size(); ++objIndex) {
+                    auto const& obj = this->objectives[objIndex];
+                    if (obj.timeBoundReference && obj.timeBoundReference->isRewardBound()) {
+                        auto insertionRes = rewardModelNameToDimension.insert(std::make_pair(obj.timeBoundReference->getRewardName(), dimensionCount));
+                        objIndexToRewardDimensionMapping[objIndex] = insertionRes.first->second;
+                        if (insertionRes.second) {
+                            ++dimensionCount;
+                        }
+                    }
+                }
+
+                // Now discretize each reward
+                discretizedActionRewards.reserve(dimensionCount);
+                discretizedRewardBounds = std::vector<uint_fast64_t>(this->objectives.size(), 0);
+                for (auto const& rewardName : rewardModelNameToDimension) {
+                    STORM_LOG_THROW(this->model.hasRewardModel(rewardName.first), storm::exceptions::IllegalArgumentException, "No reward model with name '" << rewardName.first << "' found.");
+                    auto const& rewardModel = this->model.getRewardModel(rewardName.first);
+                    STORM_LOG_THROW(!rewardModel.hasTransitionRewards(), storm::exceptions::NotSupportedException, "Transition rewards are currently not supported.");
+                    std::vector<typename RewardModelType::ValueType> actionRewards = rewardModel.getTotalRewardVector(this->model.getTransitionMatrix());
+                    auto discretizedRewardsAndFactor = storm::utility::vector::toIntegralVector<typename RewardModelType::ValueType, uint_fast64_t>(actionRewards);
+   
+                    discretizedActionRewards.push_back(std::move(discretizedRewardsAndFactor.first));
+                    // Find all objectives that reffer to this reward model and apply the discretization factor to the reward bounds
+                    for (uint_fast64_t objIndex = 0; objIndex < objIndexToRewardDimensionMapping.size(); ++objIndex) {
+                        if (objIndexToRewardDimensionMapping[objIndex] == rewardName.second) {
+                            auto const& obj = this->objectives[objIndex];
+                            STORM_LOG_THROW(!obj.lowerTimeBound, storm::exceptions::NotSupportedException, "Lower time bounds are not supported.");
+                            STORM_LOG_THROW(obj.upperTimeBound, storm::exceptions::UnexpectedException, "Got formula with a bound reference but no bound.");
+                            STORM_LOG_THROW(!obj.upperTimeBound->getBound().containsVariables(), storm::exceptions::UnexpectedException, "The upper bound of a reward bounded formula still contains variables.");
+                            typename RewardModelType::ValueType discretizedBound = storm::utility::convertNumber<typename RewardModelType::ValueType>(obj.upperTimeBound->getBound().evaluateAsRational());
+                            discretizedBound /= discretizedRewardsAndFactor.second;
+                            if (obj.upperTimeBound->isStrict() && discretizedBound == storm::utility::floor(discretizedBound)) {
+                                discretizedBound = storm::utility::floor(discretizedBound) - storm::utility::one<ValueType>();
+                            } else {
+                                discretizedBound = storm::utility::floor(discretizedBound);
+                            }
+                            discretizedRewardBounds[objIndex] = storm::utility::convertNumber<uint_fast64_t>(discretizedBound);
+                        }
+                    }
+                }
+            }
+             */
+            
+            template class MultiDimensionalRewardUnfolding<double>;
+            template class MultiDimensionalRewardUnfolding<storm::RationalNumber>;
+            
+        }
+    }
+}
--- a/src/storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.h
+++ b/src/storm/modelchecker/multiobjective/rewardbounded/MultiDimensionalRewardUnfolding.h
@ -0,0 +1,74 @@
+#pragma once
+
+
+#include "storm/storage/BitVector.h"
+#include "storm/storage/SparseMatrix.h"
+#include "storm/modelchecker/multiobjective/Objective.h"
+#include "storm/models/sparse/Mdp.h"
+#include "storm/utility/vector.h"
+
+namespace storm {
+    namespace modelchecker {
+        namespace multiobjective {
+            
+            
+            template<typename ValueType>
+            class MultiDimensionalRewardUnfolding {
+            public:
+                
+                
+                struct EpochModel {
+                    storm::storage::SparseMatrix<ValueType> rewardTransitions;
+                    storm::storage::SparseMatrix<ValueType> intermediateTransitions;
+                    std::vector<std::vector<ValueType>> objectiveRewards;
+                };
+                
+                struct EpochSolution {
+                    std::vector<ValueType> weightedValues;
+                    std::vector<std::vector<ValueType>> objectiveValues;
+                };
+                
+                typedef std::vector<uint64_t> Epoch; // The number of reward steps that are "left" for each dimension
+                typedef uint64_t EpochClass; // Collection of epochs that consider the same epoch model
+                
+                /*
+                 *
+                 * @param model The (preprocessed) model
+                 * @param objectives The (preprocessed) objectives
+                 * @param possibleECActions Overapproximation of the actions that are part of an EC
+                 * @param allowedBottomStates The states which are allowed to become a bottom state under a considered scheduler
+                 *
+                 */
+                MultiDimensionalRewardUnfolding(storm::models::sparse::Mdp<ValueType> const& model,
+                                                        std::vector<storm::modelchecker::multiobjective::Objective<ValueType>> const& objectives,
+                                                        storm::storage::BitVector const& possibleECActions,
+                                                        storm::storage::BitVector const& allowedBottomStates);
+                
+                
+                Epoch getStartEpoch();
+                std::vector<Epoch> getEpochComputationOrder(Epoch const& startEpoch);
+                EpochModel const& getModelForEpoch(Epoch const& epoch);
+                
+                void setEpochSolution(Epoch const& epoch, EpochSolution const& solution);
+                void setEpochSolution(Epoch const& epoch, EpochSolution&& solution);
+                EpochSolution const& getEpochSolution(Epoch const& epoch);
+                
+            private:
+                EpochClass getClassOfEpoch(Epoch const& epoch);
+                
+                
+                storm::models::sparse::Mdp<ValueType> const& model;
+                std::vector<storm::modelchecker::multiobjective::Objective<ValueType>> const& objectives;
+                storm::storage::BitVector possibleECActions;
+                storm::storage::BitVector allowedBottomStates;
+                
+                std::vector<std::pair<std::shared_ptr<storm::logic::Formula const>, uint64_t>> subObjectives;
+                std::vector<std::vector<uint64_t>> scaledRewards;
+                std::vector<ValueType> scalingFactors;
+                
+                std::map<EpochClass, EpochModel> epochModels;
+                std::map<Epoch, EpochSolution> epochSolutions;
+            };
+        }
+    }
+}