C# (CSharp) AIMA.Core.Probability.Decision MDPUtilityFunction.setUtility примеры использования

Язык программирования: C# (CSharp)

Пространство имен/Пакет: AIMA.Core.Probability.Decision

Класс/Тип: MDPUtilityFunction

Метод/Функция: setUtility

Примеров на hotexamples.com: 5

C# (CSharp) AIMA.Core.Probability.Decision MDPUtilityFunction.setUtility - 5 примеров найдено. Это лучшие примеры C# (CSharp) кода для AIMA.Core.Probability.Decision.MDPUtilityFunction.setUtility, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

setUtility(5)

copy(3)

getUtility(3)

Основные методы

setUtility (5)

copy (3)

getUtility (3)

Пример #1

Показать файл

Файл: MDP.cs Проект: claudiu04/AIMA.Net

        public Pair <MDPUtilityFunction <STATE_TYPE>, Double> valueIterateOnce(
            double gamma, MDPUtilityFunction <STATE_TYPE> presentUtilityFunction)
        {
            double maxUtilityGrowth = 0.0;
            MDPUtilityFunction <STATE_TYPE> newUtilityFunction = new MDPUtilityFunction <STATE_TYPE>();

            foreach (STATE_TYPE s in nonFinalstates)
            {
                // double utility = rewardFunction.getRewardFor(s)
                // + (gamma * highestUtilityTransition.getSecond());

                double utility = valueIterateOnceForGivenState(gamma,
                                                               presentUtilityFunction, s);

                double differenceInUtility = Math.Abs(utility
                                                      - presentUtilityFunction.getUtility(s));
                if (differenceInUtility > maxUtilityGrowth)
                {
                    maxUtilityGrowth = differenceInUtility;
                }
                newUtilityFunction.setUtility(s, utility);

                foreach (STATE_TYPE state in terminalStates)
                {
                    newUtilityFunction.setUtility(state, presentUtilityFunction
                                                  .getUtility(state));
                }
            }

            return(new Pair <MDPUtilityFunction <STATE_TYPE>, Double>(
                       newUtilityFunction, maxUtilityGrowth));
        }

Пример #2

Показать файл

Файл: MDP.cs Проект: claudiu04/AIMA.Net

        public MDPUtilityFunction <STATE_TYPE> valueIteration(double gamma,
                                                              double error, double delta)
        {
            MDPUtilityFunction <STATE_TYPE> U      = initialUtilityFunction();
            MDPUtilityFunction <STATE_TYPE> U_dash = initialUtilityFunction();
            double delta_max = (error * gamma) / (1 - gamma);

            do
            {
                U = U_dash.copy();
                // System.Console.WriteLine(U);
                delta = 0.0;
                foreach (STATE_TYPE s in nonFinalstates)
                {
                    Pair <ACTION_TYPE, Double> highestUtilityTransition = transitionModel
                                                                          .getTransitionWithMaximumExpectedUtility(s, U);
                    double utility = rewardFunction.getRewardFor(s)
                                     + (gamma * highestUtilityTransition.getSecond());
                    U_dash.setUtility(s, utility);
                    if ((Math.Abs(U_dash.getUtility(s) - U.getUtility(s))) > delta)
                    {
                        delta = Math.Abs(U_dash.getUtility(s) - U.getUtility(s));
                    }
                }
            } while (delta < delta_max);
            return(U);
        }

Пример #3

Показать файл

Файл: MDPRewardFunction.cs Проект: claudiu04/AIMA.Net

        public MDPUtilityFunction <STATE_TYPE> asUtilityFunction()
        {
            MDPUtilityFunction <STATE_TYPE> uf = new MDPUtilityFunction <STATE_TYPE>();

            foreach (STATE_TYPE state in stateToReward.Keys)
            {
                uf.setUtility(state, getRewardFor(state));
            }
            return(uf);
        }

Пример #4

Показать файл

Файл: MDPUtilityFunction.cs Проект: claudiu04/AIMA.Net

        public MDPUtilityFunction <STATE_TYPE> copy()
        {
            MDPUtilityFunction <STATE_TYPE> other = new MDPUtilityFunction <STATE_TYPE>();

            foreach (STATE_TYPE state in hash.Keys)
            {
                other.setUtility(state, hash[state]);
            }
            return(other);
        }

Пример #5

Показать файл

Файл: MDP.cs Проект: claudiu04/AIMA.Net

        private MDPUtilityFunction <STATE_TYPE> valueIterateOnceWith(double gamma,
                                                                     MDPPolicy <STATE_TYPE, ACTION_TYPE> pi,
                                                                     MDPUtilityFunction <STATE_TYPE> U)
        {
            MDPUtilityFunction <STATE_TYPE> U_dash = U.copy();

            foreach (STATE_TYPE s in nonFinalstates)
            {
                Pair <ACTION_TYPE, Double> highestPolicyTransition = transitionModel
                                                                     .getTransitionWithMaximumExpectedUtilityUsingPolicy(pi, s,
                                                                                                                         U);
                double utility = rewardFunction.getRewardFor(s)
                                 + (gamma * highestPolicyTransition.getSecond());
                U_dash.setUtility(s, utility);
            }
            // System.Console.WriteLine("ValueIterationOnce before " + U);
            // System.Console.WriteLine("ValueIterationOnce after " + U_dash);
            return(U_dash);
        }