C# (CSharp) IProblem.AvailableActions примеры использования

Язык программирования: C# (CSharp)

Класс/Тип: IProblem

Метод/Функция: AvailableActions

Примеров на hotexamples.com: 4

C# (CSharp) IProblem.AvailableActions - 4 примера найдено. Это лучшие примеры C# (CSharp) кода для IProblem.AvailableActions, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Expand(11)

Copy(6)

AllStates(5)

CreatePath(5)

ApplyAction(4)

AvailableActions(4)

Execute(4)

Actions(4)

ClearJobSequence(3)

Evaluate(3)

CalculateLengths(3)

ErrorFunction(3)

Compare(2)

Clone(2)

CalculateFitness(2)

CheckWinner(2)

CheckDistance(2)

CreateReletionUnit(1)

Delete(1)

Accumulate(1)

EstimatedCostToGoal(1)

Display(1)

Eval(1)

GetProblemDescription(1)

CreateProblemContract(1)

CompareStatesPriority(1)

CreateChromosome(1)

CountOfConflicts(1)

CountDistancesToGoal(1)

ConvertToSymmetric(1)

CompareStatesPriorityWithPathCost(1)

Codec(1)

CheckAnswer(1)

CalculatePriorityForAStar(1)

CalculateDistanceToDestinyCity(1)

CalculateCostToNextState(1)

Begin(1)

Answer(1)

AddVirtualDepot(1)

GetProblemNumber(1)

Пример #1

Показать файл

        private static TAction FindBestAction(
            IProblem <TState, TAction> problem,
            TState state,
            ValueTable <TState, TAction> valueTable,
            IRewarder <TState, TAction> rewarder)
        {
            var maxActionValue = double.MinValue;
            var maxAction      = default(TAction);

            foreach (var action in problem.AvailableActions(state))
            {
                var actionValue = 0.0;

                foreach (var(nextState, pNextState) in problem.PossibleStates(state, action))
                {
                    var nextStateValue = valueTable.Value(nextState);
                    var reward         = rewarder.Reward(state, nextState, action);

                    actionValue += pNextState * (reward + nextStateValue);
                }

                if (actionValue > maxActionValue)
                {
                    maxActionValue = actionValue;
                    maxAction      = action;
                }
            }

            return(maxAction);
        }

Пример #2

Показать файл

        public TAction Action(TState state)
        {
            const double approxOne = 1 - double.Epsilon;

            return(_problem
                   .AvailableActions(state)
                   .FirstOrDefault(action => PAction(state, action) >= approxOne));
        }

Пример #3

Показать файл

        public double PAction(TState state, TAction action)
        {
            var numActions = _problem.AvailableActions(state).Count();

            if (numActions == 0)
            {
                return(0.0);
            }

            return(1.0 / numActions);
        }

Пример #4

Показать файл

        private double CalculateValue(
            TState state,
            IPolicy <TState, TAction> policy,
            IRewarder <TState, TAction> rewarder)
        {
            var newValue = 0.0;

            foreach (var action in _problem.AvailableActions(state))
            {
                foreach (var(nextState, pNextState) in _problem.PossibleStates(state, action))
                {
                    var reward = rewarder.Reward(state, nextState, action);
                    newValue +=
                        policy.PAction(state, action)
                        * pNextState
                        * (reward + Value(nextState));
                }
            }

            return(newValue);
        }