C# (CSharp) Aima.Core.Probability.Decision MDPUtilityFunction.Copy Beispiele

Programmiersprache: C# (CSharp)

Namespace / Paketname: Aima.Core.Probability.Decision

Klasse / Typ: MDPUtilityFunction

Methode / Funktion: Copy

Beispiele auf hotexamples.com: 2

C# (CSharp) Aima.Core.Probability.Decision MDPUtilityFunction.Copy - 2 Beispiele gefunden. Dies sind die am besten bewerteten C# (CSharp) Beispiele für die Aima.Core.Probability.Decision.MDPUtilityFunction.Copy, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

SetUtility(4)

Copy(2)

GetUtility(2)

Häufig verwendete Methoden

SetUtility (4)

Copy (2)

GetUtility (2)

Beispiel #1

Datei anzeigen

Datei: MDP.cs Projekt: hackerlank/trunk-chatbot

        public MDPUtilityFunction <TState> PolicyEvaluation(
            MDPPolicy <TState, TAction> pi,
            MDPUtilityFunction <TState> u, double gamma, int iterations)
        {
            var uDash = u.Copy();

            for (var i = 0; i < iterations; i++)
            {
                uDash = this.ValueIterateOnceWith(gamma, pi, uDash);
            }
            return(uDash);
        }

Beispiel #2

Datei anzeigen

Datei: MDP.cs Projekt: hackerlank/trunk-chatbot

        private MDPUtilityFunction <TState> ValueIterateOnceWith(double gamma,
                                                                 MDPPolicy <TState, TAction> pi,
                                                                 MDPUtilityFunction <TState> U)
        {
            MDPUtilityFunction <TState> uDash = U.Copy();

            foreach (var s in this.nonFinalstates)
            {
                var highestPolicyTransition =
                    this.transitionModel.GetTransitionWithMaximumExpectedUtilityUsingPolicy(pi, s, U);
                double utility = rewardFunction.GetRewardFor(s)
                                 + (gamma * highestPolicyTransition.GetSecond());
                uDash.SetUtility(s, utility);
            }
            // TODO: debugging code
            // System.out.println("ValueIterationOnce before " + U);
            // System.out.println("ValueIterationOnce after " + U_dash);
            return(uDash);
        }