C# (CSharp) Tembo.UpdateNetwork Beispiele

Programmiersprache: C# (CSharp)

Klasse / Typ: Tembo

Methode / Funktion: UpdateNetwork

Beispiele auf hotexamples.com: 1

C# (CSharp) Tembo.UpdateNetwork - 1 Beispiele gefunden. Dies sind die am besten bewerteten C# (CSharp) Beispiele für die Tembo.UpdateNetwork, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

RandomInt(5)

ArrayOfZeros(3)

Assert(3)

Random(3)

GetId(2)

Maxi(2)

RandomMatrix(1)

SampleWeighted(1)

SetConst(1)

UpdateNetwork(1)

Beispiel #1

Datei anzeigen

Datei: DQN.cs Projekt: mbithy/TemboRL

        /// <summary>
        /// OOP advatages adopted during translation...
        /// </summary>
        /// <param name="experience">See Experience</param>
        /// <returns></returns>
        private double LearnFromExperience(Experience experience /*Matrix s0, int a0, double r0, Matrix s1, int a1*/)
        {
            // want: Q(s,a) = r + gamma * max_a' Q(s',a')
            // compute the target Q value
            var tmat = ForwardQ(Network, s1, false);
            var qmax = r0 + Options.Gamma * tmat.W[Tembo.Maxi(tmat.W)];
            // now predict
            var pred    = ForwardQ(Network, s0, true);
            var tderror = pred.W[a0] - qmax;
            var clamp   = Options.ErrorClamp;

            if (Math.Abs(tderror) > clamp)
            {  // huber loss to robustify
                if (tderror > clamp)
                {
                    tderror = clamp;
                }
                if (tderror < -clamp)
                {
                    tderror = -clamp;
                }
            }
            pred.DW[a0] = tderror;
            LastGraph.Backward(); // compute gradients on net params
            // update net
            Tembo.UpdateNetwork(Network, Options.Alpha);
            return(tderror);
        }