Esempi in C# (CSharp) per TrainerDQLSimple.Record

Linguaggio di programmazione: C# (CSharp)

Classe/tipologia: TrainerDQLSimple

Metodo/funzione: Record

Esempi su hotexamples.com: 2

TrainerDQLSimple.Record in C# (CSharp): 2 esempi trovati. Questi sono i migliori esempi reali in C# (CSharp) per TrainerDQLSimple.Record, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Record(2)

Step(2)

TrainRandomBatch(2)

SetLearningRate(1)

Esempio n. 1

Mostra file

    protected void RunStep()
    {
        trainer.Step(environment);
        rewardOneEpi += environment.LastReward(0);
        bool reset = trainer.Record(environment);

        //training
        if (trainer.Steps >= stepsBeforeTrain && trainer.Steps % trainingStepInterval == 0)
        {
            trainer.TrainRandomBatch(batchSize);

            //log the loss
            loss.AddValue(trainer.LastLoss);
            if (loss.JustUpdated)
            {
                print("Loss:" + loss.Average);
            }
        }
        //reset if end
        if (environment.IsEnd() || (reset && training))
        {
            currentEpisode++;
            rewardEpiAve.AddValue(rewardOneEpi);
            rewardOneEpi = 0;
            environment.Reset();
        }
    }

Esempio n. 2

Mostra file

    protected void RunStep()
    {
        trainer.Step(environment);
        rewardLeftOneEpi += environment.LastReward(0);
        bool reset = trainer.Record(environment);

        //training
        if (trainer.Steps >= stepsBeforeTrain && trainer.Steps % trainingStepInterval == 0)
        {
            trainer.TrainRandomBatch(batchSize);

            //log the loss
            loss.AddValue(trainer.LastLoss);
            if (loss.JustUpdated)
            {
                print("Loss:" + loss.Average);
            }
        }
        //reset if end
        if (environment.IsEnd() || (reset && training))
        {
            currentEpisode++;
            if (environment.GameWinPlayer == 0)
            {
                leftWin++;
                winningRate50Left.AddValue(1);
            }
            else
            {
                rightWin++;
                winningRate50Left.AddValue(0);
            }
            reward50EpiLeft.AddValue(rewardLeftOneEpi);
            rewardLeftOneEpi = 0;
            environment.Reset();
        }
    }