Ejemplos de TemporalDifferenceQTrainer en C# (CSharp)

Lenguaje de programación: C# (CSharp)

Clase / Tipo: TemporalDifferenceQTrainer

Ejemplos en hotexamples.com: 3

C# (CSharp) TemporalDifferenceQTrainer - 3 ejemplos encontrados. Estos son los ejemplos en C# (CSharp) del mundo real mejor valorados de TemporalDifferenceQTrainer extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Predict(3)

TrainWithHistory(3)

AlterRewardWeights(2)

GetHistorySaveData(1)

SetEpsilon(1)

Ejemplo n.º 1

Mostrar archivo

        void Start()
        {
            model = new MotionGenerator.Algorithm.Reinforcement.Models.Simple4Layer(
                inputDimention: 1, outputDimention: 5, hiddenDimention: 30);
            trainer = new MotionGenerator.Algorithm.Reinforcement.TemporalDifferenceQTrainer(
                epsilon: 0.3f, qNetwork: model, historySize: 100000, discountRatio: 0.9f, actionDimention: 5,
                replaySize: 32, rewardWeights: new[] { 1f });
            state = Matrix <float> .Build.DenseDiagonal(1, 0);

            lastReward = 0f;
        }

Ejemplo n.º 2

Mostrar archivo

        private void CreateTrainer(int inputDimention)
        {
            if (_inputDimention != inputDimention)
            {
                _inputDimention = inputDimention;
                _model.AlterInputDimention(inputDimention);
            }

            _trainer = new MotionGenerator.Algorithm.Reinforcement.TemporalDifferenceQTrainer(
                epsilon: _randomActionProbability, qNetwork: _model,
                historySize: _historySize, discountRatio: _discountRatio, actionDimention: Actions.Count,
                replaySize: 32, alpha: _optimizerAlpha, rewardWeights: _soulWeights, optimizerType: _optimizerType,
                enableRandomForgetting: _enableRandomForgetting,
                initialHistory: _historySaveData != null
                    ? _historySaveData.Select(x => x.Instantiate()).ToList()
                    : null
                );

            _historySaveData = null; //FIXME(kogaki): _historySaveDataをインスタンス変数に持たないようにしたい
        }

Ejemplo n.º 3

Mostrar archivo

        void Start()
        {
            _logger = new TSVLogger();

            if (IsMultiSoulModel)
            {
                model = new MotionGenerator.Algorithm.Reinforcement.Models.Simple4Layer(
                    inputDimention: 1, outputDimention: 5 * _soulWeights.Length, hiddenDimention: 30 * 2);
                trainer = new MotionGenerator.Algorithm.Reinforcement.TemporalDifferenceQTrainer(
                    epsilon: 0.3f, qNetwork: model, historySize: 100000, discountRatio: 0.9f, actionDimention: 5,
                    replaySize: 32, rewardWeights: _soulWeights, alpha: 0.01f);
            }
            else
            {
                model = new MotionGenerator.Algorithm.Reinforcement.Models.Simple4Layer(
                    inputDimention: 1, outputDimention: 5, hiddenDimention: 30 * 2);
                trainer = new MotionGenerator.Algorithm.Reinforcement.TemporalDifferenceQTrainer(
                    epsilon: 0.3f, qNetwork: model, historySize: 100000, discountRatio: 0.9f, actionDimention: 5,
                    replaySize: 32, rewardWeights: new[] { 1f }, alpha: 0.01f);
            }

            state = Matrix <float> .Build.DenseDiagonal(1, 0);
        }