Esempi in C# (CSharp) per ExplorationPolicy.SelectAction

Linguaggio di programmazione: C# (CSharp)

Classe/tipologia: ExplorationPolicy

Metodo/funzione: SelectAction

Esempi su hotexamples.com: 4

ExplorationPolicy.SelectAction in C# (CSharp): 4 esempi trovati. Questi sono i migliori esempi reali in C# (CSharp) per ExplorationPolicy.SelectAction, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

SelectAction(4)

ChooseAction(1)

Esempio n. 1

Mostra file

        public void Step(double reward, int nextState)
        {
            var nextAction = ExplorationPolicy.SelectAction(_q[nextState]);

            var target = reward + DiscountFactor * _q[nextState][nextAction];
            var delta  = target - _q[CurrentState][SelectedAction];

            _q[CurrentState][SelectedAction] += LearningRate * delta;

            CurrentState   = nextState;
            SelectedAction = ExplorationPolicy.SelectAction(_q[CurrentState]);
        }

Esempio n. 2

Mostra file

File: DynaQ.cs Progetto: kapkapas/ReinforcementLearning

        public void Step(double reward, int nextState)
        {
            if (!_visited.ContainsKey(CurrentState))
            {
                var actions = new HashSet <int>();
                actions.Add(SelectedAction);
                _visited[CurrentState] = actions;
            }

            UpdateQ(reward, nextState);
            Plan();

            CurrentState   = nextState;
            SelectedAction = ExplorationPolicy.SelectAction(_q[CurrentState]);
        }

Esempio n. 3

Mostra file

        public void Step(double reward, int nextState)
        {
            var bestNext = _q[nextState][0];

            for (var i = 1; i < ActionCount; i++)
            {
                if (_q[nextState][i] > bestNext)
                {
                    bestNext = _q[nextState][i];
                }
            }

            var target = reward + DiscountFactor * bestNext;
            var delta  = target - _q[CurrentState][SelectedAction];

            _q[CurrentState][SelectedAction] += LearningRate * delta;

            CurrentState   = nextState;
            SelectedAction = ExplorationPolicy.SelectAction(_q[CurrentState]);
        }

Esempio n. 4

Mostra file

 public void Begin(int state)
 {
     CurrentState   = state;
     SelectedAction = ExplorationPolicy.SelectAction(_q[CurrentState]);
 }