C# (CSharp) QLearning.Beginの例

プログラミング言語: C# (CSharp)

クラス/型: QLearning

メソッド/関数: Begin

hotexamples.comのコード掲載数: 1

C# (CSharp) QLearning.Begin - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のQLearning.Beginの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

GetAction(7)

UpdateState(6)

printQTable(3)

resetMemory(2)

LoadModel(2)

Loop(2)

CreateMap(2)

CreateVisualizer(2)

setController(2)

saveReward(2)

New(2)

printRewardList(2)

Reset(2)

loadQTable(2)

RemakeModel(2)

AIStart(1)

Train(1)

getAction(1)

nextStep(1)

getE(1)

init(1)

Start(1)

setE(1)

updateTable(1)

Step(1)

Restart(1)

ShowPolicy(1)

GetSumQValue(1)

Begin(1)

Execute(1)

GetCurrentCell(1)

GetPath(1)

GetQTable(1)

GetReward(1)

GreedyPolicy(1)

SaveModel(1)

IsTraining(1)

Iterate(1)

Move(1)

PrintQLearningStructure(1)

AddState(1)

RestartEpisode(1)

RunTraining(1)

writeTrainingData(1)

コード例 #1

ファイルを表示

ファイル: QLearningTest.cs プロジェクト: kapkapas/ReinforcementLearning

        public void QLearningGridPathTest()
        {
            var random     = new Random(1337);
            var gridSize   = 16;
            var grid       = new int[gridSize, gridSize];
            var ql         = new QLearning(gridSize * gridSize, 4, new EpsilonGreedyExplorationPolicy(0.0), 0.3, 0.8);
            var pathLength = 20;
            var maxReward  = 0.0;

            for (var x = 0; x < gridSize; x++)
            {
                for (var y = 0; y < gridSize; y++)
                {
                    grid[x, y] = random.Next(0, 100);
                }
            }

            // train
            for (var i = 0; i < 100; i++)
            {
                var x             = random.Next(0, gridSize);
                var y             = random.Next(0, gridSize);
                var currentReward = 0.0;

                ql.Begin(x + y * gridSize);

                for (var j = 0; j < pathLength; j++)
                {
                    switch ((Action)ql.SelectedAction)
                    {
                    case Action.UP:
                        y++;
                        break;

                    case Action.DOWN:
                        y--;
                        break;

                    case Action.LEFT:
                        x--;
                        break;

                    case Action.RIGHT:
                        x++;
                        break;
                    }

                    var r = 0;
                    if (x < 0 || x >= gridSize || y < 0 || y >= gridSize)
                    {
                        x = x < 0 ? 0 : x >= gridSize ? gridSize - 1 : x;
                        y = y < 0 ? 0 : y >= gridSize ? gridSize - 1 : y;
                    }
                    else
                    {
                        r = grid[x, y];
                    }

                    currentReward += r;

                    var nextState = x + y * gridSize;
                    ql.Step(r, nextState);
                }

                if (currentReward > maxReward)
                {
                    maxReward = currentReward;
                }
            }

            Assert.AreEqual(896, maxReward);
        }