C# (CSharp) LostTech.Gradient.Samples RepeatObservationEnvironmentの例

プログラミング言語: C# (CSharp)

名前空間/パッケージ名: LostTech.Gradient.Samples

hotexamples.comのコード掲載数: 2

C# (CSharp) LostTech.Gradient.Samples RepeatObservationEnvironment - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のLostTech.Gradient.Samples.RepeatObservationEnvironmentの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

GetStepResult(1)

Reset(1)

SanityCheck(1)

SetActions(1)

Step(1)

コード例 #1

ファイルを表示

ファイル: Program.cs プロジェクト: molekm/Gradient-Samples

        static void RunRepeat()
        {
            RepeatObservationEnvironment.SanityCheck();

            var       random       = new Random();
            const int RepeatAgents = 3;

            ndarray RepeatRandomActionSampler()
            => ndarray.FromList(Range(0, RepeatAgents)
                                .Select(_ => (float)random.NextDouble() * 2 - 1)
                                .ToList())
            .reshape(new int[] { RepeatAgents, 1 })
            .AsArray <float>();

            SoftActorCritic.SoftActorCritic.Run(new RepeatObservationEnvironment(RepeatAgents),
                                                agentGroup: null,
                                                actorCriticFactory: ActorCriticFactory,
                                                observationDimensions: 1,
                                                actionDimensions: 1,
                                                actionLimit: 1,
                                                feedFrames: 1,
                                                hiddenSizes: new int[] { 32 },
                                                maxEpisodeLength: 256,
                                                replaySize: 1024 * 1024 / 8,
                                                learningRate: 2e-4f,
                                                startSteps: 100,
                                                actionSampler: RepeatRandomActionSampler);
        }

コード例 #2

ファイルを表示

ファイル: RepeatObservationEnvironment.cs プロジェクト: molekm/Gradient-Samples

        public static void SanityCheck()
        {
            // sanity check
            var env = new RepeatObservationEnvironment(agents: 3);

            env.Reset();
            env.Step();
            for (int episode = 0; episode < 100; episode++)
            {
                var observation = (ndarray)env.GetStepResult(null).Item1.obs[0];
                env.SetActions(null, observation);
                env.Step();
                var  step    = env.GetStepResult(null);
                var  success = step.Item1.reward >= 1.99f;
                bool allPass = success.all();
                Trace.Assert(allPass);
            }
        }