C# (CSharp) Assets.Scripts.Penpenpng HandleAction 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: Assets.Scripts.Penpenpng

클래스/타입: HandleAction

hotexamples.com에서의 예제들: 5

C# (CSharp) Assets.Scripts.Penpenpng HandleAction - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 Assets.Scripts.Penpenpng.HandleAction에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ToRawAction(1)

예제 #1

파일 보기

파일: main.cs 프로젝트: high-moctane/RLFighter

        void Learn(PolarCoord s1, HandleAction a, PolarCoord s2, float reward)
        {
            const float alpha = 0.1f;
            const float gamma = 0.99f;

            QTable[s1][a] += alpha * (reward + gamma * QTable[s2].Values.Max() - QTable[s1][a]);
        }

예제 #2

파일 보기

파일: main.cs 프로젝트: high-moctane/RLFighter

        public override Actions RunStep(States states)
        {
            PolarCoord   nowState = (PolarCoord)StateFactory.FromRawState(states);
            HandleAction decision = (HandleAction)ActionFactory.Random();

            Debug(nowState.DebugStr());

            if (states.episode_i == CurrentEpisode)
            {
                Store(PrevState, PrevAction, nowState);
                Learn();

                decision = Policy(nowState);
            }
            else
            {
                CurrentEpisode = states.episode_i;
            }

            PrevState  = nowState;
            PrevAction = decision;

            bool shoot = states.bullet_num2 != 0 && nowState.RawAbsPhi < 60;

            return(decision.ToRawAction(shoot));
        }

예제 #3

파일 보기

파일: main.cs 프로젝트: watabe951/RLFighter

        float Reward(PolarCoord s1, HandleAction a, PolarCoord s2)
        {
            float reward = 0;

            reward += -(s2.RawAbsPhi / 180f * 10f);
            reward += s2.RawAbsTheta / 180f * 10f;
            reward += s2.RawDistance > 800 ? -20 : 0;
            return(reward);
        }

예제 #4

파일 보기

파일: main.cs 프로젝트: high-moctane/RLFighter

        void Store(PolarCoord s1, HandleAction a, PolarCoord s2)
        {
            const int bufsize = 1000;

            History.Add(new Step <PolarCoord, HandleAction>(s1, a, s2));
            if (History.Count() > bufsize)
            {
                History.RemoveAt(0);
            }
        }

예제 #5

파일 보기

파일: main.cs 프로젝트: high-moctane/RLFighter

 float Reward(PolarCoord s1, HandleAction a, PolarCoord s2)
 {
     return(-s2.AbsPhi + s2.AbsTheta + s2.Distance * (s2.RawAbsTheta < 90 ? -1 : 1));
 }