C# (CSharp) BTMMAlgorithm.StrongOfAction 예제들

프로그래밍 언어: C# (CSharp)

클래스/타입: BTMMAlgorithm

메소드/함수: StrongOfAction

hotexamples.com에서의 예제들: 2

C# (CSharp) BTMMAlgorithm.StrongOfAction - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 BTMMAlgorithm.StrongOfAction에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

IsModelReady(2)

StrongOfAction(2)

LoadTrainedData(1)

TrainGameRecord(1)

예제 #1

파일 보기

        // Phase 2: EXPANSION kết hợp dữ liệu BTMM trained
        public static Node ExpandChildBTMM(this Node node)
        {
            // Tính & Lưu lại child Strength, để ko cần tính lại khi expand
            // Cộng child strength để tính allChildStrength luôn
            if (node.ChildStrengths == null)
            {
                node.ChildStrengths = new Dictionary <ulong, double>(node.UntriedMoves.Count);
                double allChildStrength = 0;
                foreach (var bitMove in node.UntriedMoves)
                {
                    double strength = BTMMAlgorithm.StrongOfAction(node.State, bitMove);
                    node.ChildStrengths.Add(bitMove, strength);
                    allChildStrength += strength;
                }

                node.AllChildStrength = allChildStrength;
            }

            // Expand random child
            var i    = Constant.Random.Next(node.UntriedMoves.Count);
            var move = node.UntriedMoves[i];

            node.UntriedMoves.RemoveAt(i); // Untried -> Try

            var newState = node.State.Clone().NextState(move);
            var child    = new Node(newState, node, move);

            child.Strength = node.ChildStrengths[move]; // dùng lại child strength đã được tính trước đó
            node.ChildNodes.Add(child);

            return(child);
        }

예제 #2

파일 보기

        // Distribute probability based on Roulette wheel method
        private static ulong RouletteWheelSelection(this State state)
        {
            // Nếu chỉ có 1 legal move => trả về legal move đó luôn
            if (state.BitLegalMoves.PopCount() == 1)
            {
                return(state.BitLegalMoves);
            }

            // Có từ 2 legal moves trở lên mới cần tính roulette wheel
            var listLegalMoves = state.GetArrayLegalMoves();
            var moveCount      = listLegalMoves.Length;
            var wheel          = new int[moveCount];
            var maxWheel       = 0;

            for (var i = 0; i < moveCount; i++)
            {
                // StrongOfAction trả về giá trị nằm trong khoảng [0.01, 100], nên nhân 1000 để cast int chính xác hơn
                // Câu trên SAI: Gamma nằm mới nằm trong khoảng [0.01, 100], còn strong thì được nhân bởi 1 hoặc nhiều gamma
                var temp = (int)(1000 * BTMMAlgorithm.StrongOfAction(state, listLegalMoves[i]));
                maxWheel += temp;
                wheel[i]  = maxWheel;
            }

            var selectPos = Constant.Random.Next(0, maxWheel);

            for (var i = 0; i < moveCount; i++)
            {
                if (selectPos <= wheel[i])
                {
                    return(listLegalMoves[i]);
                }
            }

            return(0UL);
        }