C# (CSharp) OpenNLP.Tools.Tokenize TokenizationTestResults примеры использования

Язык программирования: C# (CSharp)

Пространство имен/Пакет: OpenNLP.Tools.Tokenize

Примеров на hotexamples.com: 2

C# (CSharp) OpenNLP.Tools.Tokenize TokenizationTestResults - 2 примера найдено. Это лучшие примеры C# (CSharp) кода для OpenNLP.Tools.Tokenize.TokenizationTestResults, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

        public TokenizationTestResults RunAgainstTestData(List <TokenizerTestData> dataPoints)
        {
            var result = new TokenizationTestResults();

            foreach (var dataPoint in dataPoints)
            {
                var sentence          = dataPoint.GetCleanSentence();
                var computedPositions = TokenizePositions(sentence);
                var correctPositions  = dataPoint.GetSpans();

                var nbOfCorrectTokenizations   = computedPositions.Intersect(correctPositions).Count();
                var nbOfIncorrectTokenizations = correctPositions.Except(computedPositions).Count();
                // count the number of tokens due to whitespaces (not relevant for the accuracy of the model)
                var nbOfWhiteSpaceTokens = dataPoint.GetNumberOfWhitespaceOccurencesInSentence() + 1;
                result.NbOfCorrectTokenizations   += Math.Max(nbOfCorrectTokenizations - nbOfWhiteSpaceTokens, 0);
                result.NbOfIncorrectTokenizations += nbOfIncorrectTokenizations;
            }

            return(result);
        }

Пример #2

Показать файл

Файл: AbstractTokenizer.cs Проект: gblosser/OpenNlp

        public TokenizationTestResults RunAgainstTestData(List<TokenizerTestData> dataPoints)
        {
            var result = new TokenizationTestResults();

            foreach (var dataPoint in dataPoints)
            {
                var sentence = dataPoint.GetCleanSentence();
                var computedPositions = TokenizePositions(sentence);
                var correctPositions = dataPoint.GetSpans();

                var nbOfCorrectTokenizations = computedPositions.Intersect(correctPositions).Count();
                var nbOfIncorrectTokenizations = correctPositions.Except(computedPositions).Count();
                // count the number of tokens due to whitespaces (not relevant for the accuracy of the model)
                var nbOfWhiteSpaceTokens = dataPoint.GetNumberOfWhitespaceOccurencesInSentence() + 1;
                result.NbOfCorrectTokenizations += Math.Max(nbOfCorrectTokenizations - nbOfWhiteSpaceTokens, 0);
                result.NbOfIncorrectTokenizations += nbOfIncorrectTokenizations;
            }

            return result;
        }