Ejemplos de CountVectorizer.Fit en C# (CSharp)

Lenguaje de programación: C# (CSharp)

Clase / Tipo: CountVectorizer

Método / Función: Fit

Ejemplos en hotexamples.com: 4

C# (CSharp) CountVectorizer.Fit - 4 ejemplos encontrados. Estos son los ejemplos en C# (CSharp) del mundo real mejor valorados de CountVectorizer.Fit extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Fit(4)

Transform(2)

ExplainParams(1)

Uid(1)

ToString(1)

SetInputCol(1)

Save(1)

Load(1)

GetOutputCol(1)

GetVocabSize(1)

GetMinTF(1)

GetMinDF(1)

GetMaxDF(1)

GetInputCol(1)

GetBinary(1)

FitTransform(1)

build_analyzer(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: CountVectorizerTests.cs Proyecto: sgtHoloToaster/ML-Tools

        public void SortFeaturesByCountWhenApplyingCountLimit()
        {
            // arrange
            var settings = new CountVectorizerSettings
            {
                MaxFeatures = 5
            };

            var target       = new CountVectorizer(settings);
            var trainingData = GetTrainingData();

            target.Fit(trainingData);

            var vectorizerWithoutLimit = GetFittedVectorizer(trainingData);

            IEnumerable <uint> getTopCounts(IEnumerable <IDictionary <string, uint> > tokensCounts) =>
            tokensCounts.SelectMany(kv => kv.Values)
            .OrderByDescending(v => v)
            .Take((int)settings.MaxFeatures);

            var expectedTopCounts = getTopCounts(vectorizerWithoutLimit.Transform(trainingData));

            // act
            var result = target.Transform(trainingData);

            // assert
            var resultTopCounts = getTopCounts(result);

            Assert.Equal(expectedTopCounts, resultTopCounts);
        }

Ejemplo n.º 2

Mostrar archivo

Archivo: CountVectorizerTests.cs Proyecto: sgtHoloToaster/ML-Tools

        public void CanLimitFeaturesCount()
        {
            // arrange
            var settings = new CountVectorizerSettings
            {
                MaxFeatures = 5
            };

            var target       = new CountVectorizer(settings);
            var trainingData = GetTrainingData();

            // act
            target.Fit(trainingData);

            // assert
            Assert.True(target.Vocabulary.Count() == 5);
        }

Ejemplo n.º 3

Mostrar archivo

Archivo: CountVectorizerTests.cs Proyecto: sgtHoloToaster/ML-Tools

        public void CanFit()
        {
            // arrange
            var target       = new CountVectorizer();
            var trainingData = new string[]
            {
                "Some cool text",
                "Another cool text"
            };

            // act
            var res = target.Fit(trainingData);

            // assert
            Assert.Same(target, res);
            Assert.NotNull(res.Vocabulary);
        }

Ejemplo n.º 4

Mostrar archivo

Archivo: CountVectorizerTests.cs Proyecto: sullaspqr/spark

        public void TestCountVectorizer()
        {
            DataFrame input = _spark.Sql("SELECT array('hello', 'I', 'AM', 'a', 'string', 'TO', " +
                                         "'TOKENIZE') as input from range(100)");

            const string inputColumn  = "input";
            const string outputColumn = "output";
            const double minDf        = 1;
            const double minTf        = 10;
            const int    vocabSize    = 10000;
            const bool   binary       = false;

            var countVectorizer = new CountVectorizer();

            countVectorizer
            .SetInputCol(inputColumn)
            .SetOutputCol(outputColumn)
            .SetMinDF(minDf)
            .SetMinTF(minTf)
            .SetVocabSize(vocabSize);

            Assert.IsType <CountVectorizerModel>(countVectorizer.Fit(input));
            Assert.Equal(inputColumn, countVectorizer.GetInputCol());
            Assert.Equal(outputColumn, countVectorizer.GetOutputCol());
            Assert.Equal(minDf, countVectorizer.GetMinDF());
            Assert.Equal(minTf, countVectorizer.GetMinTF());
            Assert.Equal(vocabSize, countVectorizer.GetVocabSize());
            Assert.Equal(binary, countVectorizer.GetBinary());

            using (var tempDirectory = new TemporaryDirectory())
            {
                string savePath = Path.Join(tempDirectory.Path, "countVectorizer");
                countVectorizer.Save(savePath);

                CountVectorizer loadedVectorizer = CountVectorizer.Load(savePath);
                Assert.Equal(countVectorizer.Uid(), loadedVectorizer.Uid());
            }

            Assert.NotEmpty(countVectorizer.ExplainParams());
            Assert.NotEmpty(countVectorizer.ToString());
        }