C# (CSharp) Lucene.Net.Analysis.Miscellaneous CodepointCountFilter Beispiele

Programmiersprache: C# (CSharp)

Namespace / Paketname: Lucene.Net.Analysis.Miscellaneous

Beispiele auf hotexamples.com: 4

C# (CSharp) Lucene.Net.Analysis.Miscellaneous CodepointCountFilter - 4 Beispiele gefunden. Dies sind die am besten bewerteten C# (CSharp) Beispiele für die Lucene.Net.Analysis.Miscellaneous.CodepointCountFilter, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Dispose(1)

End(1)

IncrementToken(1)

Reset(1)

Removes words that are too long or too short from the stream.

Note: Length is calculated as the number of Unicode codepoints.

Inheritance: Lucene.Net.Analysis.Util.FilteringTokenFilter

CodepointCountFilter Class Documentation

Beispiel #1

Datei anzeigen

        public virtual void TestFilterWithPosIncr()
        {
            TokenStream          stream = new MockTokenizer(new StringReader("short toolong evenmuchlongertext a ab toolong foo"), MockTokenizer.WHITESPACE, false);
            CodepointCountFilter filter = new CodepointCountFilter(TEST_VERSION_CURRENT, stream, 2, 6);

            AssertTokenStreamContents(filter, new string[] { "short", "ab", "foo" }, new int[] { 1, 4, 2 });
        }

Beispiel #2

Datei anzeigen

Datei: TestCodepointCountFilter.cs Projekt: simixsistemas/lucenenet

 public virtual void TestRandomStrings()
 {
     for (int i = 0; i < 10000; i++)
     {
         string text = TestUtil.RandomUnicodeString(Random, 100);
         int min = TestUtil.NextInt32(Random, 0, 100);
         int max = TestUtil.NextInt32(Random, 0, 100);
         int count = text.CodePointCount(0, text.Length);
         if (min > max)
         {
             int temp = min;
             min = max;
             max = temp;
         }
         bool expected = count >= min && count <= max;
         TokenStream stream = new KeywordTokenizer(new StringReader(text));
         stream = new CodepointCountFilter(TEST_VERSION_CURRENT, stream, min, max);
         stream.Reset();
         assertEquals(expected, stream.IncrementToken());
         stream.End();
         stream.Dispose();
     }
 }

Beispiel #3

Datei anzeigen

Datei: TestCodepointCountFilter.cs Projekt: ChristopherHaws/lucenenet

 public virtual void TestRandomStrings()
 {
     for (int i = 0; i < 10000; i++)
     {
         string text = TestUtil.RandomUnicodeString(Random(), 100);
         int min = TestUtil.NextInt(Random(), 0, 100);
         int max = TestUtil.NextInt(Random(), 0, 100);
         int count = Character.CodePointCount(text, 0, text.Length);// text.codePointCount(0, text.Length);
         if (min > max)
         {
             int temp = min;
             min = max;
             max = temp;
         }
         bool expected = count >= min && count <= max;
         TokenStream stream = new KeywordTokenizer(new StringReader(text));
         stream = new CodepointCountFilter(TEST_VERSION_CURRENT, stream, min, max);
         stream.Reset();
         assertEquals(expected, stream.IncrementToken());
         stream.End();
         stream.Dispose();
     }
 }

Beispiel #4

Datei anzeigen

Datei: TestCodepointCountFilter.cs Projekt: ChristopherHaws/lucenenet

 public virtual void TestFilterWithPosIncr()
 {
     TokenStream stream = new MockTokenizer(new StringReader("short toolong evenmuchlongertext a ab toolong foo"), MockTokenizer.WHITESPACE, false);
     CodepointCountFilter filter = new CodepointCountFilter(TEST_VERSION_CURRENT, stream, 2, 6);
     AssertTokenStreamContents(filter, new string[] { "short", "ab", "foo" }, new int[] { 1, 4, 2 });
 }