C# (CSharp) Lucene.Net.Analysis.Hunspell HunspellStemFilter Examples

Programming Language: C# (CSharp)

Namespace/Package Name: Lucene.Net.Analysis.Hunspell

Examples at hotexamples.com: 5

C# (CSharp) Lucene.Net.Analysis.Hunspell HunspellStemFilter - 5 examples found. These are the top rated real world C# (CSharp) examples of Lucene.Net.Analysis.Hunspell.HunspellStemFilter extracted from open source projects. You can rate examples to help us improve the quality of examples.

TokenFilter that uses hunspell affix rules and words to stem tokens. Since hunspell supports a word having multiple stems, this filter can emit multiple tokens for each consumed token.

Inheritance: TokenFilter

HunspellStemFilter Class Documentation

Example #1

Show file

File: TestHunspellStemFilter.cs Project: ChristopherHaws/lucenenet

 public virtual void TestLongestOnly()
 {
     MockTokenizer tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));
     tokenizer.EnableChecks = true;
     HunspellStemFilter filter = new HunspellStemFilter(tokenizer, dictionary, true, true);
     AssertTokenStreamContents(filter, new string[] { "lucene", "is", "awesome" }, new int[] { 1, 1, 1 });
 }

Example #2

Show file

        public virtual void TestLongestOnly()
        {
            MockTokenizer tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));

            tokenizer.EnableChecks = true;
            HunspellStemFilter filter = new HunspellStemFilter(tokenizer, dictionary, true, true);

            AssertTokenStreamContents(filter, new string[] { "lucene", "is", "awesome" }, new int[] { 1, 1, 1 });
        }

Example #3

Show file

File: TestHunspellStemFilter.cs Project: ChristopherHaws/lucenenet

        public virtual void TestKeywordAttribute()
        {
            MockTokenizer tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));
            tokenizer.EnableChecks = true;
            HunspellStemFilter filter = new HunspellStemFilter(tokenizer, dictionary);
            AssertTokenStreamContents(filter, new string[] { "lucene", "lucen", "is", "awesome" }, new int[] { 1, 0, 1, 1 });

            // assert with keyword marker
            tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));
            CharArraySet set = new CharArraySet(TEST_VERSION_CURRENT, Arrays.AsList("Lucene"), true);
            filter = new HunspellStemFilter(new SetKeywordMarkerFilter(tokenizer, set), dictionary);
            AssertTokenStreamContents(filter, new string[] { "lucene", "is", "awesome" }, new int[] { 1, 1, 1 });
        }

Example #4

Show file

        public virtual void TestKeywordAttribute()
        {
            MockTokenizer tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));

            tokenizer.EnableChecks = true;
            HunspellStemFilter filter = new HunspellStemFilter(tokenizer, dictionary);

            AssertTokenStreamContents(filter, new string[] { "lucene", "lucen", "is", "awesome" }, new int[] { 1, 0, 1, 1 });

            // assert with keyword marker
            tokenizer = new MockTokenizer(new StringReader("lucene is awesome"));
            CharArraySet set = new CharArraySet(TEST_VERSION_CURRENT, new string[] { "Lucene" }, true);

            filter = new HunspellStemFilter(new SetKeywordMarkerFilter(tokenizer, set), dictionary);
            AssertTokenStreamContents(filter, new string[] { "lucene", "is", "awesome" }, new int[] { 1, 1, 1 });
        }

Example #5

Show file

File: TestHunspellStemFilter.cs Project: synhershko/lucene.net

 public override TokenStream TokenStream(String fieldName, TextReader reader) {
     TokenStream stream = new StandardTokenizer(LuceneVersion.LUCENE_29, reader);
     stream = new LowerCaseFilter(stream);
     stream = new HunspellStemFilter(stream, _dictionary);
     return stream;
 }