Exemplos de código com KeepWordFilter, Lucene.Net.Analysis.Miscellaneous em C# (CSharp)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: TestKeepWordFilter.cs Projeto: yohikofox/lucenenet

        public virtual void TestStopAndGo()
        {
            ISet <string> words = new HashSet <string>();

            words.Add("aaa");
            words.Add("bbb");

            string input = "xxx yyy aaa zzz BBB ccc ddd EEE";

            // Test Stopwords
            TokenStream stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);

            stream = new KeepWordFilter(TEST_VERSION_CURRENT, stream, new CharArraySet(TEST_VERSION_CURRENT, words, true));
            AssertTokenStreamContents(stream, new string[] { "aaa", "BBB" }, new int[] { 3, 2 });

            // Now force case
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            stream = new KeepWordFilter(TEST_VERSION_CURRENT, stream, new CharArraySet(TEST_VERSION_CURRENT, words, false));
            AssertTokenStreamContents(stream, new string[] { "aaa" }, new int[] { 3 });

            // Test Stopwords
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
#pragma warning disable 612, 618
            stream = new KeepWordFilter(LuceneVersion.LUCENE_43, false, stream, new CharArraySet(TEST_VERSION_CURRENT, words, true));
            AssertTokenStreamContents(stream, new string[] { "aaa", "BBB" }, new int[] { 1, 1 });

            // Now force case
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            stream = new KeepWordFilter(LuceneVersion.LUCENE_43, false, stream, new CharArraySet(TEST_VERSION_CURRENT, words, false));
#pragma warning restore 612, 618
            AssertTokenStreamContents(stream, new string[] { "aaa" }, new int[] { 1 });
        }

Exemplo n.º 2

0

Exibir arquivo

Arquivo: TestKeepWordFilter.cs Projeto: yohikofox/lucenenet

            protected override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
            {
                Tokenizer   tokenizer = new MockTokenizer(reader, MockTokenizer.WHITESPACE, false);
                TokenStream stream    = new KeepWordFilter(TEST_VERSION_CURRENT, tokenizer, new CharArraySet(TEST_VERSION_CURRENT, words, true));

                return(new TokenStreamComponents(tokenizer, stream));
            }

Exemplo n.º 3

0

Exibir arquivo

Arquivo: TestKeepWordFilter.cs Projeto: ChristopherHaws/lucenenet

        public virtual void TestStopAndGo()
        {
            ISet<string> words = new HashSet<string>();
            words.Add("aaa");
            words.Add("bbb");

            string input = "xxx yyy aaa zzz BBB ccc ddd EEE";

            // Test Stopwords
            TokenStream stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            stream = new KeepWordFilter(TEST_VERSION_CURRENT, stream, new CharArraySet(TEST_VERSION_CURRENT, words, true));
            AssertTokenStreamContents(stream, new string[] { "aaa", "BBB" }, new int[] { 3, 2 });

            // Now force case
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            stream = new KeepWordFilter(TEST_VERSION_CURRENT, stream, new CharArraySet(TEST_VERSION_CURRENT, words, false));
            AssertTokenStreamContents(stream, new string[] { "aaa" }, new int[] { 3 });

            // Test Stopwords
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
#pragma warning disable 612, 618
            stream = new KeepWordFilter(LuceneVersion.LUCENE_43, false, stream, new CharArraySet(TEST_VERSION_CURRENT, words, true));
            AssertTokenStreamContents(stream, new string[] { "aaa", "BBB" }, new int[] { 1, 1 });

            // Now force case
            stream = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            stream = new KeepWordFilter(LuceneVersion.LUCENE_43, false, stream, new CharArraySet(TEST_VERSION_CURRENT, words, false));
#pragma warning restore 612, 618
            AssertTokenStreamContents(stream, new string[] { "aaa" }, new int[] { 1 });
        }

Exemplo n.º 4

0

Exibir arquivo

Arquivo: KeepWordFilterFactory.cs Projeto: willCode2Surf/lucenenet

 public override TokenStream Create(TokenStream input)
 {
     // if the set is null, it means it was empty
     if (words == null)
     {
         return(input);
     }
     else
     {
         TokenStream filter = new KeepWordFilter(luceneMatchVersion, enablePositionIncrements, input, words);
         return(filter);
     }
 }

Exemplo n.º 5

0

Exibir arquivo

        public override TokenStream Create(TokenStream input)
        {
            // if the set is null, it means it was empty
            if (words == null)
            {
                return(input);
            }
            else
            {
#pragma warning disable 612, 618
                TokenStream filter = new KeepWordFilter(m_luceneMatchVersion, enablePositionIncrements, input, words);
#pragma warning restore 612, 618
                return(filter);
            }
        }

Exemplo n.º 6

0

Exibir arquivo

Arquivo: TestKeepWordFilter.cs Projeto: zalintyre/lucenenet

        public virtual void TestRandomStrings()
        {
            ISet <string> words = new JCG.HashSet <string>();

            words.Add("a");
            words.Add("b");

            Analyzer a = Analyzer.NewAnonymous(createComponents: (fieldName, reader) =>
            {
                Tokenizer tokenizer = new MockTokenizer(reader, MockTokenizer.WHITESPACE, false);
                TokenStream stream  = new KeepWordFilter(TEST_VERSION_CURRENT, tokenizer, new CharArraySet(TEST_VERSION_CURRENT, words, true));
                return(new TokenStreamComponents(tokenizer, stream));
            });

            CheckRandomData(Random, a, 1000 * RandomMultiplier);
        }

Exemplo n.º 7

0

Exibir arquivo

Arquivo: KeepWordFilterFactory.cs Projeto: paulirwin/lucene.net

 public override TokenStream Create(TokenStream input)
 {
     // if the set is null, it means it was empty
     if (words == null)
     {
         return input;
     }
     else
     {
         TokenStream filter = new KeepWordFilter(luceneMatchVersion, enablePositionIncrements, input, words);
         return filter;
     }
 }

Exemplo n.º 8

0

Exibir arquivo

Arquivo: TestKeepWordFilter.cs Projeto: ChristopherHaws/lucenenet

 public override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
 {
     Tokenizer tokenizer = new MockTokenizer(reader, MockTokenizer.WHITESPACE, false);
     TokenStream stream = new KeepWordFilter(TEST_VERSION_CURRENT, tokenizer, new CharArraySet(TEST_VERSION_CURRENT, words, true));
     return new TokenStreamComponents(tokenizer, stream);
 }

Exemplos de Lucene.Net.Analysis.Miscellaneous KeepWordFilter em C# (CSharp)