C# (CSharp) Lucene.Net.Analysis.Core LowerCaseTokenizer примеры использования

Язык программирования: C# (CSharp)

Пространство имен/Пакет: Lucene.Net.Analysis.Core

Класс/Тип: LowerCaseTokenizer

Примеров на hotexamples.com: 7

C# (CSharp) Lucene.Net.Analysis.Core LowerCaseTokenizer - 7 примеров найдено. Это лучшие примеры C# (CSharp) кода для Lucene.Net.Analysis.Core.LowerCaseTokenizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

LowerCaseTokenizer performs the function of LetterTokenizer and LowerCaseFilter together. It divides text at non-letters and converts them to lower case. While it is functionally equivalent to the combination of LetterTokenizer and LowerCaseFilter, there is a performance advantage to doing the two tasks at once, hence this (redundant) implementation.

Note: this does a decent job for most European languages, but does a terrible job for some Asian languages, where words are not separated by spaces.

You must specify the required Version compatibility when creating LowerCaseTokenizer:

As of 3.1, CharTokenizer uses an int based API to normalize and detect token characters. See CharTokenizer#isTokenChar(int) and CharTokenizer#normalize(int) for details.

Наследование: LetterTokenizer

Документация по классу LowerCaseTokenizer

Пример #1

Показать файл

        public virtual void TestLowerCaseTokenizer()
        {
            StringReader       reader    = new StringReader("Tokenizer \ud801\udc1ctest");
            LowerCaseTokenizer tokenizer = new LowerCaseTokenizer(TEST_VERSION_CURRENT, reader);

            AssertTokenStreamContents(tokenizer, new string[] { "tokenizer", "\ud801\udc44test" });
        }

Пример #2

Показать файл

        public virtual void TestLowerCaseTokenizerBWCompat()
        {
            StringReader       reader    = new StringReader("Tokenizer \ud801\udc1ctest");
            LowerCaseTokenizer tokenizer = new LowerCaseTokenizer(LuceneVersion.LUCENE_30, reader);

            AssertTokenStreamContents(tokenizer, new string[] { "tokenizer", "test" });
        }

Пример #3

Показать файл

Файл: StopAnalyzer.cs Проект: zalintyre/lucenenet

        /// <summary>
        /// Creates
        /// <see cref="TokenStreamComponents"/>
        /// used to tokenize all the text in the provided <see cref="TextReader"/>.
        /// </summary>
        /// <returns> <see cref="TokenStreamComponents"/>
        ///         built from a <see cref="LowerCaseTokenizer"/> filtered with
        ///         <see cref="StopFilter"/> </returns>
        protected internal override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
        {
            Tokenizer source = new LowerCaseTokenizer(m_matchVersion, reader);

            return(new TokenStreamComponents(source, new StopFilter(m_matchVersion, source, m_stopwords)));
        }

Пример #4

Показать файл

Файл: StopAnalyzer.cs Проект: zfxsss/lucenenet

        /// <summary>
        /// Creates
        /// <seealso cref="Analyzer.TokenStreamComponents"/>
        /// used to tokenize all the text in the provided <seealso cref="TextReader"/>.
        /// </summary>
        /// <returns> <seealso cref="Analyzer.TokenStreamComponents"/>
        ///         built from a <seealso cref="LowerCaseTokenizer"/> filtered with
        ///         <seealso cref="StopFilter"/> </returns>
        public override Analyzer.TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
        {
            Tokenizer source = new LowerCaseTokenizer(matchVersion, reader);

            return(new Analyzer.TokenStreamComponents(source, new StopFilter(matchVersion, source, stopwords)));
        }

Пример #5

Показать файл

Файл: StopAnalyzer.cs Проект: paulirwin/lucene.net

	  /// <summary>
	  /// Creates
	  /// <seealso cref="Analyzer.TokenStreamComponents"/>
	  /// used to tokenize all the text in the provided <seealso cref="TextReader"/>.
	  /// </summary>
	  /// <returns> <seealso cref="Analyzer.TokenStreamComponents"/>
	  ///         built from a <seealso cref="LowerCaseTokenizer"/> filtered with
	  ///         <seealso cref="StopFilter"/> </returns>
	  public override Analyzer.TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
	  {
		Tokenizer source = new LowerCaseTokenizer(matchVersion, reader);
		return new Analyzer.TokenStreamComponents(source, new StopFilter(matchVersion, source, stopwords));
	  }

Пример #6

Показать файл

Файл: TestAnalyzers.cs Проект: ChristopherHaws/lucenenet

 public virtual void TestLowerCaseTokenizerBWCompat()
 {
     StringReader reader = new StringReader("Tokenizer \ud801\udc1ctest");
     LowerCaseTokenizer tokenizer = new LowerCaseTokenizer(LuceneVersion.LUCENE_30, reader);
     AssertTokenStreamContents(tokenizer, new string[] { "tokenizer", "test" });
 }

Пример #7

Показать файл

Файл: TestAnalyzers.cs Проект: ChristopherHaws/lucenenet

 public virtual void TestLowerCaseTokenizer()
 {
     StringReader reader = new StringReader("Tokenizer \ud801\udc1ctest");
     LowerCaseTokenizer tokenizer = new LowerCaseTokenizer(TEST_VERSION_CURRENT, reader);
     AssertTokenStreamContents(tokenizer, new string[] { "tokenizer", "\ud801\udc44test" });
 }