C# (CSharp) Lucene.Net.Analysis.Hi HindiStemFilterの例

プログラミング言語: C# (CSharp)

名前空間/パッケージ名: Lucene.Net.Analysis.Hi

クラス/型: HindiStemFilter

hotexamples.comのコード掲載数: 3

C# (CSharp) Lucene.Net.Analysis.Hi HindiStemFilter - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のLucene.Net.Analysis.Hi.HindiStemFilterの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

A TokenFilter that applies HindiStemmer to stem Hindi words.

Inheritance: TokenFilter

HindiStemFilter Class Documentation

コード例 #1

ファイルを表示

        private void Check(string input, string output)
        {
            Tokenizer   tokenizer = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
            TokenFilter tf        = new HindiStemFilter(tokenizer);

            AssertTokenStreamContents(tf, new string[] { output });
        }

コード例 #2

ファイルを表示

ファイル: HindiAnalyzer.cs プロジェクト: sycct/lucenenet

        /// <summary>
        /// Creates
        /// <see cref="Analyzer.TokenStreamComponents"/>
        /// used to tokenize all the text in the provided <see cref="TextReader"/>.
        /// </summary>
        /// <returns> <see cref="Analyzer.TokenStreamComponents"/>
        ///         built from a <see cref="StandardTokenizer"/> filtered with
        ///         <see cref="LowerCaseFilter"/>, <see cref="IndicNormalizationFilter"/>,
        ///         <see cref="HindiNormalizationFilter"/>, <see cref="SetKeywordMarkerFilter"/>
        ///         if a stem exclusion set is provided, <see cref="HindiStemFilter"/>, and
        ///         Hindi Stop words </returns>
        protected override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
        {
            Tokenizer source;

#pragma warning disable 612, 618
            if (m_matchVersion.OnOrAfter(LuceneVersion.LUCENE_36))
            {
                source = new StandardTokenizer(m_matchVersion, reader);
            }
            else
            {
                source = new IndicTokenizer(m_matchVersion, reader);
            }
#pragma warning restore 612, 618
            TokenStream result = new LowerCaseFilter(m_matchVersion, source);
            if (stemExclusionSet.Count > 0)
            {
                result = new SetKeywordMarkerFilter(result, stemExclusionSet);
            }
            result = new IndicNormalizationFilter(result);
            result = new HindiNormalizationFilter(result);
            result = new StopFilter(m_matchVersion, result, m_stopwords);
            result = new HindiStemFilter(result);
            return(new TokenStreamComponents(source, result));
        }

コード例 #3

ファイルを表示

ファイル: TestHindiStemmer.cs プロジェクト: ChristopherHaws/lucenenet

 private void Check(string input, string output)
 {
     Tokenizer tokenizer = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false);
     TokenFilter tf = new HindiStemFilter(tokenizer);
     AssertTokenStreamContents(tf, new string[] { output });
 }