Exemplos de Lucene.Net.Analysis.Hi HindiNormalizationFilter em C# (CSharp)

Linguagem de programação: C# (CSharp)

Espaço para nome / nome do pacote: Lucene.Net.Analysis.Hi

Exemplos em hotexamples.com: 3

Lucene.Net.Analysis.Hi HindiNormalizationFilter em C# (CSharp) - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de Lucene.Net.Analysis.Hi.HindiNormalizationFilter em C# (CSharp) extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Relacionados

global::Arena.UI.Views.Details.DateTimeView

phieuxuat

CollectibleAssemblyLoadContext

Helpers

evolib.Services.MasterData.IMasterData

EmptyNZazuFieldBehavior

QuantConnect.Orders.Order

TvObjs

USBLine

Related in langs

db_insertId (PHP)

unload_textdomain (PHP)

poppler_page_get_size (C++)

LLVMBuildSDiv (C++)

Pattern (Go)

NewContext (Go)

FX_Series (Java)

TypeGraph (Java)

mr_reduce (Python)

charclass (Python)

A TokenFilter that applies HindiNormalizer to normalize the orthography.
In some cases the normalization may cause unrelated terms to conflate, so to prevent terms from being normalized use an instance of SetKeywordMarkerFilter or a custom TokenFilter that sets the KeywordAttribute before this TokenStream.

Inheritance: TokenFilter

HindiNormalizationFilter Class Documentation

Exemplo n.º 1

0

Exibir arquivo

Arquivo: HindiAnalyzer.cs Projeto: sycct/lucenenet

/// <summary> /// Creates /// <see cref="Analyzer.TokenStreamComponents"/> /// used to tokenize all the text in the provided <see cref="TextReader"/>. /// </summary> /// <returns> <see cref="Analyzer.TokenStreamComponents"/> /// built from a <see cref="StandardTokenizer"/> filtered with /// <see cref="LowerCaseFilter"/>, <see cref="IndicNormalizationFilter"/>, /// <see cref="HindiNormalizationFilter"/>, <see cref="SetKeywordMarkerFilter"/> /// if a stem exclusion set is provided, <see cref="HindiStemFilter"/>, and /// Hindi Stop words </returns> protected override TokenStreamComponents CreateComponents(string fieldName, TextReader reader) { Tokenizer source; #pragma warning disable 612, 618 if (m_matchVersion.OnOrAfter(LuceneVersion.LUCENE_36)) { source = new StandardTokenizer(m_matchVersion, reader); } else { source = new IndicTokenizer(m_matchVersion, reader); } #pragma warning restore 612, 618 TokenStream result = new LowerCaseFilter(m_matchVersion, source); if (stemExclusionSet.Count > 0) { result = new SetKeywordMarkerFilter(result, stemExclusionSet); } result = new IndicNormalizationFilter(result); result = new HindiNormalizationFilter(result); result = new StopFilter(m_matchVersion, result, m_stopwords); result = new HindiStemFilter(result); return(new TokenStreamComponents(source, result)); }

Exemplo n.º 2

0

Exibir arquivo

private void Check(string input, string output) { Tokenizer tokenizer = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false); TokenFilter tf = new HindiNormalizationFilter(tokenizer); AssertTokenStreamContents(tf, new string[] { output }); }

Exemplo n.º 3

0

Exibir arquivo

Arquivo: TestHindiNormalizer.cs Projeto: ChristopherHaws/lucenenet

private void Check(string input, string output) { Tokenizer tokenizer = new MockTokenizer(new StringReader(input), MockTokenizer.WHITESPACE, false); TokenFilter tf = new HindiNormalizationFilter(tokenizer); AssertTokenStreamContents(tf, new string[] { output }); }