C# (CSharp) Lucene.Net.Analysis.Tr TurkishLowerCaseFilter Exemples

Langage de programmation: C# (CSharp)

Espace de nommage/Pack: Lucene.Net.Analysis.Tr

Exemples au hotexamples.com: 11

C# (CSharp) Lucene.Net.Analysis.Tr TurkishLowerCaseFilter - 11 exemples trouvés. Ce sont les exemples réels les mieux notés de Lucene.Net.Analysis.Tr.TurkishLowerCaseFilter extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

PdfAppearance

ConnectionString

Schema.ISchemaProvider

HelpPageApiModel

VerticalSplitPanel

SyncConfigTarget

Piano

WorkerPool

StripLedPatternData

TextSizeType

Related in langs

add_version_folders (PHP)

ProgramParameter (PHP)

tearDownVideoRendering (C++)

grpc_end2end_tests_pre_init (C++)

NewSlice (Go)

Interval (Go)

AuditEventService (Java)

StubRequestDataBinder (Java)

load (Python)

dict_items (Python)

Normalizes Turkish token text to lower case.
Turkish and Azeri have unique casing behavior for some characters. This filter applies Turkish lowercase rules. For more information, see http://en.wikipedia.org/wiki/Turkish_dotted_and_dotless_I

Inheritance: TokenFilter

TurkishLowerCaseFilter Class Documentation

Exemple #1

0

Afficher le fichier

public virtual void TestDecomposed2() { TokenStream stream = new MockTokenizer(new StringReader("\u0049\u0316\u0307STANBUL \u0049\u0307ZM\u0049\u0307R I\u0316SPARTA"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "i\u0316stanbul", "izmir", "\u0131\u0316sparta" }); }

Exemple #2

0

Afficher le fichier

public virtual void TestDecomposed3() { TokenStream stream = new MockTokenizer(new StringReader("\u0049\u0307"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "i" }); }

Exemple #3

0

Afficher le fichier

public virtual void TestTurkishLowerCaseFilter() { TokenStream stream = new MockTokenizer(new StringReader("\u0130STANBUL \u0130ZM\u0130R ISPARTA"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "istanbul", "izmir", "\u0131sparta" }); }

Exemple #4

0

Afficher le fichier

Fichier : TestApostropheFilter.cs Projet : ChristopherHaws/lucenenet

public virtual void TestApostropheFilter() { TokenStream stream = new MockTokenizer(new StringReader("Türkiye'de 2003'te Van Gölü'nü gördüm"), MockTokenizer.WHITESPACE, false); stream = new TurkishLowerCaseFilter(stream); stream = new ApostropheFilter(stream); AssertTokenStreamContents(stream, new string[] { "türkiye", "2003", "van", "gölü", "gördüm" }); }

Exemple #5

0

Afficher le fichier

Fichier : SnowballAnalyzer.cs Projet : ChristopherHaws/lucenenet

/// <summary> /// Constructs a <seealso cref="StandardTokenizer"/> filtered by a {@link /// StandardFilter}, a <seealso cref="LowerCaseFilter"/>, a <seealso cref="StopFilter"/>, /// and a <seealso cref="SnowballFilter"/> /// </summary> public override TokenStreamComponents CreateComponents(string fieldName, TextReader reader) { Tokenizer tokenizer = new StandardTokenizer(matchVersion, reader); TokenStream result = new StandardFilter(matchVersion, tokenizer); // remove the possessive 's for english stemmers if (matchVersion.OnOrAfter(LuceneVersion.LUCENE_31) && (name.Equals("English") || name.Equals("Porter") || name.Equals("Lovins"))) { result = new EnglishPossessiveFilter(result); } // Use a special lowercase filter for turkish, the stemmer expects it. if (matchVersion.OnOrAfter(LuceneVersion.LUCENE_31) && name.Equals("Turkish")) { result = new TurkishLowerCaseFilter(result); } else { result = new LowerCaseFilter(matchVersion, result); } if (stopSet != null) { result = new StopFilter(matchVersion, result, stopSet); } result = new SnowballFilter(result, name); return new TokenStreamComponents(tokenizer, result); }

Exemple #6

0

Afficher le fichier

Fichier : TestApostropheFilter.cs Projet : ywscr/lucenenet

public virtual void TestApostropheFilter() { TokenStream stream = new MockTokenizer(new StringReader("Türkiye'de 2003'te Van Gölü'nü gördüm"), MockTokenizer.WHITESPACE, false); stream = new TurkishLowerCaseFilter(stream); stream = new ApostropheFilter(stream); AssertTokenStreamContents(stream, new string[] { "türkiye", "2003", "van", "gölü", "gördüm" }); }

Exemple #7

0

Afficher le fichier

Fichier : TurkishAnalyzer.cs Projet : zalintyre/lucenenet

/// <summary> /// Creates a /// <see cref="TokenStreamComponents"/> /// which tokenizes all the text in the provided <see cref="TextReader"/>. /// </summary> /// <returns> A /// <see cref="TokenStreamComponents"/> /// built from an <see cref="StandardTokenizer"/> filtered with /// <see cref="StandardFilter"/>, <see cref="TurkishLowerCaseFilter"/>, /// <see cref="StopFilter"/>, <see cref="SetKeywordMarkerFilter"/> if a stem /// exclusion set is provided and <see cref="SnowballFilter"/>. </returns> protected internal override TokenStreamComponents CreateComponents(string fieldName, TextReader reader) { Tokenizer source = new StandardTokenizer(m_matchVersion, reader); TokenStream result = new StandardFilter(m_matchVersion, source); if (m_matchVersion.OnOrAfter(LuceneVersion.LUCENE_48)) { result = new ApostropheFilter(result); } result = new TurkishLowerCaseFilter(result); result = new StopFilter(m_matchVersion, result, m_stopwords); if (stemExclusionSet.Count > 0) { result = new SetKeywordMarkerFilter(result, stemExclusionSet); } result = new SnowballFilter(result, new TurkishStemmer()); return new TokenStreamComponents(source, result); }

Exemple #8

0

Afficher le fichier

Fichier : TurkishAnalyzer.cs Projet : ChristopherHaws/lucenenet

/// <summary> /// Creates a /// <seealso cref="org.apache.lucene.analysis.Analyzer.TokenStreamComponents"/> /// which tokenizes all the text in the provided <seealso cref="Reader"/>. /// </summary> /// <returns> A /// <seealso cref="org.apache.lucene.analysis.Analyzer.TokenStreamComponents"/> /// built from an <seealso cref="StandardTokenizer"/> filtered with /// <seealso cref="StandardFilter"/>, <seealso cref="TurkishLowerCaseFilter"/>, /// <seealso cref="StopFilter"/>, <seealso cref="SetKeywordMarkerFilter"/> if a stem /// exclusion set is provided and <seealso cref="SnowballFilter"/>. </returns> public override TokenStreamComponents CreateComponents(string fieldName, TextReader reader) { Tokenizer source = new StandardTokenizer(matchVersion, reader); TokenStream result = new StandardFilter(matchVersion, source); if (matchVersion.OnOrAfter(LuceneVersion.LUCENE_48)) { result = new ApostropheFilter(result); } result = new TurkishLowerCaseFilter(result); result = new StopFilter(matchVersion, result, stopwords); if (stemExclusionSet.Any()) { result = new SetKeywordMarkerFilter(result, stemExclusionSet); } result = new SnowballFilter(result, new TurkishStemmer()); return new TokenStreamComponents(source, result); }

Exemple #9

0

Afficher le fichier

Fichier : TestTurkishLowerCaseFilter.cs Projet : ChristopherHaws/lucenenet

public virtual void TestDecomposed3() { TokenStream stream = new MockTokenizer(new StringReader("\u0049\u0307"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "i" }); }

Exemple #10

0

Afficher le fichier

Fichier : TestTurkishLowerCaseFilter.cs Projet : ChristopherHaws/lucenenet

public virtual void TestDecomposed2() { TokenStream stream = new MockTokenizer(new StringReader("\u0049\u0316\u0307STANBUL \u0049\u0307ZM\u0049\u0307R I\u0316SPARTA"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "i\u0316stanbul", "izmir", "\u0131\u0316sparta" }); }

Exemple #11

0

Afficher le fichier

Fichier : TestTurkishLowerCaseFilter.cs Projet : ChristopherHaws/lucenenet

public virtual void TestTurkishLowerCaseFilter() { TokenStream stream = new MockTokenizer(new StringReader("\u0130STANBUL \u0130ZM\u0130R ISPARTA"), MockTokenizer.WHITESPACE, false); TurkishLowerCaseFilter filter = new TurkishLowerCaseFilter(stream); AssertTokenStreamContents(filter, new string[] { "istanbul", "izmir", "\u0131sparta" }); }