C# (CSharp) MyTokenizer примеры использования

Язык программирования: C# (CSharp)

Класс/Тип: MyTokenizer

Примеров на hotexamples.com: 3

C# (CSharp) MyTokenizer - 3 примера найдено. Это лучшие примеры C# (CSharp) кода для MyTokenizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Tokenize(1)

Пример #1

Показать файл

Файл: ReadmeTests.cs Проект: pdonald/latvian

 public void CustomClass()
 {
     MyTokenizer tokenizer = new MyTokenizer();
     Token[] tokens = tokenizer.Tokenize("A.Bērziņš ").ToArray();
     Assert.AreEqual("A", tokens[0].Text);
     Assert.AreEqual(".", tokens[1].Text);
     Assert.AreEqual("Bērziņš", tokens[2].Text);
     Assert.AreEqual(" ", tokens[3].Text);
 }

Пример #2

Показать файл

        public void CustomClass()
        {
            MyTokenizer tokenizer = new MyTokenizer();

            Token[] tokens = tokenizer.Tokenize("A.Bērziņš ").ToArray();
            Assert.AreEqual("A", tokens[0].Text);
            Assert.AreEqual(".", tokens[1].Text);
            Assert.AreEqual("Bērziņš", tokens[2].Text);
            Assert.AreEqual(" ", tokens[3].Text);
        }

Пример #3

Показать файл

Файл: MyAnalyzer.cs Проект: Darxoon/TOKElfTool

        protected override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)
        {
            const LuceneVersion version = LuceneVersion.LUCENE_48;

            Tokenizer           baseTokenizer       = new MyTokenizer(version, reader);
            StandardFilter      standardFilter      = new StandardFilter(version, baseTokenizer);
            WordDelimiterFilter wordDelimiterFilter = new WordDelimiterFilter(version, standardFilter,
                                                                              WordDelimiterFlags.CATENATE_WORDS | WordDelimiterFlags.GENERATE_WORD_PARTS |
                                                                              WordDelimiterFlags.PRESERVE_ORIGINAL | WordDelimiterFlags.SPLIT_ON_CASE_CHANGE, CharArraySet.EMPTY_SET);
            LowerCaseFilter lcFilter = new LowerCaseFilter(version, wordDelimiterFilter);

            return(new TokenStreamComponents(baseTokenizer, lcFilter));
        }