C# (CSharp) JiebaTokenizer Examples

Programming Language: C# (CSharp)

Class/Type: JiebaTokenizer

Examples at hotexamples.com: 4

C# (CSharp) JiebaTokenizer - 4 examples found. These are the top rated real world C# (CSharp) examples of JiebaTokenizer extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Tokenize(1)

Example #1

Show file

        public void TestJIEbaTokenizer()
        {
            var tokenizer = new JiebaTokenizer(TextReader.Null, TokenizerMode.Default);

            Assert.NotEmpty(tokenizer.StopWords);

            Assert.True(tokenizer.StopWords.ContainsKey("是"));
            Assert.True(tokenizer.StopWords.ContainsKey("什么"));
        }

Example #2

Show file

File: JiebaAnalyzer.cs Project: kangwl/DotNet.Mix

 public override TokenStream TokenStream(string fieldName, TextReader reader)
 {
     var seg = new JiebaSegmenter();
     TokenStream result = new JiebaTokenizer(seg, reader);
     // This filter is necessary, because the parser converts the queries to lower case.
     result = new LowerCaseFilter(result);
     result = new StopFilter(true, result, StopWords);
     return result;
 }

Example #3

Show file

        private static string GetKeyWordsSplitBySpace(string keywords, JiebaTokenizer tokenizer)
        {
            var result = new StringBuilder();

            var words = tokenizer.Tokenize(keywords);

            foreach (var word in words)
            {
                if (string.IsNullOrWhiteSpace(word.Word))
                {
                    continue;
                }

                result.AppendFormat("{0} ", word.Word);
            }

            return(result.ToString().Trim());
        }

Example #4

Show file

File: NewsSearcher.cs Project: anderscui/jiebaForLuceneNet

        private static string GetKeyWordsSplitBySpace(string keywords, JiebaTokenizer tokenizer)
        {
            var result = new StringBuilder();

            var words = tokenizer.Tokenize(keywords);

            foreach (var word in words)
            {
                if (string.IsNullOrWhiteSpace(word.Word))
                {
                    continue;
                }

                result.AppendFormat("{0} ", word.Word);
            }

            return result.ToString().Trim();
        }