C# (CSharp) KANG.SearchEngine.Util.jieba JiebaTokenizer Examples

Programming Language: C# (CSharp)

Namespace/Package Name: KANG.SearchEngine.Util.jieba

Class/Type: JiebaTokenizer

Examples at hotexamples.com: 2

C# (CSharp) KANG.SearchEngine.Util.jieba JiebaTokenizer - 2 examples found. These are the top rated real world C# (CSharp) examples of KANG.SearchEngine.Util.jieba.JiebaTokenizer extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Tokenize(1)

Example #1

Show file

File: JiebaAnalyzer.cs Project: kangwl/KANG.Frame

 public override TokenStream TokenStream(string fieldName, TextReader reader)
 {
     var seg = new JiebaSegmenter();
     TokenStream result = new JiebaTokenizer(seg, reader);
     // This filter is necessary, because the parser converts the queries to lower case.
     result = new LowerCaseFilter(result);
     result = new StopFilter(true, result, StopWords);
     return result;
 }

Example #2

Show file

File: DocIndex.cs Project: kangwl/KANG.Frame

        protected string GetKeyWordsSplitBySpace(string keywords) {
            StringBuilder result = new StringBuilder();
            var tokenizer = new JiebaTokenizer(new JiebaSegmenter(), keywords);
            var words = tokenizer.Tokenize(keywords);
            foreach (var word in words) {
                if (string.IsNullOrWhiteSpace(word.Word)) {
                    continue;
                }
                result.AppendFormat("{0} ", word.Word);
            }

            string kwords = result.ToString().Trim();
            //var terms = kwords.Trim().Replace("-", " ").Split(' ')
            //   .Where(x => !string.IsNullOrEmpty(x)).Select(x => x.Trim());
            //匹配
            var terms = kwords.Trim().Replace("-", " ").Split(' ')
                .Where(x => !string.IsNullOrEmpty(x)).Select(x => x.Trim() + "*");
            return string.Join(" ", terms);
        }