Esempi in C# (CSharp) per KANG.SearchEngine.Util.jieba JiebaTokenizer

Linguaggio di programmazione: C# (CSharp)

Spazio dei nomi/nome del pacchetto: KANG.SearchEngine.Util.jieba

Classe/tipologia: JiebaTokenizer

Esempi su hotexamples.com: 2

KANG.SearchEngine.Util.jieba JiebaTokenizer in C# (CSharp): 2 esempi trovati. Questi sono i migliori esempi reali in C# (CSharp) per KANG.SearchEngine.Util.jieba.JiebaTokenizer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Tokenize(1)

Esempio n. 1

Mostra file

File: JiebaAnalyzer.cs Progetto: kangwl/KANG.Frame

 public override TokenStream TokenStream(string fieldName, TextReader reader)
 {
     var seg = new JiebaSegmenter();
     TokenStream result = new JiebaTokenizer(seg, reader);
     // This filter is necessary, because the parser converts the queries to lower case.
     result = new LowerCaseFilter(result);
     result = new StopFilter(true, result, StopWords);
     return result;
 }

Esempio n. 2

Mostra file

File: DocIndex.cs Progetto: kangwl/KANG.Frame

        protected string GetKeyWordsSplitBySpace(string keywords) {
            StringBuilder result = new StringBuilder();
            var tokenizer = new JiebaTokenizer(new JiebaSegmenter(), keywords);
            var words = tokenizer.Tokenize(keywords);
            foreach (var word in words) {
                if (string.IsNullOrWhiteSpace(word.Word)) {
                    continue;
                }
                result.AppendFormat("{0} ", word.Word);
            }

            string kwords = result.ToString().Trim();
            //var terms = kwords.Trim().Replace("-", " ").Split(' ')
            //   .Where(x => !string.IsNullOrEmpty(x)).Select(x => x.Trim());
            //匹配
            var terms = kwords.Trim().Replace("-", " ").Split(' ')
                .Where(x => !string.IsNullOrEmpty(x)).Select(x => x.Trim() + "*");
            return string.Join(" ", terms);
        }