コード例 #1
0
ファイル: ParagraphData.cs プロジェクト: Koka2018/TrendWord
 /// <summary>
 /// コンストラクタ
 /// </summary>
 /// <param name="text">テキスト</param>
 public ParagraphData(string text)
 {
     Text         = text;
     TokenList    = WordLogic.GetTokenList(text);
     TokenTbl     = WordLogic.GetBasicTokenTbl(text);
     TokenTypeTbl = WordLogic.GetTokenTypeTbl(TokenList);
     InfoRate     = AnalyzeLogic.CalcInfoRate(TokenList);
 }
コード例 #2
0
ファイル: Tests_WordLogic.cs プロジェクト: Koka2018/TrendWord
        public void トークンリストの品詞分類ができること()
        {
            var text         = "形態素解析とは、文法的な情報の注記の無い自然言語のテキストデータから、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素の列に分割し、それぞれの形態素の品詞等を判別する作業である。";
            var tokenList    = WordLogic.GetTokenList(text);
            var tokenTypeTbl = WordLogic.GetTokenTypeTbl(tokenList);

            Assert.AreEqual(7, tokenTypeTbl.Keys.Count);
            Assert.IsTrue(tokenTypeTbl.ContainsKey("名詞"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("動詞"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("助動詞"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("助詞"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("形容詞"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("記号"));
            Assert.IsTrue(tokenTypeTbl.ContainsKey("BOS/EOS"));
        }
コード例 #3
0
ファイル: WordCtrl.cs プロジェクト: Koka2018/TrendWord
        /// <summary>
        /// 解析処理
        /// </summary>
        /// <param name="text">テキスト</param>
        public void Analyze(string text)
        {
            ParagraphList.Clear();

            var strParagraphList = ParagraphLogic.SplitParagraph(text);

            foreach (var strParagraph in strParagraphList)
            {
                ParagraphList.Add(new ParagraphData(strParagraph));
            }

            TokenList    = WordLogic.GetTokenList(text);
            TokenTbl     = WordLogic.GetBasicTokenTbl(text);
            TokenTypeTbl = WordLogic.GetTokenTypeTbl(TokenList);
            InfoRate     = AnalyzeLogic.CalcInfoRate(TokenList);
        }