Exemplo n.º 1
0
        private void GetBaiduDetails(BaikeEntry baidu)
        {
            /************************************************************************/

            /* 1.搜索百科词条
             * /*    errExist:此处用来判断词条是否存在,SourceHTML会修改其值
             * /************************************************************************/
            SourceHTML.GetBaidu(baidu);
            if (baidu.errExist)
            {
                textBoxBaidu.Text = baidu.errMsg;
                return;
            }
            textBoxBaidu.Text = baidu.url;
            baidu.errExist    = true;

            /************************************************************************/

            /* 2.提取网页正文
             *    errExist:此处用来判断是否正确提取到正文
             * /************************************************************************/
            TextExtract baiduText = new TextExtract(baidu);

            if (baidu.errExist)
            {
                textBoxBaidu.Text = baidu.url + " (" + baidu.errMsg + ")";
                return;
            }
            richTextBoxBaiduText.Text = baidu.text;
            labelBaiduTextNum.Text    = baidu.text.Length.ToString();

            /************************************************************************/
            /* 3.分词                                                                */
            /************************************************************************/
            TermFrequence baiduTermFreq = new TermFrequence(baidu);

            richTextBoxBaiduTermFreq.Text = baidu.allWordFreq;
            labelBaiduWordNum.Text        = baidu.wordDic.Count.ToString();
        }
Exemplo n.º 2
0
        private void GetHudongDetails(BaikeEntry hudong)
        {
            /************************************************************************/

            /* 1.搜索百科词条
             *    errExist:此处用来判断词条是否存在,SourceHTML会修改其值
             * /************************************************************************/
            SourceHTML.GetHudong(hudong);
            if (hudong.errExist)
            {
                textBoxHudong.Text = hudong.errMsg;
                return;
            }
            textBoxHudong.Text = hudong.url;
            hudong.errExist    = true;

            /************************************************************************/

            /* 2.提取网页正文
             *    errExist:此处用来判断是否正确提取到正文
             * /************************************************************************/
            TextExtract HudongText = new TextExtract(hudong);

            if (hudong.errExist)
            {
                textBoxHudong.Text = hudong.url + " (" + hudong.errMsg + ")";
                return;
            }
            richTextBoxHudongText.Text = hudong.text;
            labelHudongTextNum.Text    = hudong.text.Length.ToString();

            /************************************************************************/
            /* 3.分词                                                                */
            /************************************************************************/
            TermFrequence HudongTermFreq = new TermFrequence(hudong);

            richTextBoxHudongTermFreq.Text = hudong.allWordFreq;
            labelHudongWordNum.Text        = hudong.wordDic.Count.ToString();
        }
        private void GetBaiduDetails(BaikeEntry baidu)
        {
            /************************************************************************/
            /* 1.搜索百科词条
            /*    errExist:此处用来判断词条是否存在,SourceHTML会修改其值
            /************************************************************************/
            SourceHTML.GetBaidu(baidu);
            if (baidu.errExist)
            {
                textBoxBaidu.Text = baidu.errMsg;
                return;
            }
            textBoxBaidu.Text = baidu.url;
            baidu.errExist    = true;

            /************************************************************************/
            /* 2.提取网页正文
             *    errExist:此处用来判断是否正确提取到正文
            /************************************************************************/
            TextExtract baiduText = new TextExtract(baidu);
            if (baidu.errExist)
            {
                textBoxBaidu.Text = baidu.url + " (" + baidu.errMsg + ")";
                return;
            }
            richTextBoxBaiduText.Text = baidu.text;
            labelBaiduTextNum.Text    = baidu.text.Length.ToString();

            /************************************************************************/
            /* 3.分词                                                                */
            /************************************************************************/
            TermFrequence baiduTermFreq   = new TermFrequence(baidu);
            richTextBoxBaiduTermFreq.Text = baidu.allWordFreq;
            labelBaiduWordNum.Text        = baidu.wordDic.Count.ToString();
        }
        private void GetHudongDetails(BaikeEntry hudong)
        {
            /************************************************************************/
            /* 1.搜索百科词条
             *    errExist:此处用来判断词条是否存在,SourceHTML会修改其值
            /************************************************************************/
            SourceHTML.GetHudong(hudong);
            if (hudong.errExist)
            {
                textBoxHudong.Text = hudong.errMsg;
                return;
            }
            textBoxHudong.Text = hudong.url;
            hudong.errExist    = true;

            /************************************************************************/
            /* 2.提取网页正文
             *    errExist:此处用来判断是否正确提取到正文
            /************************************************************************/
            TextExtract HudongText = new TextExtract(hudong);
            if (hudong.errExist)
            {
                textBoxHudong.Text = hudong.url + " (" + hudong.errMsg + ")";
                return;
            }
            richTextBoxHudongText.Text = hudong.text;
            labelHudongTextNum.Text    = hudong.text.Length.ToString();

            /************************************************************************/
            /* 3.分词                                                                */
            /************************************************************************/
            TermFrequence HudongTermFreq   = new TermFrequence(hudong);
            richTextBoxHudongTermFreq.Text = hudong.allWordFreq;
            labelHudongWordNum.Text        = hudong.wordDic.Count.ToString();
        }