C# (CSharp) X_Service.Fetch FetchContent.GetNextPageUrlの例

プログラミング言語: C# (CSharp)

名前空間/パッケージ名: X_Service.Fetch

クラス/型: FetchContent

メソッド/関数: GetNextPageUrl

hotexamples.comのコード掲載数: 2

C# (CSharp) X_Service.Fetch FetchContent.GetNextPageUrl - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のX_Service.Fetch.FetchContent.GetNextPageUrlの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

GetDataFromUrl(3)

GetNextPageUrl(2)

GetMainContent(1)

コード例 #1

ファイルを表示

ファイル: Fetch.cs プロジェクト: zq535228/renzhex3

        public static void GetContentFromUrl(string url, ref string tmp_title, ref string tmp_content, string treg, string creg)
        {
            EchoHelper.EchoPickStart();

            tmp_title   = tmp_title.Replace("[标题]", "(.*?)");
            tmp_content = tmp_content.Replace("[正文]", "(.*?)");
            nextPages   = new ArrayList();

            while (url != "")
            {
                string html = FetchContent.GetDataFromUrl(url);
                nextPages.Add(url);
                if (string.IsNullOrEmpty(tmp_title))
                {
                    tmp_title = RegexHelper.getMatch(html, treg, 1);
                }
                //内容正则循环
                if (!string.IsNullOrEmpty(creg))
                {
                    string[] contentRegexs = creg.Split('\n');
                    for (int i = 0; i < contentRegexs.Length; i++)
                    {
                        string tmp = RegexHelper.getMatchs(html.Replace("\n", "`"), contentRegexs[i].ToString().Trim(), 1, "\r\n").Replace("`", "\n");
                        tmp_content += tmp;
                        tmp_content += Environment.NewLine;
                    }
                }
                url = FetchContent.GetNextPageUrl(html, url);
            }
            EchoHelper.EchoPickEnd();
        }

コード例 #2

ファイルを表示

ファイル: Fetch.cs プロジェクト: zq535228/renzhex3

 public static void GetContentFromUrl(string url, ref string title, ref string content)
 {
     EchoHelper.EchoPickStart();
     try {
         url       = HttpUtility.UrlDecode(url);
         nextPages = new ArrayList();
         while (url != "")
         {
             string html = FetchContent.GetDataFromUrl(url);
             nextPages.Add(url);
             if (string.IsNullOrEmpty(title))
             {
                 title = RegexHelper.getHtmlRegexText(html, "{<title>(.*?)</title>}");
                 title = RegexHelper.regReplace(title, "_.*", "");
                 title = RegexHelper.regReplace(title, "-.*", "");
                 title = title.Replace("&nbsp;", "");
             }
             content += FetchContent.GetMainContent(html);
             url      = FetchContent.GetNextPageUrl(html, url);
             url.Trim();
         }
         if (title.Contains("<title>(.*"))
         {
             title = StringHelper.SubString(content, 0, 50);
         }
     } catch {
         title   = "";
         content = "";
         EchoHelper.Echo("采集跳过，原因可能是：该文章设置了密码、被删除、乱码等。", "采集出错", EchoHelper.EchoType.普通信息);
     }
     EchoHelper.EchoPickEnd();
 }