C# (CSharp) CrawlerPageNode示例

编程语言: C# (CSharp)

类/类型: CrawlerPageNode

hotexamples.com的示例: 2

C# (CSharp) CrawlerPageNode - 已找到2个示例。这些是从开源项目中提取的最受好评的CrawlerPageNode现实C# (CSharp)示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

        async Task <CrawlerPageNode> IPageLoader.LoadPageAsync(string url, CrawlerPageNode parentPage)
        {
            if (_alreadyLoadedUrls.Contains(url))
            {
                return(null);
            }

            var page = await _baseLoader.LoadPageAsync(url, parentPage);

            _alreadyLoadedUrls.Add(url);
            return(page);
        }

示例#2

显示文件

文件： PageLoader.cs 项目： kicker3082/LeadGen2

        /// <summary>
        /// Recursively capture the page content and links
        /// </summary>
        /// <param name="url">The url to start from</param>
        /// <returns>A set of all of the child pages</returns>
        async Task <CrawlerPageNode> IPageLoader.LoadPageAsync(string url, CrawlerPageNode parentPage)
        {
            var pageText = await _webClient.DownloadStringTaskAsync(url);

            // Make sure to add the startingUrl to the set of visited pages so we don't wrap around to the top
            // page.

            var thisPage = new CrawlerPageNode
            {
                PageUrl     = url,
                HTMLContent = pageText,
                Parent      = parentPage
            };

            var navLinks = _navigationLinkParser.ParseHtml(pageText);

            thisPage.LinksInPage = navLinks;

            return(thisPage);
        }