C# (CSharp) HtmlLoader.LoadDocument Examples

Programming Language: C# (CSharp)

Class/Type: HtmlLoader

Method/Function: LoadDocument

Examples at hotexamples.com: 1

C# (CSharp) HtmlLoader.LoadDocument - 1 examples found. These are the top rated real world C# (CSharp) examples of HtmlLoader.LoadDocument extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

GetSourceByPageId(8)

LoadFromFile(7)

Load(6)

TryLoadAndParsePageAsync(2)

LoadAsync(2)

GetPageAsync(1)

LoadDocumentAsync(1)

TryLoadAgentSource(1)

SetUrl(1)

LoadErrorPage(1)

LoadBlockedPage(1)

LoadDocument(1)

GetSource(1)

LoadBlockedContent(1)

GetSourceByUrl(1)

GetSourceByPage(1)

GetSourceAsync(1)

TryLoadPageAsync(1)

Example #1

Show file

File: WebScraperBase.cs Project: jd-x/ApplManga

        protected virtual void StartScraping()
        {
            AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Started WebScraper @(" + BaseURL + ")...");

            for (var nextPage = 1; ; nextPage++)
            {
                var nextURL = CreateNextURL(nextPage);
                var doc     = HtmlLoader.LoadDocument(nextURL);

                AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Processing page [" + nextPage.ToString() + "] @(" + nextURL + ")");

                var rows     = GetMangaRows(doc);
                var rowCount = rows.Count();

                AppLogHelper.Log(AppLoggerBase.LogTarget.File, "[" + rowCount + "] rows found. Processing rows...");

                if (rowCount == 0)
                {
                    AppLogHelper.Log(AppLoggerBase.LogTarget.File, "No more titles found, exiting main loop...");
                    break;
                }

                foreach (var row in rows)
                {
                    var title = GetMangaTitle(row);
                    if (title == null)
                    {
                        AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Failed in extracting title, skipping...");
                        continue;
                    }

                    var titleURL = GetMangaURL(row);
                    if (titleURL == null)
                    {
                        AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Failed in extracting URL, skipping...");
                        continue;
                    }

                    var author = GetMangaAuthor(row);
                    if (author == null)
                    {
                        AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Failed in extracting author, skipping...");
                        continue;
                    }

                    var imagePath = GetMangaImagePath(row);
                    if (imagePath == null)
                    {
                        AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Failed in extracting image URL, skipping...");
                        continue;
                    }

                    var pubStatus = GetMangaPublishingStatus(row);
                    if (pubStatus == null)
                    {
                        AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Failed in extracting publishing status, skipping...");
                        continue;
                    }

                    AppLogHelper.Log(AppLoggerBase.LogTarget.File, title + ", " + titleURL);

                    var mangaEntry = new MangaList {
                        Title     = title,
                        Site      = titleURL,
                        Author    = author,
                        ImagePath = imagePath,
                        PubStatus = pubStatus
                    };

                    ScraperRepo.AddEntry(mangaEntry);
                }
                ScraperRepo.SaveChanges();
                AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Successfully added [" + rowCount + "] records to repository");

                var hasOnePageOnly = HasOnePageOnly();
                if (hasOnePageOnly)
                {
                    break;
                }

                AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Finished scraping page [" + nextPage + "]");
            }
            AppLogHelper.Log(AppLoggerBase.LogTarget.File, "Finished scraping @(" + BaseURL + ")");
        }