C# (CSharp) Crawler UrlSanitiser示例

编程语言: C# (CSharp)

命名空间/包名称: Crawler

类/类型: UrlSanitiser

hotexamples.com的示例: 2

C# (CSharp) Crawler UrlSanitiser - 已找到2个示例。这些是从开源项目中提取的最受好评的Crawler.UrlSanitiser现实C# (CSharp)示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： CrawlRunner.cs 项目： chaoaretasty/Hirespace-Crawler

 public CrawlRunner(Uri root, HttpClient client, HtmlParser parser, UrlSanitiser sanitiser)
 {
     _sanitiser = sanitiser;
     _client    = client;
     _parser    = parser;
     AddUrlToCrawl(root);
     client.DefaultRequestHeaders.Add("user-agent", "Coding Sample Crawler");
 }

示例#2

显示文件

文件： Program.cs 项目： chaoaretasty/Hirespace-Crawler

        static void Main(string[] args)
        {
            //Obvious future enhancement, get domain via args
            var domain = new Uri("https://hirespace.com/");

            var client = new HttpClient();
            var parser = new HtmlParser();

            //Whether the sanitiser should be owned by the crawler or not for a larger solution is questionable,
            //you may wish differing sanitiser behaviours regarding eg casing or trailing slashes
            //In a larger project where this is the case you would ideally have unit tests for sanitiser separate and only test the crawler called it
            var sanitiser = new UrlSanitiser(domain);

            var runner = new CrawlRunner(domain, client, parser, sanitiser);

            var runnerTask = Task.Run(() => runner.Crawl());

            runnerTask.Wait();

            new CrawlOutputer(runnerTask.Result).CreateReport();

            Console.WriteLine("Crawl complete, press enter to close");
            Console.ReadLine();
        }