C# (CSharp) Dark.Common.Crawler CrawlerOptions示例

编程语言: C# (CSharp)

命名空间/包名称: Dark.Common.Crawler

类/类型: CrawlerOptions

hotexamples.com的示例: 2

C# (CSharp) Dark.Common.Crawler CrawlerOptions - 已找到2个示例。这些是从开源项目中提取的最受好评的Dark.Common.Crawler.CrawlerOptions现实C# (CSharp)示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

        /// <summary>
        /// 创建HtmlDocument
        /// </summary>
        /// <param name="opts"></param>
        /// <returns></returns>
        private static async Task <IHtmlDocument> CreateDocumnet(CrawlerOptions opts)
        {
            var source = string.Empty;

            if (!string.IsNullOrEmpty(opts.Url))
            {
                source = await HttpTools.GetStringAsync(opts.Url);
            }
            if (!string.IsNullOrEmpty(opts.Content))
            {
                source = opts.Content;
            }

            //1.创建一个html解析器
            var parser = new HtmlParser();
            //2.解析数据源
            var document = parser.Parse(source);

            //3.返回document
            return(document);
        }

示例#2

显示文件

        /// <summary>
        /// 获取爬虫字典
        /// </summary>
        /// <param name="opts"></param>
        /// <returns></returns>
        public static async Task <Dictionary <string, List <CrawlerResult> > > GetResultAsync(CrawlerOptions opts)
        {
            Dictionary <string, List <CrawlerResult> > dictResult = new Dictionary <string, List <CrawlerResult> >();
            var document = await CreateDocumnet(opts);

            //多线程爬虫
            List <Task> tasks = new List <Task>();

            opts.CssSelectors.ForEach(u =>
            {
                //启动多线程
                tasks.Add(Task.Factory.StartNew(() =>
                {
                    var elements = document.QuerySelectorAll(u.Selector);
                    List <CrawlerResult> cResults = new List <CrawlerResult>();
                    //是一个集合
                    foreach (var element in elements)
                    {
                        cResults.Add(CreateCResult(element));
                    }
                    dictResult[u.Name] = cResults;
                }));
            });

            Task.WaitAll(tasks.ToArray());
            // 获取html 元素
            return(await Task.FromResult(dictResult));
        }