C# (CSharp) RuiJi.Net.NodeVisitor Crawler 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: RuiJi.Net.NodeVisitor

클래스/타입: Crawler

hotexamples.com에서의 예제들: 2

C# (CSharp) RuiJi.Net.NodeVisitor Crawler - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 RuiJi.Net.NodeVisitor.Crawler에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Request(3)

예제 #1

파일 보기

파일: ContentQueue.cs 프로젝트: xiangsxuan/RuiJi.Net

        public List <ExtractResult> Extract(string url)
        {
            var cralwer  = new RuiJi.Net.NodeVisitor.Crawler();
            var response = cralwer.Request(url);
            var content  = response.Data.ToString();

            var results = new List <ExtractResult>();

            var blocks = Feeder.GetExtractBlock(url);

            blocks.ForEach((m) => {
                var r = RuiJi.Net.NodeVisitor.Extracter.Extract(new ExtractRequest
                {
                    Block   = m,
                    Content = content
                });

                results.Add(r);
            });

            return(results);
        }

예제 #2

파일 보기

파일: Cooperater.cs 프로젝트: zymITsky/RuiJi.Net

        private static void DownloadPage(Uri uri, ExtractResult result, string method, string ip, PageDownloadHandler handler, int maxRetry = 10)
        {
            handler(uri, result);

            var pages = new Dictionary <string, ExtractResult>();

            pages.Add(uri.ToString(), result);

            var lines  = String.Join("\n", result.Paging.Distinct());
            var reader = new StringReader(lines);

            var crawler = new RuiJiCrawler();

            var url = reader.ReadLine();

            var diffBuilder = new InlineDiffBuilder(new Differ());

            while (!string.IsNullOrEmpty(url))
            {
                var u = new Uri(uri, url);
                if (pages.ContainsKey(u.ToString()))
                {
                    url = reader.ReadLine();
                    continue;
                }

                var request = new Request(u);
                request.Method = method;

                if (!string.IsNullOrEmpty(ip))
                {
                    request.Ip = ip;
                }

                var response = Crawler.Request(request);
                var content  = response.Data.ToString();

                var blocks = Feeder.GetExtractBlock(u.ToString());
                var er     = new ExtractRequest
                {
                    Blocks  = blocks,
                    Content = content
                };

                var results = Extractor.Extract(er);

                var r = results.OrderByDescending(m => m.Metas.Count).FirstOrDefault();
                if (r.Paging == null)
                {
                    Thread.Sleep(3000);
                    if (--maxRetry == 0)
                    {
                        break;
                    }

                    continue;
                }

                handler(uri, result);

                if (r.Paging != null && r.Paging.Count > 0)
                {
                    var nlines = String.Join("\n", r.Paging.Distinct());
                    var diff   = diffBuilder.BuildDiffModel(lines, nlines);

                    nlines = string.Join("\n", diff.Lines.Select(m => m.Text));
                    reader = new StringReader(nlines);
                    url    = reader.ReadLine();
                }
            }
        }