C# (CSharp) Spider ParseHTML 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: Spider

클래스/타입: ParseHTML

hotexamples.com에서의 예제들: 3

C# (CSharp) Spider ParseHTML - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 Spider.ParseHTML에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Parse(2)

Eof(1)

GetTag(1)

eof(1)

get(1)

예제 #1

파일 보기

        /// <summary>
        /// Process a URL
        /// </summary>
        /// <param name="page">the URL to process</param>
        private void ProcessPage(string page)
        {
            ParseHTML parse = new ParseHTML();

            parse.Source = page;

            while (!parse.Eof())
            {
                char ch = parse.Parse();
                if (ch == 0)
                {
                    Attribute a = parse.GetTag()["HREF"];
                    if (a != null)
                    {
                        ProcessLink(a.Value);
                    }

                    a = parse.GetTag()["SRC"];
                    if (a != null)
                    {
                        ProcessLink(a.Value);
                    }
                }
            }
        }

예제 #2

파일 보기

        private void ProcessPage(string page)
        {
            ParseHTML parse = new ParseHTML();

            parse.Source = page; //page为要解析的HTML文档
            while (!parse.eof()) //利用循环来检查HTML文档包含的所有文本和标记
            {
                char ch = parse.Parse();
                //Parse方法将返回HTML文档包含的字符--它返回的内容只包含那些非HTML标记的字符，如果遇到了HTML标记，Parse方法将返回0值，表示现在遇到了一个HTML标记。
                //遇到一个标记之后，用GetTag()方法来处理它。
                if (ch == 0)
                {
                    Attribute a = parse.get()["HREF"];
                    if (a != null)
                    {
                        ProcessLink(a.Value);           //提取出HREF属性的值
                    }
                    a = parse.get()["SRC"];
                    if (a != null)
                    {
                        ProcessLink(a.Value);           //提取出SRC属性的值
                    }
                    if (spider.Flag == 1)
                    {
                        a = parse.get()["IMG"];
                        if (a != null && (a.Name.ToLower() == "src" || a.Name.ToLower() == "href"))
                        {
                            Uri url = new Uri(uri, a.Value);
                            if (spider.addIMG(url))
                            {
                                getpage(url);
                            }
                        }
                    }
                }
            }
        }

예제 #3

파일 보기

파일: DocumentWorker.cs 프로젝트: asr340/owasp-code-central

        /// <summary>
        /// Process a URL
        /// </summary>
        /// <param name="page">the URL to process</param>
        private void ProcessPage(string page)
        {
            ParseHTML parse = new ParseHTML();
            parse.Source = page;

            while(!parse.Eof())
            {
                char ch = parse.Parse();
                if(ch==0)
                {
                    Attribute a = parse.GetTag()["HREF"];
                    if( a!=null )
                        ProcessLink(a.Value);

                    a = parse.GetTag()["SRC"];
                    if( a!=null )
                        ProcessLink(a.Value);
                }
            }
        }