C# (CSharp) TidyNet Lexer.InlineDup 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: TidyNet

클래스/타입: Lexer

메소드/함수: InlineDup

hotexamples.com에서의 예제들: 4

C# (CSharp) TidyNet Lexer.InlineDup - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 TidyNet.Lexer.InlineDup에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

GetToken(20)

InferredTag(20)

UngetToken(17)

PopInline(5)

NewNode(4)

InlineDup(4)

AddStringLiteral(3)

FixXmlPI(2)

CanPrune(1)

SetXhtmlDocType(1)

PushInline(1)

NewLineNode(1)

IsPushed(1)

HtmlVersionName(1)

CheckDocTypeKeyWords(1)

AddGenerator(1)

GetCDATA(1)

FixId(1)

FixDocType(1)

DeferDup(1)

CloneNode(1)

AddCharToLexer(1)

예제 #1

파일 보기

파일: ParserImpl.cs 프로젝트: erikzaadi/atomsitethemes.erikzaadi.com

			public virtual void Parse(Lexer lexer, Node body, short mode)
			{
				Node node;
				bool checkstack, iswhitenode;
				
				mode = Lexer.IgnoreWhitespace;
				checkstack = true;
				TagTable tt = lexer.Options.tt;
				
				while (true)
				{
					node = lexer.GetToken(mode);
					if (node == null)
					{
						break;
					}
					if (node.Tag == body.Tag && node.Type == Node.EndTag)
					{
						body.Closed = true;
						Node.TrimSpaces(lexer, body);
						lexer.seenBodyEndTag = 1;
						mode = Lexer.IgnoreWhitespace;
						
						if (body.Parent.Tag == tt.TagNoframes)
						{
							break;
						}
						
						continue;
					}
					
					if (node.Tag == tt.TagNoframes)
					{
						if (node.Type == Node.StartTag)
						{
							Node.InsertNodeAtEnd(body, node);
							TidyNet.ParserImpl.ParseBlock.Parse(lexer, node, mode);
							continue;
						}
						
						if (node.Type == Node.EndTag && body.Parent.Tag == tt.TagNoframes)
						{
							Node.TrimSpaces(lexer, body);
							lexer.UngetToken();
							break;
						}
					}
					
					if ((node.Tag == tt.TagFrame || node.Tag == tt.TagFrameset) && body.Parent.Tag == tt.TagNoframes)
					{
						Node.TrimSpaces(lexer, body);
						lexer.UngetToken();
						break;
					}
					
					if (node.Tag == tt.TagHtml)
					{
						if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
						{
							Report.Warning(lexer, body, node, Report.DISCARDING_UNEXPECTED);
						}
						
						continue;
					}
					
					iswhitenode = false;
					
					if (node.Type == Node.TextNode && node.End <= node.Start + 1 && node.Textarray[node.Start] == (sbyte) ' ')
					{
						iswhitenode = true;
					}
					
					/* deal with comments etc. */
					if (Node.InsertMisc(body, node))
					{
						continue;
					}
					
					if (lexer.seenBodyEndTag == 1 && !iswhitenode)
					{
						++lexer.seenBodyEndTag;
						Report.Warning(lexer, body, node, Report.CONTENT_AFTER_BODY);
					}
					
					/* mixed content model permits text */
					if (node.Type == Node.TextNode)
					{
						if (iswhitenode && mode == Lexer.IgnoreWhitespace)
						{
							continue;
						}
						
						if (lexer.Options.EncloseText && !iswhitenode)
						{
							Node para;
							
							lexer.UngetToken();
							para = lexer.InferredTag("p");
							Node.InsertNodeAtEnd(body, para);
							TidyNet.ParserImpl.parseTag(lexer, para, mode);
							mode = Lexer.MixedContent;
							continue;
						}
						else
						{
							/* strict doesn't allow text here */
							lexer.versions &= ~ (HtmlVersion.Html40Strict | HtmlVersion.Html20);
						}
						
						if (checkstack)
						{
							checkstack = false;
							
							if (lexer.InlineDup(node) > 0)
							{
								continue;
							}
						}
						
						Node.InsertNodeAtEnd(body, node);
						mode = Lexer.MixedContent;
						continue;
					}
					
					if (node.Type == Node.DocTypeTag)
					{
						Node.InsertDocType(lexer, body, node);
						continue;
					}
					/* discard unknown  and PARAM tags */
					if (node.Tag == null || node.Tag == tt.TagParam)
					{
						Report.Warning(lexer, body, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					/*
					Netscape allows LI and DD directly in BODY
					We infer UL or DL respectively and use this
					boolean to exclude block-level elements so as
					to match Netscape's observed behaviour.
					*/
					lexer.excludeBlocks = false;
					
					if (!((node.Tag.Model & ContentModel.Block) != 0) && !((node.Tag.Model & ContentModel.Inline) != 0))
					{
						/* avoid this error message being issued twice */
						if (!((node.Tag.Model & ContentModel.Head) != 0))
						{
							Report.Warning(lexer, body, node, Report.TAG_NOT_ALLOWED_IN);
						}
						
						if ((node.Tag.Model & ContentModel.Html) != 0)
						{
							/* copy body attributes if current body was inferred */
							if (node.Tag == tt.TagBody && body.Isimplicit && body.Attributes == null)
							{
								body.Attributes = node.Attributes;
								node.Attributes = null;
							}
							
							continue;
						}
						
						if ((node.Tag.Model & ContentModel.Head) != 0)
						{
							TidyNet.ParserImpl.moveToHead(lexer, body, node);
							continue;
						}
						
						if ((node.Tag.Model & ContentModel.List) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("ul");
							Node.AddClass(node, "noindent");
							lexer.excludeBlocks = true;
						}
						else if ((node.Tag.Model & ContentModel.Deflist) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("dl");
							lexer.excludeBlocks = true;
						}
						else if ((node.Tag.Model & (ContentModel.Table | ContentModel.Rowgrp | ContentModel.Row)) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("table");
							lexer.excludeBlocks = true;
						}
						else
						{
							/* AQ: The following line is from the official C
							version of tidy.  It doesn't make sense to me
							because the '!' operator has higher precedence
							than the '&' operator.  It seems to me that the
							expression always evaluates to 0.
							
							if (!node->tag->model & (CM_ROW | CM_FIELD))
							
							AQ: 13Jan2000 fixed in C tidy
							*/
							if (!((node.Tag.Model & (ContentModel.Row | ContentModel.Field)) != 0))
							{
								lexer.UngetToken();
								return;
							}
							
							/* ignore </td> </th> <option> etc. */
							continue;
						}
					}
					
					if (node.Type == Node.EndTag)
					{
						if (node.Tag == tt.TagBr)
						{
							node.Type = Node.StartTag;
						}
						else if (node.Tag == tt.TagP)
						{
							Node.CoerceNode(lexer, node, tt.TagBr);
							Node.InsertNodeAtEnd(body, node);
							node = lexer.InferredTag("br");
						}
						else if ((node.Tag.Model & ContentModel.Inline) != 0)
						{
							lexer.PopInline(node);
						}
					}
					
					if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
					{
						if (((node.Tag.Model & ContentModel.Inline) != 0) && !((node.Tag.Model & ContentModel.Mixed) != 0))
						{
							/* HTML4 strict doesn't allow inline content here */
							/* but HTML2 does allow img elements as children of body */
							if (node.Tag == tt.TagImg)
							{
								lexer.versions &= ~ HtmlVersion.Html40Strict;
							}
							else
							{
								lexer.versions &= ~ (HtmlVersion.Html40Strict | HtmlVersion.Html20);
							}
							
							if (checkstack && !node.Isimplicit)
							{
								checkstack = false;
								
								if (lexer.InlineDup(node) > 0)
								{
									continue;
								}
							}
							
							mode = Lexer.MixedContent;
						}
						else
						{
							checkstack = true;
							mode = Lexer.IgnoreWhitespace;
						}
						
						if (node.Isimplicit)
						{
							Report.Warning(lexer, body, node, Report.INSERTING_TAG);
						}
						
						Node.InsertNodeAtEnd(body, node);
						TidyNet.ParserImpl.parseTag(lexer, node, mode);
						continue;
					}
					
					/* discard unexpected tags */
					Report.Warning(lexer, body, node, Report.DISCARDING_UNEXPECTED);
				}
			}

예제 #2

파일 보기

파일: ParserImpl.cs 프로젝트: erikzaadi/atomsitethemes.erikzaadi.com

			public virtual void Parse(Lexer lexer, Node pre, short mode)
			{
				Node node, parent;
				TagTable tt = lexer.Options.tt;
				
				if ((pre.Tag.Model & ContentModel.Empty) != 0)
				{
					return;
				}
				
				if ((pre.Tag.Model & ContentModel.Obsolete) != 0)
				{
					Node.CoerceNode(lexer, pre, tt.TagPre);
				}
				
				lexer.InlineDup(null); /* tell lexer to insert inlines if needed */
				
				while (true)
				{
					node = lexer.GetToken(Lexer.Preformatted);
					if (node == null)
					{
						break;
					}
					if (node.Tag == pre.Tag && node.Type == Node.EndTag)
					{
						Node.TrimSpaces(lexer, pre);
						pre.Closed = true;
						Node.TrimEmptyElement(lexer, pre);
						return;
					}
					
					if (node.Tag == tt.TagHtml)
					{
						if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
						{
							Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
						}
						
						continue;
					}
					
					if (node.Type == Node.TextNode)
					{
						/* if first check for inital newline */
						if (pre.Content == null)
						{
							if (node.Textarray[node.Start] == (sbyte) '\n')
							{
								++node.Start;
							}
							
							if (node.Start >= node.End)
							{
								continue;
							}
						}
						
						Node.InsertNodeAtEnd(pre, node);
						continue;
					}
					
					/* deal with comments etc. */
					if (Node.InsertMisc(pre, node))
					{
						continue;
					}
					
					/* discard unknown  and PARAM tags */
					if (node.Tag == null || node.Tag == tt.TagParam)
					{
						Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					if (node.Tag == tt.TagP)
					{
						if (node.Type == Node.StartTag)
						{
							Report.Warning(lexer, pre, node, Report.USING_BR_INPLACE_OF);
							
							/* trim white space before <p> in <pre>*/
							Node.TrimSpaces(lexer, pre);
							
							/* coerce both <p> and </p> to <br> */
							Node.CoerceNode(lexer, node, tt.TagBr);
							Node.InsertNodeAtEnd(pre, node);
						}
						else
						{
							Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
						}
						continue;
					}
					
					if ((node.Tag.Model & ContentModel.Head) != 0 && !((node.Tag.Model & ContentModel.Block) != 0))
					{
						TidyNet.ParserImpl.moveToHead(lexer, pre, node);
						continue;
					}
					
					/* 
					if this is the end tag for an ancestor element
					then infer end tag for this element
					*/
					if (node.Type == Node.EndTag)
					{
						if (node.Tag == tt.TagForm)
						{
							lexer.badForm = 1;
							Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
						
						for (parent = pre.Parent; parent != null; parent = parent.Parent)
						{
							if (node.Tag == parent.Tag)
							{
								Report.Warning(lexer, pre, node, Report.MISSING_ENDTAG_BEFORE);
								
								lexer.UngetToken();
								Node.TrimSpaces(lexer, pre);
								Node.TrimEmptyElement(lexer, pre);
								return;
							}
						}
					}
					
					/* what about head content, HEAD, BODY tags etc? */
					if (!((node.Tag.Model & ContentModel.Inline) != 0))
					{
						if (node.Type != Node.StartTag)
						{
							Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
						
						Report.Warning(lexer, pre, node, Report.MISSING_ENDTAG_BEFORE);
						lexer.excludeBlocks = true;
						
						/* check if we need to infer a container */
						if ((node.Tag.Model & ContentModel.List) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("ul");
							Node.AddClass(node, "noindent");
						}
						else if ((node.Tag.Model & ContentModel.Deflist) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("dl");
						}
						else if ((node.Tag.Model & ContentModel.Table) != 0)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("table");
						}
						
						Node.InsertNodeAfterElement(pre, node);
						pre = lexer.InferredTag("pre");
						Node.InsertNodeAfterElement(node, pre);
						TidyNet.ParserImpl.parseTag(lexer, node, Lexer.IgnoreWhitespace);
						lexer.excludeBlocks = false;
						continue;
					}
					/*
					if (!((node.Tag.Model & ContentModel.INLINE) != 0))
					{
					Report.Warning(lexer, pre, node, Report.MISSING_ENDTAG_BEFORE);
					lexer.UngetToken();
					return;
					}
					*/
					if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
					{
						/* trim white space before <br> */
						if (node.Tag == tt.TagBr)
						{
							Node.TrimSpaces(lexer, pre);
						}
						
						Node.InsertNodeAtEnd(pre, node);
						TidyNet.ParserImpl.parseTag(lexer, node, Lexer.Preformatted);
						continue;
					}
					
					/* discard unexpected tags */
					Report.Warning(lexer, pre, node, Report.DISCARDING_UNEXPECTED);
				}
				
				Report.Warning(lexer, pre, node, Report.MISSING_ENDTAG_FOR);
				Node.TrimEmptyElement(lexer, pre);
			}

예제 #3

파일 보기

파일: ParserImpl.cs 프로젝트: erikzaadi/atomsitethemes.erikzaadi.com

			/*
			element is node created by the lexer
			upon seeing the start tag, or by the
			parser when the start tag is inferred
			*/
			public virtual void Parse(Lexer lexer, Node element, short mode)
			{
				Node node, parent;
				bool checkstack;
				int istackbase = 0;
				TagTable tt = lexer.Options.tt;
				
				checkstack = true;
				
				if ((element.Tag.Model & ContentModel.Empty) != 0)
				{
					return;
				}
				
				if (element.Tag == tt.TagForm && element.IsDescendantOf(tt.TagForm))
				{
					Report.Warning(lexer, element, null, Report.ILLEGAL_NESTING);
				}
				
				/*
				InlineDup() asks the lexer to insert inline emphasis tags
				currently pushed on the istack, but take care to avoid
				propagating inline emphasis inside OBJECT or APPLET.
				For these elements a fresh inline stack context is created
				and disposed of upon reaching the end of the element.
				They thus behave like table cells in this respect.
				*/
				if ((element.Tag.Model & ContentModel.Object) != 0)
				{
					istackbase = lexer.istackbase;
					lexer.istackbase = lexer.istack.Count;
				}
				
				if (!((element.Tag.Model & ContentModel.Mixed) != 0))
				{
					lexer.InlineDup(null);
				}
				
				mode = Lexer.IgnoreWhitespace;
				
				while (true)
				{
					node = lexer.GetToken(mode);
					if (node == null)
					{
						break;
					}

					/* end tag for this element */
					if (node.Type == Node.EndTag && node.Tag != null && (node.Tag == element.Tag || element.Was == node.Tag))
					{
						if ((element.Tag.Model & ContentModel.Object) != 0)
						{
							/* pop inline stack */
							while (lexer.istack.Count > lexer.istackbase)
							{
								lexer.PopInline(null);
							}
							lexer.istackbase = istackbase;
						}
						
						element.Closed = true;
						Node.TrimSpaces(lexer, element);
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					if (node.Tag == tt.TagHtml || node.Tag == tt.TagHead || node.Tag == tt.TagBody)
					{
						if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
						{
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
						}
						
						continue;
					}
					
					if (node.Type == Node.EndTag)
					{
						if (node.Tag == null)
						{
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
							
							continue;
						}
						else if (node.Tag == tt.TagBr)
						{
							node.Type = Node.StartTag;
						}
						else if (node.Tag == tt.TagP)
						{
							Node.CoerceNode(lexer, node, tt.TagBr);
							Node.InsertNodeAtEnd(element, node);
							node = lexer.InferredTag("br");
						}
						else
						{
							/* 
							if this is the end tag for an ancestor element
							then infer end tag for this element
							*/
							for (parent = element.Parent; parent != null; parent = parent.Parent)
							{
								if (node.Tag == parent.Tag)
								{
									if (!((element.Tag.Model & ContentModel.Opt) != 0))
									{
										Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
									}
									
									lexer.UngetToken();
									
									if ((element.Tag.Model & ContentModel.Object) != 0)
									{
										/* pop inline stack */
										while (lexer.istack.Count > lexer.istackbase)
										{
											lexer.PopInline(null);
										}
										lexer.istackbase = istackbase;
									}
									
									Node.TrimSpaces(lexer, element);
									Node.TrimEmptyElement(lexer, element);
									return;
								}
							}
							/* special case </tr> etc. for stuff moved in front of table */
							if (lexer.exiled && node.Tag.Model != 0 && (node.Tag.Model & ContentModel.Table) != 0)
							{
								lexer.UngetToken();
								Node.TrimSpaces(lexer, element);
								Node.TrimEmptyElement(lexer, element);
								return;
							}
						}
					}
					
					/* mixed content model permits text */
					if (node.Type == Node.TextNode)
					{
						bool iswhitenode = false;
						
						if (node.Type == Node.TextNode && node.End <= node.Start + 1 && lexer.lexbuf[node.Start] == (sbyte) ' ')
						{
							iswhitenode = true;
						}
						
						if (lexer.Options.EncloseBlockText && !iswhitenode)
						{
							lexer.UngetToken();
							node = lexer.InferredTag("p");
							Node.InsertNodeAtEnd(element, node);
							TidyNet.ParserImpl.parseTag(lexer, node, Lexer.MixedContent);
							continue;
						}
						
						if (checkstack)
						{
							checkstack = false;
							
							if (!((element.Tag.Model & ContentModel.Mixed) != 0))
							{
								if (lexer.InlineDup(node) > 0)
								{
									continue;
								}
							}
						}
						
						Node.InsertNodeAtEnd(element, node);
						mode = Lexer.MixedContent;
						/*
						HTML4 strict doesn't allow mixed content for
						elements with %block; as their content model
						*/
						lexer.versions &= ~ HtmlVersion.Html40Strict;
						continue;
					}
					
					if (Node.InsertMisc(element, node))
					{
						continue;
					}
					
					/* allow PARAM elements? */
					if (node.Tag == tt.TagParam)
					{
						if (((element.Tag.Model & ContentModel.Param) != 0) && (node.Type == Node.StartTag || node.Type == Node.StartEndTag))
						{
							Node.InsertNodeAtEnd(element, node);
							continue;
						}
						
						/* otherwise discard it */
						Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					/* allow AREA elements? */
					if (node.Tag == tt.TagArea)
					{
						if ((element.Tag == tt.TagMap) && (node.Type == Node.StartTag || node.Type == Node.StartEndTag))
						{
							Node.InsertNodeAtEnd(element, node);
							continue;
						}
						
						/* otherwise discard it */
						Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					/* ignore unknown start/end tags */
					if (node.Tag == null)
					{
						Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					/*
					Allow ContentModel.INLINE elements here.
					
					Allow ContentModel.BLOCK elements here unless
					lexer.excludeBlocks is yes.
					
					LI and DD are special cased.
					
					Otherwise infer end tag for this element.
					*/
					
					if (!((node.Tag.Model & ContentModel.Inline) != 0))
					{
						if (node.Type != Node.StartTag && node.Type != Node.StartEndTag)
						{
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
						
						if (element.Tag == tt.TagTd || element.Tag == tt.TagTh)
						{
							/* if parent is a table cell, avoid inferring the end of the cell */
							
							if ((node.Tag.Model & ContentModel.Head) != 0)
							{
								TidyNet.ParserImpl.moveToHead(lexer, element, node);
								continue;
							}
							
							if ((node.Tag.Model & ContentModel.List) != 0)
							{
								lexer.UngetToken();
								node = lexer.InferredTag("ul");
								Node.AddClass(node, "noindent");
								lexer.excludeBlocks = true;
							}
							else if ((node.Tag.Model & ContentModel.Deflist) != 0)
							{
								lexer.UngetToken();
								node = lexer.InferredTag("dl");
								lexer.excludeBlocks = true;
							}
							
							/* infer end of current table cell */
							if (!((node.Tag.Model & ContentModel.Block) != 0))
							{
								lexer.UngetToken();
								Node.TrimSpaces(lexer, element);
								Node.TrimEmptyElement(lexer, element);
								return;
							}
						}
						else if ((node.Tag.Model & ContentModel.Block) != 0)
						{
							if (lexer.excludeBlocks)
							{
								if (!((element.Tag.Model & ContentModel.Opt) != 0))
									Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
								
								lexer.UngetToken();
								
								if ((element.Tag.Model & ContentModel.Object) != 0)
									lexer.istackbase = istackbase;
								
								Node.TrimSpaces(lexer, element);
								Node.TrimEmptyElement(lexer, element);
								return;
							}
						}
						/* things like list items */
						else
						{
							if (!((element.Tag.Model & ContentModel.Opt) != 0) && !element.Isimplicit)
								Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
							
							if ((node.Tag.Model & ContentModel.Head) != 0)
							{
								TidyNet.ParserImpl.moveToHead(lexer, element, node);
								continue;
							}
							
							lexer.UngetToken();
							
							if ((node.Tag.Model & ContentModel.List) != 0)
							{
								if (element.Parent != null && element.Parent.Tag != null && element.Parent.Tag.Parser == TidyNet.ParserImpl.ParseList)
								{
									Node.TrimSpaces(lexer, element);
									Node.TrimEmptyElement(lexer, element);
									return;
								}
								
								node = lexer.InferredTag("ul");
								Node.AddClass(node, "noindent");
							}
							else if ((node.Tag.Model & ContentModel.Deflist) != 0)
							{
								if (element.Parent.Tag == tt.TagDl)
								{
									Node.TrimSpaces(lexer, element);
									Node.TrimEmptyElement(lexer, element);
									return;
								}
								
								node = lexer.InferredTag("dl");
							}
							else if ((node.Tag.Model & ContentModel.Table) != 0 || (node.Tag.Model & ContentModel.Row) != 0)
							{
								node = lexer.InferredTag("table");
							}
							else if ((element.Tag.Model & ContentModel.Object) != 0)
							{
								/* pop inline stack */
								while (lexer.istack.Count > lexer.istackbase)
								{
									lexer.PopInline(null);
								}
								lexer.istackbase = istackbase;
								Node.TrimSpaces(lexer, element);
								Node.TrimEmptyElement(lexer, element);
								return;
							}
							else
							{
								Node.TrimSpaces(lexer, element);
								Node.TrimEmptyElement(lexer, element);
								return;
							}
						}
					}
					
					/* parse known element */
					if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
					{
						if ((node.Tag.Model & ContentModel.Inline) != 0)
						{
							if (checkstack && !node.Isimplicit)
							{
								checkstack = false;
								
								if (lexer.InlineDup(node) > 0)
									continue;
							}
							
							mode = Lexer.MixedContent;
						}
						else
						{
							checkstack = true;
							mode = Lexer.IgnoreWhitespace;
						}
						
						/* trim white space before <br> */
						if (node.Tag == tt.TagBr)
						{
							Node.TrimSpaces(lexer, element);
						}
						
						Node.InsertNodeAtEnd(element, node);
						
						if (node.Isimplicit)
						{
							Report.Warning(lexer, element, node, Report.INSERTING_TAG);
						}
						
						TidyNet.ParserImpl.parseTag(lexer, node, Lexer.IgnoreWhitespace);
						continue;
					}
					
					/* discard unexpected tags */
					if (node.Type == Node.EndTag)
						lexer.PopInline(node);
					/* if inline end tag */
					
					Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
				}
				
				if (!((element.Tag.Model & ContentModel.Opt) != 0))
				{
					Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_FOR);
				}
				
				if ((element.Tag.Model & ContentModel.Object) != 0)
				{
					/* pop inline stack */
					while (lexer.istack.Count > lexer.istackbase)
					{
						lexer.PopInline(null);
					}
					lexer.istackbase = istackbase;
				}
				
				Node.TrimSpaces(lexer, element);
				Node.TrimEmptyElement(lexer, element);
			}

예제 #4

파일 보기

파일: ParserImpl.cs 프로젝트: erikzaadi/atomsitethemes.erikzaadi.com

			public virtual void Parse(Lexer lexer, Node element, short mode)
			{
				Node node, parent;
				TagTable tt = lexer.Options.tt;
				
				if ((element.Tag.Model & ContentModel.Empty) != 0)
				{
					return;
				}
				
				if (element.Tag == tt.TagA)
				{
					if (element.Attributes == null)
					{
						Report.Warning(lexer, element.Parent, element, Report.DISCARDING_UNEXPECTED);
						Node.DiscardElement(element);
						return;
					}
				}
				
				/*
				ParseInline is used for some block level elements like H1 to H6
				For such elements we need to insert inline emphasis tags currently
				on the inline stack. For Inline elements, we normally push them
				onto the inline stack provided they aren't implicit or OBJECT/APPLET.
				This test is carried out in PushInline and PopInline, see istack.c
				We don't push A or SPAN to replicate current browser behavior
				*/
				if (((element.Tag.Model & ContentModel.Block) != 0) || (element.Tag == tt.TagDt))
				{
					lexer.InlineDup(null);
				}
				else if ((element.Tag.Model & ContentModel.Inline) != 0 && element.Tag != tt.TagA && element.Tag != tt.TagSpan)
				{
					lexer.PushInline(element);
				}
				
				if (element.Tag == tt.TagNobr)
				{
					lexer.badLayout |= Report.USING_NOBR;
				}
				else if (element.Tag == tt.TagFont)
				{
					lexer.badLayout |= Report.USING_FONT;
				}
				
				/* Inline elements may or may not be within a preformatted element */
				if (mode != Lexer.Preformatted)
				{
					mode = Lexer.MixedContent;
				}
				
				while (true)
				{
					node = lexer.GetToken(mode);
					if (node == null)
					{
						break;
					}
					/* end tag for current element */
					if (node.Tag == element.Tag && node.Type == Node.EndTag)
					{
						if ((element.Tag.Model & ContentModel.Inline) != 0 && element.Tag != tt.TagA)
						{
							lexer.PopInline(node);
						}
						
						if (!((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						/*
						if a font element wraps an anchor and nothing else
						then move the font element inside the anchor since
						otherwise it won't alter the anchor text color
						*/
						if (element.Tag == tt.TagFont && element.Content != null && element.Content == element.Last)
						{
							Node child = element.Content;
							
							if (child.Tag == tt.TagA)
							{
								child.Parent = element.Parent;
								child.Next = element.Next;
								child.Prev = element.Prev;
								
								if (child.Prev != null)
								{
									child.Prev.Next = child;
								}
								else
								{
									child.Parent.Content = child;
								}
								
								if (child.Next != null)
								{
									child.Next.Prev = child;
								}
								else
								{
									child.Parent.Last = child;
								}
								
								element.Next = null;
								element.Prev = null;
								element.Parent = child;
								element.Content = child.Content;
								element.Last = child.Last;
								child.Content = element;
								child.Last = element;
								for (child = element.Content; child != null; child = child.Next)
								{
									child.Parent = element;
								}
							}
						}
						element.Closed = true;
						Node.TrimSpaces(lexer, element);
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					/* <u>...<u>  map 2nd <u> to </u> if 1st is explicit */
					/* otherwise emphasis nesting is probably unintentional */
					/* big and small have cumulative effect to leave them alone */
					if (node.Type == Node.StartTag && node.Tag == element.Tag && lexer.IsPushed(node) && !node.Isimplicit && !element.Isimplicit && node.Tag != null && ((node.Tag.Model & ContentModel.Inline) != 0) && node.Tag != tt.TagA && node.Tag != tt.TagFont && node.Tag != tt.TagBig && node.Tag != tt.TagSmall)
					{
						if (element.Content != null && node.Attributes == null)
						{
							Report.Warning(lexer, element, node, Report.COERCE_TO_ENDTAG);
							node.Type = Node.EndTag;
							lexer.UngetToken();
							continue;
						}
						
						Report.Warning(lexer, element, node, Report.NESTED_EMPHASIS);
					}
					
					if (node.Type == Node.TextNode)
					{
						/* only called for 1st child */
						if (element.Content == null && !((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						
						if (node.Start >= node.End)
						{
							continue;
						}
						
						Node.InsertNodeAtEnd(element, node);
						continue;
					}
					
					/* mixed content model so allow text */
					if (Node.InsertMisc(element, node))
					{
						continue;
					}
					
					/* deal with HTML tags */
					if (node.Tag == tt.TagHtml)
					{
						if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
						{
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
						
						/* otherwise infer end of inline element */
						lexer.UngetToken();
						if (!((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					/* within <dt> or <pre> map <p> to <br> */
					if (node.Tag == tt.TagP && node.Type == Node.StartTag && ((mode & Lexer.Preformatted) != 0 || element.Tag == tt.TagDt || element.IsDescendantOf(tt.TagDt)))
					{
						node.Tag = tt.TagBr;
						node.Element = "br";
						Node.TrimSpaces(lexer, element);
						Node.InsertNodeAtEnd(element, node);
						continue;
					}
					
					/* ignore unknown and PARAM tags */
					if (node.Tag == null || node.Tag == tt.TagParam)
					{
						Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
						continue;
					}
					
					if (node.Tag == tt.TagBr && node.Type == Node.EndTag)
					{
						node.Type = Node.StartTag;
					}
					
					if (node.Type == Node.EndTag)
					{
						/* coerce </br> to <br> */
						if (node.Tag == tt.TagBr)
						{
							node.Type = Node.StartTag;
						}
						else if (node.Tag == tt.TagP)
						{
							/* coerce unmatched </p> to <br><br> */
							if (!element.IsDescendantOf(tt.TagP))
							{
								Node.CoerceNode(lexer, node, tt.TagBr);
								Node.TrimSpaces(lexer, element);
								Node.InsertNodeAtEnd(element, node);
								node = lexer.InferredTag("br");
								continue;
							}
						}
						else if ((node.Tag.Model & ContentModel.Inline) != 0 && node.Tag != tt.TagA && !((node.Tag.Model & ContentModel.Object) != 0) && (element.Tag.Model & ContentModel.Inline) != 0)
						{
							/* allow any inline end tag to end current element */
							lexer.PopInline(element);
							
							if (element.Tag != tt.TagA)
							{
								if (node.Tag == tt.TagA && node.Tag != element.Tag)
								{
									Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
									lexer.UngetToken();
								}
								else
								{
									Report.Warning(lexer, element, node, Report.NON_MATCHING_ENDTAG);
								}
								
								if (!((mode & Lexer.Preformatted) != 0))
								{
									Node.TrimSpaces(lexer, element);
								}
								Node.TrimEmptyElement(lexer, element);
								return;
							}
							
							/* if parent is <a> then discard unexpected inline end tag */
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
							/* special case </tr> etc. for stuff moved in front of table */
						else if (lexer.exiled && node.Tag.Model != 0 && (node.Tag.Model & ContentModel.Table) != 0)
						{
							lexer.UngetToken();
							Node.TrimSpaces(lexer, element);
							Node.TrimEmptyElement(lexer, element);
							return;
						}
					}
					
					/* allow any header tag to end current header */
					if ((node.Tag.Model & ContentModel.Heading) != 0 && (element.Tag.Model & ContentModel.Heading) != 0)
					{
						if (node.Tag == element.Tag)
						{
							Report.Warning(lexer, element, node, Report.NON_MATCHING_ENDTAG);
						}
						else
						{
							Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
							lexer.UngetToken();
						}
						if (!((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					/*
					an <A> tag to ends any open <A> element
					but <A href=...> is mapped to </A><A href=...>
					*/
					if (node.Tag == tt.TagA && !node.Isimplicit && lexer.IsPushed(node))
					{
						/* coerce <a> to </a> unless it has some attributes */
						if (node.Attributes == null)
						{
							node.Type = Node.EndTag;
							Report.Warning(lexer, element, node, Report.COERCE_TO_ENDTAG);
							lexer.PopInline(node);
							lexer.UngetToken();
							continue;
						}
						
						lexer.UngetToken();
						Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
						lexer.PopInline(element);
						if (!((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					if ((element.Tag.Model & ContentModel.Heading) != 0)
					{
						if (node.Tag == tt.TagCenter || node.Tag == tt.TagDiv)
						{
							if (node.Type != Node.StartTag && node.Type != Node.StartEndTag)
							{
								Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
								continue;
							}
							
							Report.Warning(lexer, element, node, Report.TAG_NOT_ALLOWED_IN);
							
							/* insert center as parent if heading is empty */
							if (element.Content == null)
							{
								Node.InsertNodeAsParent(element, node);
								continue;
							}
							
							/* split heading and make center parent of 2nd part */
							Node.InsertNodeAfterElement(element, node);
							
							if (!((mode & Lexer.Preformatted) != 0))
							{
								Node.TrimSpaces(lexer, element);
							}
							
							element = lexer.CloneNode(element);
							element.Start = lexer.lexsize;
							element.End = lexer.lexsize;
							Node.InsertNodeAtEnd(node, element);
							continue;
						}
						
						if (node.Tag == tt.TagHr)
						{
							if (node.Type != Node.StartTag && node.Type != Node.StartEndTag)
							{
								Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
								continue;
							}
							
							Report.Warning(lexer, element, node, Report.TAG_NOT_ALLOWED_IN);
							
							/* insert hr before heading if heading is empty */
							if (element.Content == null)
							{
								Node.InsertNodeBeforeElement(element, node);
								continue;
							}
							
							/* split heading and insert hr before 2nd part */
							Node.InsertNodeAfterElement(element, node);
							
							if (!((mode & Lexer.Preformatted) != 0))
							{
								Node.TrimSpaces(lexer, element);
							}
							
							element = lexer.CloneNode(element);
							element.Start = lexer.lexsize;
							element.End = lexer.lexsize;
							Node.InsertNodeAfterElement(node, element);
							continue;
						}
					}
					
					if (element.Tag == tt.TagDt)
					{
						if (node.Tag == tt.TagHr)
						{
							Node dd;
							
							if (node.Type != Node.StartTag && node.Type != Node.StartEndTag)
							{
								Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
								continue;
							}
							
							Report.Warning(lexer, element, node, Report.TAG_NOT_ALLOWED_IN);
							dd = lexer.InferredTag("dd");
							
							/* insert hr within dd before dt if dt is empty */
							if (element.Content == null)
							{
								Node.InsertNodeBeforeElement(element, dd);
								Node.InsertNodeAtEnd(dd, node);
								continue;
							}
							
							/* split dt and insert hr within dd before 2nd part */
							Node.InsertNodeAfterElement(element, dd);
							Node.InsertNodeAtEnd(dd, node);
							
							if (!((mode & Lexer.Preformatted) != 0))
							{
								Node.TrimSpaces(lexer, element);
							}
							
							element = lexer.CloneNode(element);
							element.Start = lexer.lexsize;
							element.End = lexer.lexsize;
							Node.InsertNodeAfterElement(dd, element);
							continue;
						}
					}
					
					/* 
					if this is the end tag for an ancestor element
					then infer end tag for this element
					*/
					if (node.Type == Node.EndTag)
					{
						for (parent = element.Parent; parent != null; parent = parent.Parent)
						{
							if (node.Tag == parent.Tag)
							{
								if (!((element.Tag.Model & ContentModel.Opt) != 0) && !element.Isimplicit)
								{
									Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
								}
								
								if (element.Tag == tt.TagA)
								{
									lexer.PopInline(element);
								}

								lexer.UngetToken();
								
								if (!((mode & Lexer.Preformatted) != 0))
								{
									Node.TrimSpaces(lexer, element);
								}
								
								Node.TrimEmptyElement(lexer, element);
								return;
							}
						}
					}
					
					/* block level tags end this element */
					if (!((node.Tag.Model & ContentModel.Inline) != 0))
					{
						if (node.Type != Node.StartTag)
						{
							Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
							continue;
						}
						
						if (!((element.Tag.Model & ContentModel.Opt) != 0))
						{
							Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_BEFORE);
						}
						
						if ((node.Tag.Model & ContentModel.Head) != 0 && !((node.Tag.Model & ContentModel.Block) != 0))
						{
							TidyNet.ParserImpl.moveToHead(lexer, element, node);
							continue;
						}
						
						/*
						prevent anchors from propagating into block tags
						except for headings h1 to h6
						*/
						if (element.Tag == tt.TagA)
						{
							if (node.Tag != null && !((node.Tag.Model & ContentModel.Heading) != 0))
							{
								lexer.PopInline(element);
							}
							else if (!(element.Content != null))
							{
								Node.DiscardElement(element);
								lexer.UngetToken();
								return;
							}
						}
						
						lexer.UngetToken();
						
						if (!((mode & Lexer.Preformatted) != 0))
						{
							Node.TrimSpaces(lexer, element);
						}
						
						Node.TrimEmptyElement(lexer, element);
						return;
					}
					
					/* parse inline element */
					if (node.Type == Node.StartTag || node.Type == Node.StartEndTag)
					{
						if (node.Isimplicit)
						{
							Report.Warning(lexer, element, node, Report.INSERTING_TAG);
						}
						
						/* trim white space before <br> */
						if (node.Tag == tt.TagBr)
						{
							Node.TrimSpaces(lexer, element);
						}
						
						Node.InsertNodeAtEnd(element, node);
						TidyNet.ParserImpl.parseTag(lexer, node, mode);
						continue;
					}
					
					/* discard unexpected tags */
					Report.Warning(lexer, element, node, Report.DISCARDING_UNEXPECTED);
				}
				
				if (!((element.Tag.Model & ContentModel.Opt) != 0))
				{
					Report.Warning(lexer, element, node, Report.MISSING_ENDTAG_FOR);
				}
				
				Node.TrimEmptyElement(lexer, element);
			}