Exemple #1
0
 public static void validateEncoderAgainstDecoder()
 {
     XNMD.UTF8Decoder decoder = new XNMD.UTF8Decoder();
     for (uint i = 0; i <= 0x10ffff; i++)
     {
         byte[]            bytes   = EncodeCodePoint(i);
         UTF8DecodeContext context = decoder.DecodeBytes(bytes)[0];
         if ((context.Codepoint != i) && (context.Status == UTF8StatusCode.None))
         {
             Console.Out.Write("Codepoint {0} messed up", i);
         }
     }
 }
Exemple #2
0
        public UTF8DecodeContext[] DecodeBytes(byte[] bytes)
        {
            List <UTF8DecodeContext> list = new List <UTF8DecodeContext>();
            int index = 0;

            while (index < bytes.Length)
            {
                UTF8DecodeContext item = new UTF8DecodeContext();
                byte num2 = bytes[index];
                item.Length = 0;
                if ((num2 & 0x80) == 0)
                {
                    item.Length = 1;
                }
                else if ((num2 & 0xe0) == 0xc0)
                {
                    item.Length = 2;
                }
                else if ((num2 & 240) == 0xe0)
                {
                    item.Length = 3;
                }
                else if ((num2 & 0xf8) == 240)
                {
                    item.Length = 4;
                }
                else
                {
                    item.Length = 1;
                    index++;
                    item.Bytes = new byte[1];
                    Array.Copy(bytes, index, item.Bytes, 0, 1);
                    item.Status = UTF8StatusCode.InvalidByte;
                    list.Add(item);
                    continue;
                }
                item.Bytes = new byte[item.Length];
                Array.Copy(bytes, index, item.Bytes, 0, item.Length);
                this.DecodeContext(item);
                list.Add(item);
                index += item.Length;
            }
            return(list.ToArray());
        }
Exemple #3
0
 public UTF8DecodeContext[] DecodeBytes(byte[] bytes)
 {
     List<UTF8DecodeContext> list = new List<UTF8DecodeContext>();
     int index = 0;
     while (index < bytes.Length)
     {
         UTF8DecodeContext item = new UTF8DecodeContext();
         byte num2 = bytes[index];
         item.Length = 0;
         if ((num2 & 0x80) == 0)
         {
             item.Length = 1;
         }
         else if ((num2 & 0xe0) == 0xc0)
         {
             item.Length = 2;
         }
         else if ((num2 & 240) == 0xe0)
         {
             item.Length = 3;
         }
         else if ((num2 & 0xf8) == 240)
         {
             item.Length = 4;
         }
         else
         {
             item.Length = 1;
             index++;
             item.Bytes = new byte[1];
             Array.Copy(bytes, index, item.Bytes, 0, 1);
             item.Status = UTF8StatusCode.InvalidByte;
             list.Add(item);
             continue;
         }
         item.Bytes = new byte[item.Length];
         Array.Copy(bytes, index, item.Bytes, 0, item.Length);
         this.DecodeContext(item);
         list.Add(item);
         index += item.Length;
     }
     return list.ToArray();
 }
 public bool Add(Node currentNode, UTF8DecodeContext context, TreeStatus t)
 {
     if (t == TreeStatus.Valid)
     {
         currentNode.center = new Node();
         currentNode.center.value = context;
         currentNode.left = null;
         currentNode.right = null;
     }
     else if (t == TreeStatus.InvalidByte)
     {
         currentNode.right = new Node();
         currentNode.right.value = context;
     }
     else if (t == TreeStatus.InvalidSequence)
     {
         currentNode.left = new Node();
         currentNode.left.value = context;
     }
     return true;
 }
Exemple #5
0
 public bool Add(Node currentNode, UTF8DecodeContext context, TreeStatus t)
 {
     if (t == TreeStatus.Valid)
     {
         currentNode.center       = new Node();
         currentNode.center.value = context;
         currentNode.left         = null;
         currentNode.right        = null;
     }
     else if (t == TreeStatus.InvalidByte)
     {
         currentNode.right       = new Node();
         currentNode.right.value = context;
     }
     else if (t == TreeStatus.InvalidSequence)
     {
         currentNode.left       = new Node();
         currentNode.left.value = context;
     }
     return(true);
 }
Exemple #6
0
        private void DecodeContext(UTF8DecodeContext context)
        {
            byte num;
            byte num2;
            byte num3;
            uint num5 = 0;
            if (context.Length > 1)
            {
                for (int i = 1; i < context.Length; i++)
                {
                    if ((context.Bytes[i] & 0xc0) != 0x80)
                    {
                        context.Status = UTF8StatusCode.InvalidSequence;
                    }
                }
            }
            switch (context.Length)
            {
                case 1:
                    context.Codepoint = context.Bytes[0];
                    return;

                case 2:
                    num5 = 0;
                    if (((context.Bytes[0] >= 0xd8) && (context.Bytes[0] <= 0xdf)) && (context.Bytes[1] >= 0))
                    {
                        context.Status = UTF8StatusCode.InvalidByte;
                    }
                    num = (byte) (context.Bytes[0] & 0x1f);
                    num2 = (byte) (context.Bytes[1] & 0x3f);
                    num5 = (num5 | num) << 6;
                    num5 |= num2;
                    break;

                case 3:
                    num5 = 0;
                    num = (byte) (context.Bytes[0] & 15);
                    num2 = (byte) (context.Bytes[1] & 0x3f);
                    num3 = (byte) (context.Bytes[2] & 0x3f);
                    num5 = (num5 | num) << 6;
                    num5 = (num5 | num2) << 6;
                    num5 |= num3;
                    break;

                case 4:
                {
                    num5 = 0;
                    num = (byte) (context.Bytes[0] & 7);
                    num2 = (byte) (context.Bytes[1] & 0x3f);
                    num3 = (byte) (context.Bytes[2] & 0x3f);
                    byte num4 = (byte) (context.Bytes[3] & 0x3f);
                    num5 = (num5 | num) << 6;
                    num5 = (num5 | num2) << 6;
                    num5 = (num5 | num3) << 6;
                    num5 |= num4;
                    break;
                }
            }
            if (num5 > 0x10ffff)
            {
                context.Status = UTF8StatusCode.InvalidCodepoint;
            }
            if (num5 < 0x80)
            {
                context.Status = UTF8StatusCode.OverlongSequence;
            }
            context.Codepoint = num5;
        }
Exemple #7
0
        private void DecodeContext(UTF8DecodeContext context)
        {
            byte num;
            byte num2;
            byte num3;
            uint num5 = 0;

            if (context.Length > 1)
            {
                for (int i = 1; i < context.Length; i++)
                {
                    if ((context.Bytes[i] & 0xc0) != 0x80)
                    {
                        context.Status = UTF8StatusCode.InvalidSequence;
                    }
                }
            }
            switch (context.Length)
            {
            case 1:
                context.Codepoint = context.Bytes[0];
                return;

            case 2:
                num5 = 0;
                if (((context.Bytes[0] >= 0xd8) && (context.Bytes[0] <= 0xdf)) && (context.Bytes[1] >= 0))
                {
                    context.Status = UTF8StatusCode.InvalidByte;
                }
                num   = (byte)(context.Bytes[0] & 0x1f);
                num2  = (byte)(context.Bytes[1] & 0x3f);
                num5  = (num5 | num) << 6;
                num5 |= num2;
                break;

            case 3:
                num5  = 0;
                num   = (byte)(context.Bytes[0] & 15);
                num2  = (byte)(context.Bytes[1] & 0x3f);
                num3  = (byte)(context.Bytes[2] & 0x3f);
                num5  = (num5 | num) << 6;
                num5  = (num5 | num2) << 6;
                num5 |= num3;
                break;

            case 4:
            {
                num5 = 0;
                num  = (byte)(context.Bytes[0] & 7);
                num2 = (byte)(context.Bytes[1] & 0x3f);
                num3 = (byte)(context.Bytes[2] & 0x3f);
                byte num4 = (byte)(context.Bytes[3] & 0x3f);
                num5  = (num5 | num) << 6;
                num5  = (num5 | num2) << 6;
                num5  = (num5 | num3) << 6;
                num5 |= num4;
                break;
            }
            }
            if (num5 > 0x10ffff)
            {
                context.Status = UTF8StatusCode.InvalidCodepoint;
            }
            if (num5 < 0x80)
            {
                context.Status = UTF8StatusCode.OverlongSequence;
            }
            context.Codepoint = num5;
        }