Exemplo n.º 1
0
        public virtual void Verify(ThaiTokenizer tokenizer, string input, List <string> expected)
        {
            var results = tokenizer.Split(input);

            Console.WriteLine("==============");
            Console.WriteLine("input = {0}", input);
            Console.WriteLine("expected = [{0}]", string.Join('|', expected));
            Console.WriteLine("result = [{0}]", string.Join('|', results));

            for (int i = 0; i < results.Count; i++)
            {
                Assert.Equal(expected[i], results[i]);
            }
        }
Exemplo n.º 2
0
        public void Test4()
        {
            var appendDictionary = new List <string> {
                "หวัดดี", "หวักลี", "เชอแตม"
            };
            var tokenizer = new ThaiTokenizer(appendDictionary);
            var input     = "ฤารักฉันจะเป็นเพียงความฝัน";
            var results   = tokenizer.Split(input);

            var expected = new List <string>
            {
                "ฤา",
                "รัก",
                "ฉัน",
                "จะ",
                "เป็น",
                "เพียง",
                "ความฝัน",
            };

            Verify(input, expected, results);
        }
Exemplo n.º 3
0
        public void Test2()
        {
            var appendDics = new List <string> {
                "พุทธัง", "ธัมมัง", "สังฆัง", "อาราธนานัง"
            };
            var tokenizer = new ThaiTokenizer(appendDics);
            var input     = "พุทธังอาราธนานัง ธัมมังอาราธนานัง สังฆังอาราธนานัง";
            var results   = tokenizer.Split(input);

            var expected = new List <string>
            {
                "พุทธัง",
                "อาราธนานัง",
                " ",
                "ธัมมัง",
                "อาราธนานัง",
                " ",
                "สังฆัง",
                "อาราธนานัง"
            };

            Verify(input, expected, results);
        }
Exemplo n.º 4
0
        public void Test3()
        {
            var appendDictionary = new List <string> {
                "หวัดดี", "หวักลี", "เชอแตม"
            };
            var tokenizer = new ThaiTokenizer(appendDictionary);
            var input     = "หวักลีหวัดดีปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอดเชอแตม";
            var results   = tokenizer.Split(input);

            var expected0 = new List <string> {
                "หวักลี", "หวัดดี"
            };
            var expected1 = GlobalExpectedResult.GetExpectedResult1();
            var expected2 = new List <string> {
                "เชอแตม"
            };

            var expected = expected0;

            expected.AddRange(expected1);
            expected.AddRange(expected2);

            Verify(input, expected, results);
        }