Esempi in C# (CSharp) per SIL.Machine.Tokenization LatinWordTokenizer

Linguaggio di programmazione: C# (CSharp)

Spazio dei nomi/nome del pacchetto: SIL.Machine.Tokenization

Classe/tipologia: LatinWordTokenizer

Esempi su hotexamples.com: 12

SIL.Machine.Tokenization LatinWordTokenizer in C# (CSharp): 12 esempi trovati. Questi sono i migliori esempi reali in C# (CSharp) per SIL.Machine.Tokenization.LatinWordTokenizer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

TokenizeToStrings(12)

Esempio n. 1

Mostra file

        public void Tokenize_Abbreviation_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer(new[] { "mr", "dr", "ms" });

            Assert.That(tokenizer.TokenizeToStrings("Mr. Smith went to Washington."),
                        Is.EqualTo(new[] { "Mr.", "Smith", "went", "to", "Washington", "." }));
        }

Esempio n. 2

Mostra file

        public void Tokenize_Quotes_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer();

            Assert.That(tokenizer.TokenizeToStrings("\"This is a test.\""),
                        Is.EqualTo(new[] { "\"", "This", "is", "a", "test", ".", "\"" }));
        }

Esempio n. 3

Mostra file

        public void Tokenize_PunctuationAtStartOfWord_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer();

            Assert.That(tokenizer.TokenizeToStrings("Is this a \"test\"?"),
                        Is.EqualTo(new[] { "Is", "this", "a", "\"", "test", "\"", "?" }));
        }

Esempio n. 4

Mostra file

        public void Tokenize_PunctuationInsideWord_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer();

            Assert.That(tokenizer.TokenizeToStrings("This isn't a test."),
                        Is.EqualTo(new[] { "This", "isn't", "a", "test", "." }));
        }

Esempio n. 5

Mostra file

File: LatinWordTokenizerTests.cs Progetto: ermshiperete/machine

        /// <summary>
        /// This tests a workaround for a bug in Bridge.NET, see issue #2981.
        /// </summary>
        private static void Tokenize_NonAsciiCharacter_DoesNotThrow(Assert assert)
        {
            var tokenizer = new LatinWordTokenizer();

            assert.DeepEqual(tokenizer.TokenizeToStrings("This is—a test.").ToArray(),
                             new[] { "This", "is", "—", "a", "test", "." });
        }

Esempio n. 6

Mostra file

File: LatinWordTokenizerTests.cs Progetto: ermshiperete/machine

        private static void Tokenize_Abbreviation_ReturnsTokens(Assert assert)
        {
            var tokenizer = new LatinWordTokenizer(new[] { "mr", "dr", "ms" });

            assert.DeepEqual(tokenizer.TokenizeToStrings("Mr. Smith went to Washington.").ToArray(),
                             new[] { "Mr.", "Smith", "went", "to", "Washington", "." });
        }

Esempio n. 7

Mostra file

File: LatinWordTokenizerTests.cs Progetto: ermshiperete/machine

        private static void Tokenize_PunctuationInsideWord_ReturnsTokens(Assert assert)
        {
            var tokenizer = new LatinWordTokenizer();

            assert.DeepEqual(tokenizer.TokenizeToStrings("This isn't a test.").ToArray(),
                             new[] { "This", "isn't", "a", "test", "." });
        }

Esempio n. 8

Mostra file

File: LatinWordTokenizerTests.cs Progetto: ermshiperete/machine

        private static void Tokenize_PunctuationAtStartOfWord_ReturnsTokens(Assert assert)
        {
            var tokenizer = new LatinWordTokenizer();

            assert.DeepEqual(tokenizer.TokenizeToStrings("Is this a \"test\"?").ToArray(),
                             new[] { "Is", "this", "a", "\"", "test", "\"", "?" });
        }

Esempio n. 9

Mostra file

File: LatinWordTokenizerTests.cs Progetto: Andrewdt97/machine

        public void Tokenize_ApostropheAsSingleQuote_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer {
                TreatApostropheAsSingleQuote = true
            };

            Assert.That(tokenizer.TokenizeToStrings("'Moses's cat said 'Meow' to the dog.'"),
                        Is.EqualTo(new[] { "'", "Moses's", "cat", "said", "'", "Meow", "'", "to", "the", "dog", ".", "'" }));
        }

Esempio n. 10

Mostra file

File: LatinWordTokenizerTests.cs Progetto: Andrewdt97/machine

        public void Tokenize_ApostropheNotAsSingleQuote_ReturnsTokens()
        {
            var tokenizer = new LatinWordTokenizer();

            Assert.That(tokenizer.TokenizeToStrings("“Moses' cat said ‘Meow’ to the dog.”"),
                        Is.EqualTo(new[] { "“", "Moses'", "cat", "said", "‘", "Meow", "’", "to", "the", "dog", ".", "”" }));

            Assert.That(tokenizer.TokenizeToStrings("i ha''on ot ano'."),
                        Is.EqualTo(new[] { "i", "ha''on", "ot", "ano'", "." }));
        }

Esempio n. 11

Mostra file

        public void Tokenize_Empty_ReturnsEmpty()
        {
            var tokenizer = new LatinWordTokenizer();

            Assert.That(tokenizer.TokenizeToStrings(""), Is.Empty);
        }

Esempio n. 12

Mostra file

File: LatinWordTokenizerTests.cs Progetto: ermshiperete/machine

        private static void Tokenize_Whitespace_ReturnsEmpty(Assert assert)
        {
            var tokenizer = new LatinWordTokenizer();

            assert.DeepEqual(tokenizer.TokenizeToStrings(" ").ToArray(), new string[0]);
        }