public void TestDigitsInUkrainianCharset() { UkrainianMorfologikAnalyzer ra = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(ra, "text 1000", new String[] { "text", "1000" }); ra.Dispose(); }
public void TestRandomStrings() { Analyzer analyzer = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); CheckRandomData(Random, analyzer, 1000 * RANDOM_MULTIPLIER); analyzer.Dispose(); }
public void TestSampleSentence() { Analyzer a = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(a, "Це — проект генерування словника з тегами частин мови для української мови.", new String[] { "проект", "генерування", "словник", "тег", "частина", "мова", "українська", "український", "Українська", "мова" }); a.Dispose(); }
public void TestCharNormalization() { Analyzer a = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(a, "Ґюмрі та Гюмрі.", new String[] { "Гюмрі", "Гюмрі" }); a.Dispose(); }
public void TestCapsTokenStream() { Analyzer a = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(a, "Цих Чайковського і Ґете.", new String[] { "Чайковське", "Чайковський", "Гете" }); a.Dispose(); }
public void TestSpecialCharsTokenStream() { Analyzer a = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(a, "м'яса м'я\u0301са м\u02BCяса м\u2019яса м\u2018яса м`яса", new String[] { "м'ясо", "м'ясо", "м'ясо", "м'ясо", "м'ясо", "м'ясо" }); a.Dispose(); }
public void TestReusableTokenStream() { Analyzer a = new UkrainianMorfologikAnalyzer(TEST_VERSION_CURRENT); AssertAnalyzesTo(a, "Ця п'єса, у свою чергу, рухається по емоційно-напруженому колу за ритм-енд-блюзом.", new String[] { "п'єса", "черга", "рухатися", "емоційно", "напружений", "кола", "коло", "кіл", "ритм", "енд", "блюз" }); a.Dispose(); }