C# (CSharp) Latvian.Tagging.Corpora LuMiiCorpus 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: Latvian.Tagging.Corpora

클래스/타입: LuMiiCorpus

hotexamples.com에서의 예제들: 3

C# (CSharp) Latvian.Tagging.Corpora LuMiiCorpus - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 Latvian.Tagging.Corpora.LuMiiCorpus에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Load(3)

예제 #1

파일 보기

파일: LuMiiTaggerTests.cs 프로젝트: pdonald/latvian-lumii

 private Sentence[] LoadAnalyzedCorpus(string resourceName)
 {
     LuMiiCorpus corpus = new LuMiiCorpus();
     using (Stream stream = this.GetType().Assembly.GetManifestResourceStream(resourceName))
         return corpus.Load(stream).ToArray();
 }

예제 #2

파일 보기

파일: LuMiiTaggerTests.cs 프로젝트: pdonald/latvian-lumii

        private Sentence[] LoadUnanalyzedCorpus(string resourceName, bool ignoreIncorrect = false)
        {
            LuMiiCorpus corpus = new LuMiiCorpus();
            LuMiiMorphology morphology = new LuMiiMorphology();

            Sentence[] sentences = null;
            using (Stream stream = this.GetType().Assembly.GetManifestResourceStream(resourceName))
                sentences = corpus.Load(stream).ToArray();

            List<Sentence> goodSentences = new List<Sentence>();
            List<Sentence> ignoredSentences = new List<Sentence>();
            List<Token> ignoredTokens = new List<Token>();

            Stopwatch watch = new Stopwatch();
            watch.Start();
            foreach (Sentence sentence in sentences)
            {
                bool ignore = false;
                Sentence analyzedSentence = new Sentence();

                foreach (Token token in sentence)
                {
                    Tag[] possibleTags = morphology.Analyze(token.TextTrueCase).ToArray();

                    if (!possibleTags.Any(t => t.Equals(token.CorrectTag)))
                        ignore = true;

                    Token analyzedToken = new Token(token.TextTrueCase, possibleTags, token.CorrectTag, analyzedSentence);
                    analyzedSentence.Add(analyzedToken);
                }

                if (!ignoreIncorrect || !ignore)
                {
                    goodSentences.Add(analyzedSentence);
                }
                else
                {
                    ignoredSentences.Add(analyzedSentence);
                }
            }
            watch.Stop();
            Debug.WriteLine(watch.Elapsed);

            return goodSentences.ToArray();
        }

예제 #3

파일 보기

파일: LuMiiTaggerTests.cs 프로젝트: pdonald/latvian-lumii

        public void Model_Latest()
        {
            LuMiiCorpus corpus = new LuMiiCorpus();
            List<Sentence> all = new List<Sentence>();
            foreach (string resource in ModelLatestData)
                all.AddRange(corpus.Load(this.GetType().Assembly.GetManifestResourceStream(resource)).ToArray());

            LuMiiTagger tagger = new LuMiiTagger();
            tagger.Load();
            tagger.Tag(all);

            Token[] tokens = all.SelectMany(t => t).ToArray();
            double accuracy = (double)tokens.Count(t => t.IsTagCorrect) / tokens.Count();

            Assert.Greater(accuracy, 0.99);
        }