C# (CSharp) SentenceSegmenter 예제들

프로그래밍 언어: C# (CSharp)

클래스/타입: SentenceSegmenter

hotexamples.com에서의 예제들: 4

C# (CSharp) SentenceSegmenter - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 SentenceSegmenter에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Evaluate(1)

GetSegments(1)

GetSentences(1)

예제 #1

파일 보기

 public static void PrintSentences(SentenceSegmenter segmenter, IEnumerable <string> paragraphs)
 {
     foreach (var paragraph in paragraphs)
     {
         PrintSentences(segmenter, paragraph);
     }
 }

예제 #2

파일 보기

        public static void EvaluateSbd(SentenceSegmenter segmenter)
        {
            var taggedParagraphs = File.ReadAllLines(TaggedInput);
            var evaluations      = segmenter.Evaluate(taggedParagraphs);

            SentenceSegmenterEvaluator.GetTotalReport(evaluations, printFalseAlarms: true);
        }

예제 #3

파일 보기

        public static void PrintSentences(SentenceSegmenter segmenter, string paragraph)
        {
            var sentences = segmenter.GetSentences(paragraph);

            foreach (var sentence in sentences)
            {
                Console.WriteLine(sentence);
            }
        }

예제 #4

파일 보기

        public static List <string> SplitUsingUpssalaSentSegmenter(string str, int chunkSize)
        {
            // since Hazm webServer can not handle big size texts, I implemented this function to
            // first split the text using ParsPer sentence spliter (which can handle big texts).
            // then return the segemnts for furture processing like Hazm normalization and tokenization

            string[] sentences = SentenceSegmenter.GetSegments(str);

            List <string> temp = new List <string>();

            for (int i = 0; i < sentences.Length; i++)
            {
                if (sentences[i].Length >= chunkSize)
                {
                    // to break very very large sentences!!!
                    int breakPoint = sentences[i].Length / 2;
                    temp.Add(sentences[i].Substring(0, breakPoint));
                    temp.Add(sentences[i].Substring(breakPoint, sentences[i].Length - breakPoint));
                }
                else
                {
                    temp.Add(sentences[i]);
                }
            }
            sentences = temp.ToArray();

            List <string> segments = new List <string>();

            string currentSegment  = "";
            int    sentenceCounter = 0;

            while (true)
            {
                if (sentenceCounter == sentences.Length)
                {
                    // the final peice of text is in currentSegment. Dont forget to add it to segments.
                    segments.Add(currentSegment);
                    break;
                }

                if (currentSegment.Length + sentences[sentenceCounter].Length <= chunkSize)
                {
                    currentSegment += sentences[sentenceCounter] + " ";
                    sentenceCounter++;
                }
                else
                {
                    segments.Add(currentSegment);
                    currentSegment = "";
                }
            }
            return(segments);
        }