C# (CSharp) IExtractor.ExtractBodyTextFromArticleDocument примеры использования

Язык программирования: C# (CSharp)

Класс/Тип: IExtractor

Метод/Функция: ExtractBodyTextFromArticleDocument

Примеров на hotexamples.com: 1

C# (CSharp) IExtractor.ExtractBodyTextFromArticleDocument - 1 пример найден. Это лучшие примеры C# (CSharp) кода для IExtractor.ExtractBodyTextFromArticleDocument, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Extract(10)

Message(4)

GetXmlNodeFromElement(3)

ExtractHeaderNames(2)

ValueStructureToBytes(2)

IsArchive(2)

ExtractFromString(2)

ExtractFrom(2)

ExtractAsync(2)

ValueStructureToPointer(2)

ExtractAll(2)

GetType(2)

CopyBlock(2)

BytesToValueStructure(2)

Received(1)

PointerToValueStructure(1)

Read(1)

AbsorbAllData(1)

Reset(1)

SerialiseToJson(1)

SetAssemblyFile(1)

SplitToCalculations(1)

Validate(1)

GetFrom(1)

Where(1)

extract(1)

GetSessions(1)

ExtractToDirectory(1)

GetData(1)

ExtractMeasureMembers(1)

CreateContext(1)

ExtractArchiveFile(1)

ExtractBodyTextFromArticleDocument(1)

ExtractCurrentPiece(1)

ExtractIP(1)

ExtractInfo(1)

ExtractIntoFolder(1)

ExtractNextPiece(1)

GetArchiveFiles(1)

ExtractScopes(1)

ExtractSets(1)

ExtractTarget(1)

ExtractTimed(1)

Annotate(1)

ExtractXmlFromEmailText(1)

FetchResults(1)

setArgs(1)

Пример #1

Показать файл

Файл: Tracker.cs Проект: mimustafa/MediaSpin

        private void SearchArticles(string baseUrl, List <Article> allArticles, int headerSize = 1)
        {
            var htmlDoc = _spider.LoadPage(baseUrl);
            var headers = _spider.GetHeadersOfSize(htmlDoc, headerSize);

            foreach (var header in headers)
            {
                try
                {
                    header.InnerText.Trim();
                    if (!_validator.ConsideredArticleHeader(header.InnerText))
                    {
                        continue;
                    }

                    var(articleUrl, articleHtmlDocument) = _spider.DownloadArticleByHeader(baseUrl, header);
                    if (articleUrl == null && articleHtmlDocument == null)
                    {
                        continue;
                    }

                    var articleBodyText = _extractor.ExtractBodyTextFromArticleDocument(articleHtmlDocument);
                    var article         = CreateArticle(articleHtmlDocument, articleBodyText, allArticles, baseUrl, articleUrl, header.InnerText);
                    var foundKeywords   = ScanArticleForKeyWords(article);
                    if (foundKeywords.Count() > 0)
                    {
                        article.Keywords = foundKeywords;
                        _pipeline.SendForAnalysis(article);
                    }
                }
                catch (Exception e)
                {
                    _logger.LogError($"Failed to download and process article {header.InnerText} with the following exception {e.Message} stack trace: {e.StackTrace}");
                    continue;
                }
            }
            headerSize++;
            if (headerSize <= 4)
            {
                SearchArticles(baseUrl, allArticles, headerSize);
            }
        }