C# (CSharp) iText.Pdfocr.Tesseract4 TesseractOcrUtil.GetOcrResultAsString示例

编程语言: C# (CSharp)

命名空间/包名称: iText.Pdfocr.Tesseract4

类/类型: TesseractOcrUtil

方法/功能: GetOcrResultAsString

hotexamples.com的示例: 1

C# (CSharp) iText.Pdfocr.Tesseract4 TesseractOcrUtil.GetOcrResultAsString - 已找到1个示例。这些是从开源项目中提取的最受好评的iText.Pdfocr.Tesseract4.TesseractOcrUtil.GetOcrResultAsString现实C# (CSharp)示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

GetTempFilePath(5)

SaveImageToTempPngFile(4)

ConvertPixToImage(3)

SavePixToTempPngFile(3)

GetParentDirectory(2)

ReadPixPageFromTiff(2)

InitializeTesseractInstance(2)

InitializeImagesListFromTiff(2)

Contains(2)

GetListOfPages(2)

DisposeTesseractInstance(2)

GetOcrResultAsString(1)

ConvertImageToPix(1)

IsTesseractInstanceDisposed(1)

OtsuImageThresholding(1)

PreprocessPix(1)

DestroyPix(1)

CreateTempFileCopy(1)

ConvertToGrayscale(1)

SetTesseractProperties(1)

示例#1

显示文件

        /// <summary>
        /// Gets OCR result from provided multi-page image and returns result as
        /// list of strings for each page.
        /// </summary>
        /// <remarks>
        /// Gets OCR result from provided multi-page image and returns result as
        /// list of strings for each page. This method is used for tiff images
        /// when preprocessing is not needed.
        /// </remarks>
        /// <param name="inputImage">
        /// input image
        /// <see cref="System.IO.FileInfo"/>
        /// </param>
        /// <param name="outputFormat">
        /// selected
        /// <see cref="OutputFormat"/>
        /// for tesseract
        /// </param>
        /// <returns>
        /// list of result string that will be written to a temporary files
        /// later
        /// </returns>
        private IList <String> GetOcrResultForMultiPage(FileInfo inputImage, OutputFormat outputFormat)
        {
            IList <String> resultList = new List <String>();

            try {
                InitializeTesseract(outputFormat);
                TesseractOcrUtil util = new TesseractOcrUtil();
                util.InitializeImagesListFromTiff(inputImage);
                int numOfPages = util.GetListOfPages().Count;
                for (int i = 0; i < numOfPages; i++)
                {
                    String result = util.GetOcrResultAsString(GetTesseractInstance(), util.GetListOfPages()[i], outputFormat);
                    resultList.Add(result);
                }
            }
            catch (TesseractException e) {
                String msg = MessageFormatUtil.Format(Tesseract4LogMessageConstant.TESSERACT_FAILED, e.Message);
                LogManager.GetLogger(GetType()).Error(msg);
                throw new Tesseract4OcrException(Tesseract4OcrException.TESSERACT_FAILED);
            }
            finally {
                TesseractOcrUtil.DisposeTesseractInstance(GetTesseractInstance());
            }
            return(resultList);
        }