public void TestParsePlainTextFromPDF() { string path = TestDataSample.GetPdfPath("Sample1.PDF"); var parser = new PDFTextParser(new ParserContext(path)); string result = parser.Parse(); Assert.IsTrue(result.StartsWith("LA MARCHE")); }
public void TestReadBigPDFFile() { string path = TestDataSample.GetPdfPath("Word97-2007BinaryFileFormat(doc)Specification.pdf"); var parser = new PDFTextParser(new ParserContext(path)); string result = parser.Parse(); Assert.IsTrue(true); }
public void TestParseToxyDocumentFromPDF() { string path = TestDataSample.GetPdfPath("Sample1.PDF"); var parser = new PDFDocumentParser(new ParserContext(path)); var result = parser.Parse(); Assert.AreEqual(1474, result.Paragraphs.Count); Assert.AreEqual("LA MARCHE MONDIALE DES FEMMES : UN MOUVEMENT IRRÉVERSIBLE", result.Paragraphs[0].Text); }
public void TestParsePlainTextFromSample5() { string path = TestDataSample.GetPdfPath("Sample5.PDF"); var parser = new PDFTextParser(new ParserContext(path)); string result = parser.Parse(); string[] results = result.Split('\n'); Assert.AreEqual("License income by market (%)", results[0]); Assert.AreEqual("Philadelphia, Atlanta, Dallas, San Diego, and New", results[1]); }
public void TestParsePlainTextFromSample1() { string path = TestDataSample.GetPdfPath("Sample1.PDF"); var parser = new PDFTextParser(new ParserContext(path)); string result = parser.Parse(); Assert.IsTrue(result.StartsWith("LA MARCHE")); ContainText(result, "Toute discussion stratégique sur nos actions nécessite un rappel de ce que nous avons fait en"); ContainText(result, "l’an 2000 et depuis. Au niveau mondial, en l’an 2000, nous avons mené une campagne de"); ContainText(result, "Une structure pour nous amener à 2005"); ContainText(result, "Lors de la 4e rencontre qui aura lieu en Inde, nous avons deux objectifs majeurs"); }
public void TestParseToxyDocumentFromPDF() { string path = TestDataSample.GetPdfPath("Sample1.PDF"); var parser = new PDFDocumentParser(new ParserContext(path)); var result = parser.Parse(); Assert.AreEqual(1474, result.Paragraphs.Count); Assert.AreEqual("LA MARCHE MONDIALE DES FEMMES : UN MOUVEMENT IRRÉVERSIBLE", result.Paragraphs[0].Text); Assert.AreEqual("DOCUMENT PRÉPARATOIRE", result.Paragraphs[1].Text); Assert.AreEqual("e", result.Paragraphs[2].Text); //this is the superscript 'e' Assert.AreEqual("4 Rencontre internationale de la Marche mondiale des femmes", result.Paragraphs[3].Text); Assert.AreEqual("du 18-22 Mars 2003", result.Paragraphs[4].Text); }
public void TestParseToxyDocumentFromPDF() { string path = TestDataSample.GetPdfPath("Sample1.PDF"); var parser = new PDFDocumentParser(new ParserContext(path)); var result = parser.Parse(); Assert.AreEqual(88, result.Paragraphs.Count); string[] results = result.Paragraphs[0].Text.Split('\n'); Assert.AreEqual("LA MARCHE MONDIALE DES FEMMES : UN MOUVEMENT IRRÉVERSIBLE", results[0]); Assert.AreEqual("DOCUMENT PRÉPARATOIRE", results[1]); Assert.AreEqual("4eRencontre internationale de la Marche mondiale des femmes", results[2]); Assert.AreEqual("du 18-22 Mars 2003", results[3]); }