public static void FileSgmlParse1(FileInfo fileToParse, string dir) { StreamReader strread = new StreamReader(fileToParse.FullName); XmlSerializer readers = new XmlSerializer(typeof(Patdoc)); Patdoc patdoc = new Patdoc(); patdoc = (Patdoc)readers.Deserialize(strread); Console.WriteLine("SGML complete..."); Console.ReadKey(); convertSgmlToXml(patdoc, fileToParse, dir); }
public static void WriteSg(Patdoc patdoc) { //создаем новый XML файл на основании структуры System.Xml.Serialization.XmlSerializer writer = new System.Xml.Serialization.XmlSerializer(typeof(Patdoc)); System.IO.StreamWriter file = new System.IO.StreamWriter(@"c:\source\nn.xml"); writer.Serialize(file, patdoc); file.Close(); }
public static void convertSgmlToXml(Patdoc patdoc, FileInfo fileName, string dir) { WriteSg(patdoc); /*Во всех закомментированных строках либо нет данных, из которых их заполнять, либо же непонятно просто, откуда берутся данные (конкретно)*/ Patent patent = new Patent();//создаем новую структуру //далее заполняем все части нового xml документа patent.number = patdoc.Sdobi.B100.B110.dnum.pdat; patent.country = patdoc.Sdobi.B100.B190.pdat; patent.kind = patdoc.Sdobi.B100.B130.pdat; // patent.lang = ; //нужен тег B051 если я все верно поняла patent.date = patdoc.Sdobi.B100.B140.date_.pdat; patent.appdate = patdoc.Sdobi.B200.B220.date_.pdat; patent.appKind = patdoc.Sdobi.B200.B211US.pdat; patent.appNumber = patdoc.Sdobi.B200.B210.dnum.pdat; // patent.disclaimerDate = ; //нужен тег B473 //Следующие четыре составляющиа также пока неясно из чего заполнять. Заполнить то легко, но вопрос: а из чего? // patent.classificationIpcMain = ; /*patent.classificationIpcAdditional = ; patent.classificationUSsection = ; patent.classificationUSadditional = ;*/ patent.title = patdoc.Sdobi.B500.B540.stext.pdat; patent.titleEng = patdoc.Sdobi.B500.B540.stext.pdat; //patent.relatesPatents = ; // // patent.relatesForeignPatents = ; //Опять же, это и выше строка - откуда берем инфу? patent.authors = new Authors(); patent.authors.AuthorList = new List<Author>(); string fio = patdoc.Sdobi.B700.B720.B721.PartyUs.Nam.Fnm.pdat + " " + patdoc.Sdobi.B700.B720.B721.PartyUs.Nam.Snm.stext.pdat; Author auth = new Author(); auth.name = fio; auth.author_ = fio; patent.authors.AuthorList.Add(auth); patent.company = patdoc.Sdobi.B700.B740.B741.PartyUs.Nam.Onm.stext.pdat; //patent.description = ; //patent.descriptionShort = ; // patent.abstract_ = ; // patent.abstractEng = ; patent.claims = new Claims_(); patent.claims.ClaimList = new List<Claim_>(); for (int i = 0; i < Convert.ToInt32(patdoc.Sdobi.B500.B570.B577.pdat); i++) { Claim_ claimnew = new Claim_(); claimnew.cltxt = patdoc.Sdodl.Cl.Clm.Para.Ptext.pdat; patent.claims.ClaimList.Add(claimnew); } /*Тут нужно дальше сгенерировать группу Tables, но на основании чего?*/ /*Очередь "drawings" тегов*/ patent.drawings = new Drawings_(); patent.drawings.DrawingsList = new List<string>(); for (int i = 0; i < Convert.ToInt32(patdoc.Sdobi.B500.B590.B595.pdat); i++) { patent.drawings.DrawingsList.Add(patdoc.Sdode.Drwdesc.Btext.Para.Ptext.pdat); } string filepath = dir + "\\" + fileName.Name.Remove(fileName.Name.Length - fileName.Extension.Length) + "_modif" + ".xml"; //сформируем имя модифицированного файла System.IO.File.Delete(fileName.FullName); Console.WriteLine("Converting XML to XML complete..."); WriteXML(patent, filepath); }