В этой статье я собираюсь продемонстрировать, как точно и без усилий конвертировать PDF в документ Word, включая преобразование PDF в форматы DOC и PDF в форматы DOCX. Более ранние версии Microsoft Word сохраняли документы в двоичном формате с расширением .doc. С выпуском Office 2007 Microsoft приняла формат Office Open XML (OOXML), основанный на сочетании XML и двоичных файлов, объединенных в архивы ZIP. MS Word теперь использует .docx в качестве расширения по умолчанию для сохранения документов.
Преобразование PDF в DOC и PDF в DOCX может потребоваться в различных сценариях. Например, вы можете сделать PDF редактируемым или избежать повторного ввода содержимого PDF в документ Word с сохранением исходного форматирования. Другим вариантом использования может быть массовое преобразование PDF в DOC или DOCX без какого-либо специального программного обеспечения. Учитывая такой сценарий, в этой статье рассматривается следующее преобразование PDF в Word программным способом на C#:
- Преобразование PDF в DOC на C#
- Преобразование PDF в DOCX на C#
- Преобразование PDF в DOC с дополнительными настройками
Конвертер C# PDF в Word DOC или DOCX
Aspose.PDF for .NET владеет мощным API конвертера PDF в DOC или DOCX, который позволяет конвертировать документы PDF в Word в приложениях .NET с помощью нескольких строк кода. API можно использовать в WinForms, ASP.NET, веб-службах или любом приложении на основе .NET. Вы можете либо скачать API, либо установить его с помощью Диспетчера пакетов NuGet в своем проекте.
Преобразование PDF в DOC на C#
Ниже приведены шаги для преобразования PDF в DOC с помощью Aspose.PDF for .NET.
- Загрузите документы PDF с помощью класса Document.
- Сохраните документ с расширением .doc методом Document.Save(string).
В следующем примере кода показано, как преобразовать PDF в Word DOC с помощью C#.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Сохраните файл в формате документа MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
Преобразование PDF в DOCX на C#
Преобразование PDF в DOCX аналогично преобразованию PDF в DOC, как показано ранее. API имеет класс DocSaveOptions, который позволяет вам установить формат документа в DOCX. Ниже приведены шаги для преобразования PDF в DOCX:
- Загрузите документы PDF с помощью класса Document.
- Установите формат выходного документа как DOCX, используя класс DocSaveOptions.
- Сохраните документ с расширением .docx методом Document.Save(string).
В следующем примере кода показано, как преобразовать PDF в Word DOCX на C#.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Создать экземпляр объекта DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Укажите выходной формат как DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Сохранить документ в формате docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);
Преобразование PDF в DOC с дополнительными параметрами
Aspose.PDF for .NET предоставляет различные другие параметры для настройки преобразования PDF в DOC или DOCX. Класс DocSaveOptions предоставляет свойства для улучшения преобразования PDF в DOC, такие как разрешение изображения, расстояние между строками и т. д. В следующем коде показано, как установить дополнительные свойства при преобразовании PDF в DOC на C#. .
// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Сохранить с помощью параметров сохранения
// Создать объект DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Установите режим распознавания «Поток».
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;
// Установите для Горизонтальной близости значение 2,5.
saveOptions.RelativeHorizontalProximity = 2.5f;
// Включите значение, чтобы распознавать маркеры в процессе преобразования.
saveOptions.RecognizeBullets = true;
// Сохраните полученный файл DOC.
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);
Вывод
В этой статье вы узнали о некоторых простых способах преобразования PDF в DOC и PDF в DOCX с помощью C#. Если вы хотите узнать больше о мощных функциях преобразования Aspose.PDF for .NET, вы можете перейти к разделу документации по API Преобразование PDF в другие форматы. Загрузите бесплатную копию Aspose.PDF for .NET и сразу приступайте к работе, следуя документации по API. Если у вас есть вопросы, пишите на форум Aspose.PDF. Мы будем рады помочь вам с вашими вопросами и запросами.