Convert PDF to Word

В этой статье я собираюсь продемонстрировать, как точно и без усилий конвертировать PDF в документ Word, включая преобразование PDF в форматы DOC и PDF в форматы DOCX. Более ранние версии Microsoft Word сохраняли документы в двоичном формате с расширением .doc. С выпуском Office 2007 Microsoft приняла формат Office Open XML (OOXML), основанный на сочетании XML и двоичных файлов, объединенных в архивы ZIP. MS Word теперь использует .docx в качестве расширения по умолчанию для сохранения документов.

Преобразование PDF в DOC и PDF в DOCX может потребоваться в различных сценариях. Например, вы можете сделать PDF редактируемым или избежать повторного ввода содержимого PDF в документ Word с сохранением исходного форматирования. Другим вариантом использования может быть массовое преобразование PDF в DOC или DOCX без какого-либо специального программного обеспечения. Учитывая такой сценарий, в этой статье рассматривается следующее преобразование PDF в Word программным способом на C#:

  • Преобразование PDF в DOC на C#
  • Преобразование PDF в DOCX на C#
  • Преобразование PDF в DOC с дополнительными настройками

Конвертер C# PDF в Word DOC или DOCX

Aspose.PDF for .NET владеет мощным API конвертера PDF в DOC или DOCX, который позволяет конвертировать документы PDF в Word в приложениях .NET с помощью нескольких строк кода. API можно использовать в WinForms, ASP.NET, веб-службах или любом приложении на основе .NET. Вы можете либо скачать API, либо установить его с помощью Диспетчера пакетов NuGet в своем проекте.

Преобразование PDF в DOC на C#

Ниже приведены шаги для преобразования PDF в DOC с помощью Aspose.PDF for .NET.

  • Загрузите документы PDF с помощью класса Document.
  • Сохраните документ с расширением .doc методом Document.Save(string).

В следующем примере кода показано, как преобразовать PDF в Word DOC с помощью C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Сохраните файл в формате документа MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Преобразование PDF в DOCX на C#

Преобразование PDF в DOCX аналогично преобразованию PDF в DOC, как показано ранее. API имеет класс DocSaveOptions, который позволяет вам установить формат документа в DOCX. Ниже приведены шаги для преобразования PDF в DOCX:

  • Загрузите документы PDF с помощью класса Document.
  • Установите формат выходного документа как DOCX, используя класс DocSaveOptions.
  • Сохраните документ с расширением .docx методом Document.Save(string).

В следующем примере кода показано, как преобразовать PDF в Word DOCX на C#.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Создать экземпляр объекта DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Укажите выходной формат как DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Сохранить документ в формате docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Преобразование PDF в DOC с дополнительными параметрами

Aspose.PDF for .NET предоставляет различные другие параметры для настройки преобразования PDF в DOC или DOCX. Класс DocSaveOptions предоставляет свойства для улучшения преобразования PDF в DOC, такие как разрешение изображения, расстояние между строками и т. д. В следующем коде показано, как установить дополнительные свойства при преобразовании PDF в DOC на C#. .

// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Откройте исходный PDF-документ
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Сохранить с помощью параметров сохранения
// Создать объект DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Установите режим распознавания «Поток».
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Установите для Горизонтальной близости значение 2,5.
saveOptions.RelativeHorizontalProximity = 2.5f;

// Включите значение, чтобы распознавать маркеры в процессе преобразования.
saveOptions.RecognizeBullets = true;

// Сохраните полученный файл DOC.
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Вывод

В этой статье вы узнали о некоторых простых способах преобразования PDF в DOC и PDF в DOCX с помощью C#. Если вы хотите узнать больше о мощных функциях преобразования Aspose.PDF for .NET, вы можете перейти к разделу документации по API Преобразование PDF в другие форматы. Загрузите бесплатную копию Aspose.PDF for .NET и сразу приступайте к работе, следуя документации по API. Если у вас есть вопросы, пишите на форум Aspose.PDF. Мы будем рады помочь вам с вашими вопросами и запросами.

Смотрите также