将 PDF 转换为 Word

在本文中,我将演示如何准确轻松地将 PDF 转换为 Word 文档,包括将 PDF 转换为 DOC 和 PDF 转换为 DOCX 格式。早期版本的 Microsoft Word 以二进制格式保存文档,扩展名为 .doc。随着 Office 2007 的发布,Microsoft 采用了 Office Open XML (OOXML),它基于将 XML 和二进制文件组合为 ZIP 档案的组合。 MS Word 现在使用 .docx 作为保存文档的默认扩展名。

在各种情况下可能需要将 PDF 转换为 DOC 和 PDF 到 DOCX。例如,您可能希望使 PDF 可编辑,或者您希望避免将 PDF 的内容重新输入到保留原始格式的 Word 文档中。另一个用例可能是批量 PDF 到 DOC 或 DOCX 的转换,无需任何专门的软件。密切关注这种情况,本文介绍了以下在 C# 中以编程方式将 PDF 转换为 Word:

  • 在 C# 中将 PDF 转换为 DOC
  • 在 C# 中将 PDF 转换为 DOCX
  • 使用附加设置将 PDF 转换为 DOC

C# PDF 到 Word DOC 或 DOCX 转换器

Aspose.PDF for .NET 拥有一个功能强大的 PDF 到 DOC 或 DOCX 转换器 API,让您在 .NET 应用程序中只需几行代码即可将 PDF 到 Word 文档 转换。该 API 可用于 WinForms、ASP.NET、Web 服务或任何基于 .NET 的应用程序。您可以 下载 API 或使用项目中的 NuGet 包管理器 安装它。

在 C# 中将 PDF 转换为 DOC

以下是使用 Aspose.PDF for .NET 将 PDF 转换为 DOC 的步骤。

以下代码示例展示了如何使用 C# 将 PDF 转换为 Word DOC。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// 打开源 PDF 文档
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// 将文件保存为 MS 文档格式
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

在 C# 中将 PDF 转换为 DOCX

转换 PDF 到 DOCX 类似于前面所示的 PDF 到 DOC 转换。 API 有 DocSaveOptions 类,允许您将文档格式设置为 DOCX。以下是将 PDF 转换为 DOCX 的步骤:

以下代码示例展示了如何在 C# 中将 PDF 转换为 Word DOCX。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// 打开源 PDF 文档
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// 实例化 DocSaveOptions 对象
DocSaveOptions saveOptions = new DocSaveOptions();
// 指定输出格式为 DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// 以 docx 格式保存文档
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

使用附加选项将 PDF 转换为 DOC

Aspose.PDF for .NET 提供了各种其他选项来自定义 PDF 到 DOC 或 DOCX 的转换。 DocSaveOptions 类公开属性以改进或增强 PDF 到 DOC 的转换,例如图像分辨率、行间距等。以下代码显示了在 C# 中将 PDF 转换为 DOC 时如何设置附加属性.

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// 打开源 PDF 文档
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// 使用保存选项保存
// 创建 DocSaveOptions 对象
DocSaveOptions saveOptions = new DocSaveOptions();

// 设置识别模式为 Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// 将水平接近度设置为 2.5
saveOptions.RelativeHorizontalProximity = 2.5f;

// 启用值在转换过程中识别项目符号
saveOptions.RecognizeBullets = true;

// 保存生成的 DOC 文件
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

结论

在本文中,您学习了一些使用 C# 将 PDF 转换为 DOC 和 PDF 转换为 DOCX 的简单方法。如果您想了解更多关于 Aspose.PDF for .NET 强大的转换功能,那么您可以前往 API 文档部分,将 PDF 转换为其他格式。下载 Aspose.PDF for .NET 的免费副本,您可以按照 API 文档立即开始。如果您有任何疑问,请随时发布到 Aspose.PDF 论坛。我们很乐意为您提供咨询和咨询。

也可以看看