在 Python 中将 PDF 转换为 Word

PDF 是共享和打印文档的常用文件格式。但是,在某些情况下,PDF 文件会转换为 Word DOCXDOC 格式以解析文本或使文档可编辑。对于此类场景,本文介绍了如何在 Python 中将 PDF 转换为 Word 格式。此外,您将学习如何指定不同的加载选项来控制 PDF 到 Word 的转换。

Python PDF to Word 转换器 - 免费下载

为了将 PDF 文件转换为 Word 格式,我们将使用 Aspose.Words for Python。它是一个功能丰富的 Python 库,用于创建、操作和转换 Word 文档。此外,它还提供高保真Word和PDF文档的来回转换。 Aspose.Words for Python 托管在 PyPI 上,可以使用以下 pip 命令安装。

pip install aspose-words

在 Python 中将 PDF 转换为 Word 的简单步骤

使用 Aspose.Words for Python,您可以通过几个步骤将 PDF 文件转换为 Word 格式。只需加载 PDF 文件并将其保存为 Word 文档。以下步骤演示了如何在 Python 中将 PDF 保存为 Word 文档。

  • 从磁盘加载 PDF 文档。
  • 将 Word 文档另存为 PDF 到所需位置。

就是这样。以下部分演示如何将这些步骤转换为 Python 代码以将 PDF 转换为 Word 格式。

在 Python 中将 PDF 保存为 Word 格式

以下是在 Python 中将 PDF 文件保存为 Word 格式的步骤。

  • 使用 Document 类加载 PDF 文件。
  • 使用 Document.save() 方法将 PDF 文件保存为 Word 文档。

以下代码示例展示了如何将 PDF 文件转换为 Word 格式。

import aspose.words as aw

# 加载 PDF 文件
doc = aw.Document("PDF.pdf")

# 将 PDF 转换为 Word DOCX 格式
doc.save("pdf-to-word.docx")

Python 使用加载选项将 PDF 转换为 Word

Aspose.Words for Python 还允许您根据需要自定义 PDF 文档的加载。例如,您可以仅加载 PDF 中的一系列页面、跳过图像、为加密文件指定密码等。要设置加载选项,使用 PdfLoadOptions 类。以下是在 PDF 到 Word 转换中指定加载选项的步骤。

  • 创建 PdfLoadOptions 类的实例。
  • 使用 PdfLoadOptions.loadformat 属性指定加载格式。
  • 设置skippdfimages、pageindex、pagecount等选项。
  • 使用 Document 类通过传递其路径和 PdfLoadOptions 作为参数来加载 PDF 文件。
  • 使用 Document.save() 方法将 PDF 文件保存为 Word 文档。

以下代码示例显示了如何在 Python 中指定 PDF 到 Word 转换中的加载选项。

import aspose.words as aw

# 创建 PDF 加载选项
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# 设置起始页的索引和页数
loadOptions.page_index = 0
loadOptions.page_count = 1

# 跳过 PDF 中的图像
loadOptions.skip_pdf_images = True

# 为加密的 PDF 文件设置密码
#loadOptions.password = "12345" 

# 加载 PDF 文件
doc = aw.Document("PDF.pdf", loadOptions)

# 将 PDF 转换为 Word
doc.save("pdf-to-word.docx")

Python PDF to Word Library - 获得免费许可证

您可以获得临时许可证 以便在没有评估限制的情况下使用 Aspose.Words for Python。

结论

在本文中,您学习了如何在 Python 中将 PDF 文件转换为 Word 格式。此外,您还了解了如何为 PDF 文件动态指定不同的加载选项。 Aspose.Words for Python 提供了广泛的其他功能,您可以使用 文档 探索这些功能。此外,您可以通过我们的 论坛 提出您的问题。

也可以看看

使用 Python 将 Word 文件转换为 PDF不使用 MS Office 在 Python 中创建 Word 文档PNG 到 C# .NET 中的 Word
JPG 到 C# .NET 中的 WordC# 中的图像到 WordC# 中的 Word 到 HTML
Word DOCX to Markdown in Java从 Java 中的 Word DOC 中提取图像Word DOC to Markdown in Java
Word DOCX DOCX to Markdown in C#用Java从Word文档中提取文本使用 C# .NET 合并 MS Word 文档
C# 中的 Word DOC 到 PNG、JPEG、BMP、GIF 或 TIFFJava 中 Word DOC 到 PNG、JPEG、BMP、GIF 或 TIFF在 C# 中将 Word 文档转换为 EPUB
在 Java 中将 Word 文档转换为 EPUB在 Python 中将 Word 文档转换为 EPUB使用 Python 将 RTF 转换为 PDF
在 C# 中将 TXT 文件转换为 PDF用Java将TXT文件转换为PDF在 Python 中将 TXT 文件转换为 PDF