PDF 是共享和打印文档的常用文件格式。但是,在某些情况下,PDF 文件会转换为 Word DOCX 或 DOC 格式以解析文本或使文档可编辑。对于此类场景,本文介绍了如何在 Python 中将 PDF 转换为 Word 格式。此外,您将学习如何指定不同的加载选项来控制 PDF 到 Word 的转换。
Python PDF to Word 转换器 - 免费下载
为了将 PDF 文件转换为 Word 格式,我们将使用 Aspose.Words for Python。它是一个功能丰富的 Python 库,用于创建、操作和转换 Word 文档。此外,它还提供高保真Word和PDF文档的来回转换。 Aspose.Words for Python 托管在 PyPI 上,可以使用以下 pip 命令安装。
pip install aspose-words
在 Python 中将 PDF 转换为 Word 的简单步骤
使用 Aspose.Words for Python,您可以通过几个步骤将 PDF 文件转换为 Word 格式。只需加载 PDF 文件并将其保存为 Word 文档。以下步骤演示了如何在 Python 中将 PDF 保存为 Word 文档。
- 从磁盘加载 PDF 文档。
- 将 Word 文档另存为 PDF 到所需位置。
就是这样。以下部分演示如何将这些步骤转换为 Python 代码以将 PDF 转换为 Word 格式。
在 Python 中将 PDF 保存为 Word 格式
以下是在 Python 中将 PDF 文件保存为 Word 格式的步骤。
- 使用 Document 类加载 PDF 文件。
- 使用 Document.save() 方法将 PDF 文件保存为 Word 文档。
以下代码示例展示了如何将 PDF 文件转换为 Word 格式。
import aspose.words as aw
# 加载 PDF 文件
doc = aw.Document("PDF.pdf")
# 将 PDF 转换为 Word DOCX 格式
doc.save("pdf-to-word.docx")
Python 使用加载选项将 PDF 转换为 Word
Aspose.Words for Python 还允许您根据需要自定义 PDF 文档的加载。例如,您可以仅加载 PDF 中的一系列页面、跳过图像、为加密文件指定密码等。要设置加载选项,使用 PdfLoadOptions 类。以下是在 PDF 到 Word 转换中指定加载选项的步骤。
- 创建 PdfLoadOptions 类的实例。
- 使用 PdfLoadOptions.loadformat 属性指定加载格式。
- 设置skippdfimages、pageindex、pagecount等选项。
- 使用 Document 类通过传递其路径和 PdfLoadOptions 作为参数来加载 PDF 文件。
- 使用 Document.save() 方法将 PDF 文件保存为 Word 文档。
以下代码示例显示了如何在 Python 中指定 PDF 到 Word 转换中的加载选项。
import aspose.words as aw
# 创建 PDF 加载选项
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# 设置起始页的索引和页数
loadOptions.page_index = 0
loadOptions.page_count = 1
# 跳过 PDF 中的图像
loadOptions.skip_pdf_images = True
# 为加密的 PDF 文件设置密码
#loadOptions.password = "12345"
# 加载 PDF 文件
doc = aw.Document("PDF.pdf", loadOptions)
# 将 PDF 转换为 Word
doc.save("pdf-to-word.docx")
Python PDF to Word Library - 获得免费许可证
您可以获得临时许可证 以便在没有评估限制的情况下使用 Aspose.Words for Python。
结论
在本文中,您学习了如何在 Python 中将 PDF 文件转换为 Word 格式。此外,您还了解了如何为 PDF 文件动态指定不同的加载选项。 Aspose.Words for Python 提供了广泛的其他功能,您可以使用 文档 探索这些功能。此外,您可以通过我们的 论坛 提出您的问题。