Word到PDF转换Python

Word 到 PDF 是最流行且执行力极强的文档转换之一。 DOCXDOC 文件在打印或共享之前转换为 PDF 格式。在本文中,我们将在 Python 中自动将 Word 转换为 PDF。步骤和代码示例将演示如何使用 Python 将 Word DOCX 或 DOC 转换为 PDF。此外,您将了解自定义 Word 到 PDF 转换的不同选项。

用于 Word 到 PDF 转换的 Python 库 - 免费下载

为了将 Word 文档转换为 PDF 格式,我们将使用 Aspose.Words for Python。它是一个功能丰富的 Python 库,用于创建和操作 Word 文档。此外,它还可以让您将 DOCX 和 DOC 文件高保真地转换为 PDF 格式。该库托管在 PyPI 上,您可以使用以下 pip 命令安装它。

pip install aspose-words

在 Python 中将 Word DOCX 转换为 PDF

以下是在 Python 中将 Word 文档转换为 PDF 的步骤。

  • 使用 Document 类加载 Word 文档。
  • 使用 Document.save() 方法将 Word 文档转换为 PDF。

以下代码示例展示了如何将 Word DOCX 文件转换为 PDF。

import aspose.words as aw

# 加载word文档
doc = aw.Document("calibre.docx")

# 另存为 PDF
doc.save("PDF.pdf")

具有特定标准的 Python Word 到 PDF

您还可以指定转换后的 PDF 文档的特定标准,例如 PDF/A。以下是使用 Python 在 Word 到 PDF 转换中指定 PDF 标准的步骤。

  • 使用 Document 类加载 Word 文档。
  • 创建 PdfSaveOptions 类的对象并使用 PdfSaveOptions.compliance 属性设置 PDF 标准。
  • 使用 Document.save() 方法将 Word 文档转换为 PDF。

以下代码示例显示了如何在 Word DOCX 到 PDF 转换中设置特定标准。

import aspose.words as aw

# 加载word文档
doc = aw.Document("calibre.docx")

# 创建保存选项并设置合规性
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.compliance = aw.saving.PdfCompliance.PDF17 

# 另存为 PDF
doc.save("PDF.pdf", saveOptions)

Python DOCX 到 PDF - 转换页面范围

您还可以指定要转换为 PDF 格式的页面范围。为此,您可以使用 PdfSaveOptions.pageset 属性。以下代码示例展示了如何将 Word 文档中的一系列页面转换为 PDF。

import aspose.words as aw

# 加载word文档
doc = aw.Document("calibre.docx")

# 创建保存选项并设置页面范围
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.page_set = aw.saving.PageSet([0, 1])

# 另存为 PDF
doc.save("PDF.pdf", saveOptions)

在 Python 中将 DOCX DOCX 转换为 PDF - 应用图像压缩

Aspose.Words for Python 还允许您在转换后的 PDF 文档中应用图像压缩。此外,您可以指定图像的 JPEG 质量。以下是在 Python 中将 Word DOCX 转换为 PDF 时设置图像压缩的步骤。

  • 使用 Document 类加载 Word 文档。
  • 创建 PdfSaveOptions 类的对象。
  • 使用 PdfSaveOptions.imagecompression 属性设置图像压缩。
  • 使用 PdfSaveOptions.jpegquality 属性设置 JPEG 质量。
  • 使用 Document.save() 方法将 Word 文档转换为 PDF。

以下代码示例显示了如何在 Word 到 PDF 的转换中设置图像压缩。

import aspose.words as aw

# 加载word文档
doc = aw.Document("calibre.docx")

# 创建保存选项并设置图像压缩
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.image_compression = aw.saving.PdfImageCompression.JPEG
saveOptions.jpeg_quality = 100 # Use JPEG compression at 50% quality to reduce file size.

# 另存为 PDF
doc.save("PDF.pdf", saveOptions)

Python DOCX 到 PDF 库 - 获得免费库许可证

您可以获得临时许可证 以便在没有评估限制的情况下使用 Aspose.Words for Python。

结论

在本文中,您学习了如何在 Python 中将 Word DOCX 或 DOC 文件转换为 PDF。此外,您还看到了在 Python 中自定义 DOC 或 DOCX 到 PDF 转换的不同选项。您可以使用 文档 了解有关 Aspose.Words for Python 的更多信息。如果您有任何问题,请随时通过我们的 论坛 告诉我们。

也可以看看

PDF 到 Python 中的文本Java 中的 XLSX 到 JSONJava 中的 Excel 到 JSON
Java 中 DOCX 到 JSONJava 中的 DOC 到 JSONJava 中的 Word 到 JSON
Java 中的 TXT 转 JSONPython 中的 JSON 到 PDFJava 中的 Excel 到 JSON
Python 中的 TXT 转 JSONPNG 到 C# .NET 中的 WordJPG 到 C# .NET 中的 Word
C# 中的图像到 WordC# 中的 Word 到 HTMLWord DOCX to Markdown in Java
使用 Python 创建 MS Word 文档在Python中将Word文档转换为图像使用 C++ 创建 MS Word 文档 (DOC/DOCX)
从 Java 中的 Word DOC 中提取图像在 Java 中将宏从一个 Word 文档复制到其他文档[将 Word 转换为 PowerPoint][https://blog.aspose.com/zh/total/convert-doc-to-ppt-python/]

信息:您可能对另一个允许开发人员和应用程序将 PowerPoint 转换为 PDF 的 Python 库感兴趣 - Aspose.Slides for Python。您可能还想查看 Aspose PowerPoint 到 PDF 转换器,因为它是 PowerPoint 到 PDF 转换过程的实时实现。