在 Python 中將 PDF 轉換為 Word

PDF 是共享和打印文檔的常用文件格式。但是,在某些情況下,PDF 文件會轉換為 Word DOCXDOC 格式以解析文本或使文檔可編輯。對於此類場景,本文介紹瞭如何在 Python 中將 PDF 轉換為 Word 格式。此外,您將學習如何指定不同的加載選項來控制 PDF 到 Word 的轉換。

Python PDF 到 Word 轉換器 - 免費下載

為了將 PDF 文件轉換為 Word 格式,我們將使用 Aspose.Words for Python。它是一個功能豐富的 Python 庫,用於創建、操作和轉換 Word 文檔。此外,它還提供高保真度的 Word 和 PDF 文檔的來迴轉換。 Aspose.Words for Python 託管在 PyPI 上,可以使用以下 pip 命令安裝。

pip install aspose-words

在 Python 中將 PDF 轉換為 Word 的簡單步驟

使用 Aspose.Words for Python,您可以在幾個步驟內將 PDF 文件轉換為 Word 格式。只需加載 PDF 文件並將其另存為 Word 文檔。以下步驟演示瞭如何使用 Python 在 Word 文檔中保存 PDF。

  • 從磁盤加載 PDF 文檔。
  • 將 Word 文檔另存為 PDF 到所需位置。

就是這樣。以下部分演示如何將這些步驟轉換為 Python 代碼以將 PDF 轉換為 Word 格式。

在 Python 中將 PDF 另存為 Word 格式

以下是在 Python 中將 PDF 文件另存為 Word 格式的步驟。

  • 使用 Document 類加載 PDF 文件。
  • 使用 Document.save() 方法將 PDF 文件保存為 Word 文檔。

以下代碼示例顯示瞭如何將 PDF 文件轉換為 Word 格式。

import aspose.words as aw

# 加載PDF文件
doc = aw.Document("PDF.pdf")

# 將 PDF 轉換為 Word DOCX 格式
doc.save("pdf-to-word.docx")

Python 使用加載選項將 PDF 轉換為 Word

Aspose.Words for Python 還允許您根據您的要求自定義 PDF 文檔的加載。例如,您可以僅加載 PDF 中的一定範圍的頁面、跳過圖像、為加密文件指定密碼等。要設置加載選項,請使用 PdfLoadOptions 類。以下是在 PDF 到 Word 轉換中指定加載選項的步驟。

  • 創建 PdfLoadOptions 類的實例。
  • 使用 PdfLoadOptions.loadformat 屬性指定加載格式。
  • 設置諸如 skippdfimages、pageindex、pagecount 等選項。
  • 使用 Document 類通過將其路徑和 PdfLoadOptions 作為參數傳遞來加載 PDF 文件。
  • 使用 Document.save() 方法將 PDF 文件保存為 Word 文檔。

以下代碼示例顯示如何在 Python 中指定 PDF 到 Word 轉換的加載選項。

import aspose.words as aw

# 創建 PDF 加載選項
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# 設置起始頁索引和頁數
loadOptions.page_index = 0
loadOptions.page_count = 1

# 跳過 PDF 中的圖像
loadOptions.skip_pdf_images = True

# 為加密的 PDF 文件設置密碼
#loadOptions.password = "12345" 

# 加載PDF文件
doc = aw.Document("PDF.pdf", loadOptions)

# 將 PDF 轉換為 Word
doc.save("pdf-to-word.docx")

Python PDF 到 Word 庫 - 獲得免費許可證

您可以獲得臨時許可,以便在沒有評估限制的情況下使用 Aspose.Words for Python。

結論

在本文中,您學習瞭如何使用 Python 將 PDF 文件轉換為 Word 格式。此外,您還了解瞭如何為 PDF 文件動態指定不同的加載選項。 Aspose.Words for Python 提供了廣泛的其他功能,您可以使用 文檔 探索這些功能。此外,您可以通過我們的 論壇 提出您的疑問。

也可以看看

使用 Python 將 Word 文件轉換為 PDF在沒有 MS Office 的情況下在 Python 中創建 Word 文檔PNG 到 C# .NET 中的 Word
在 C# .NET 中將 JPG 轉為 WordC# 中的圖像到 WordC# 中的 Word 到 HTML
Word DOCX 到 Java 中的 Markdown用 Java 從 Word DOC 中提取圖像Word DOC 到 Java 中的 Markdown
C# 中的 Word DOC DOCX 到 Markdown在 Java 中從 Word 文檔中提取文本使用 C# .NET 合併 MS Word 文檔
在 C# 中將 Word DOC 轉換為 PNG、JPEG、BMP、GIF 或 TIFF在 Java 中將 Word DOC 轉為 PNG、JPEG、BMP、GIF 或 TIFF在 C# 中將 Word 文檔轉換為 EPUB
在 Java 中將 Word 文檔轉換為 EPUB在 Python 中將 Word 文檔轉換為 EPUB使用 Python 將 RTF 轉換為 PDF
在 C# 中將 TXT 文件轉換為 PDF在 Java 中將 TXT 文件轉換為 PDF在 Python 中將 TXT 文件轉換為 PDF