在本文中,我將演示如何準確、輕鬆地將 PDF 轉換為 Word 文檔,包括將 PDF 轉換為 DOC 以及將 PDF 轉換為 DOCX 格式。早期版本的 Microsoft Word 以二進制格式保存文檔,擴展名為 .doc。隨著 Office 2007 的發布,Microsoft 採用了 Office Open XML (OOXML),它基於將 XML 和二進製文件組合在一起作為 ZIP 檔案。 MS Word 現在使用 .docx 作為保存文檔的默認擴展名。
在各種情況下可能需要將 PDF 轉換為 DOC 以及將 PDF 轉換為 DOCX。例如,您可能希望使 PDF 可編輯,或者希望避免將 PDF 的內容重新鍵入到保留原始格式的 Word 文檔中。另一個用例可能是無需任何專門軟件的批量 PDF 到 DOC 或 DOCX 轉換。密切關注這種情況,本文介紹了以下在 C# 中以編程方式將 PDF 轉換為 Word:
- 在 C# 中將 PDF 轉換為 DOC
- 在 C# 中將 PDF 轉換為 DOCX
- 使用其他設置將 PDF 轉換為 DOC
C# PDF 到 Word DOC 或 DOCX 轉換器
Aspose.PDF for .NET 擁有強大的 PDF 到 DOC 或 DOCX 轉換器 API,讓您可以在 .NET 應用程序中用幾行代碼將 PDF 轉換為 Word 文檔。 API 可用於 WinForms、ASP.NET、Web 服務或任何基於 .NET 的應用程序。您可以 下載 API 或使用項目中的 NuGet 包管理器 安裝它。
在 C# 中將 PDF 轉換為 DOC
以下是使用 Aspose.PDF for .NET 將 PDF 轉換為 DOC 的步驟。
- 使用 Document 類加載 PDF 文檔。
- 使用 Document.Save(string) 方法以 .doc 擴展名保存文檔。
以下代碼示例顯示瞭如何使用 C# 將 PDF 轉換為 Word DOC。
// 如需完整示例和數據文件,請訪問 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// 打開源 PDF 文檔
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// 將文件保存為 MS 文檔格式
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
在 C# 中將 PDF 轉換為 DOCX
將 PDF 轉換為 DOCX 類似於前面所示的 PDF 到 DOC 的轉換。 API 具有 DocSaveOptions 類,允許您將文檔格式設置為 DOCX。以下是將 PDF 轉換為 DOCX 的步驟:
- 使用 Document 類加載 PDF 文檔。
- 使用 DocSaveOptions 類將輸出文檔格式設置為 DOCX。
- 使用 Document.Save(string) 方法以 .docx 擴展名保存文檔。
以下代碼示例顯示瞭如何在 C# 中將 PDF 轉換為 Word DOCX。
// 如需完整示例和數據文件,請訪問 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// 打開源 PDF 文檔
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// 實例化 DocSaveOptions 對象
DocSaveOptions saveOptions = new DocSaveOptions();
// 指定輸出格式為DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// 以docx格式保存文件
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);
使用其他選項將 PDF 轉換為 DOC
Aspose.PDF for .NET 提供了各種其他選項來自定義 PDF 到 DOC 或 DOCX 的轉換。 DocSaveOptions 類公開了改進或增強 PDF 到 DOC 轉換的屬性,例如圖像分辨率、行之間的距離等。以下代碼顯示瞭如何在 C# 中將 PDF 轉換為 DOC 時設置其他屬性.
// 如需完整示例和數據文件,請訪問 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// 打開源 PDF 文檔
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// 使用保存選項保存
// 創建 DocSaveOptions 對象
DocSaveOptions saveOptions = new DocSaveOptions();
// 設置識別模式為Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;
// 將水平接近度設置為 2.5
saveOptions.RelativeHorizontalProximity = 2.5f;
// 在轉換過程中啟用值以識別項目符號
saveOptions.RecognizeBullets = true;
// 保存生成的 DOC 文件
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);
結論
在本文中,您學習了一些使用 C# 將 PDF 轉換為 DOC 以及將 PDF 轉換為 DOCX 的簡單方法。如果您想了解更多有關 Aspose.PDF for .NET 的強大轉換功能,那麼您可以直接前往 API 文檔部分,將 PDF 轉換為其他格式。下載 Aspose.PDF for .NET 的免費副本,您可以按照 API 文檔立即開始使用。如果您有任何疑問,請隨時發帖到 Aspose.PDF 論壇。我們很樂意協助您解決您的疑問和詢問。