PDF 到 Word 的轉換不僅很常見,而且對於從編輯、協作到內容提取的各種應用程式來說也是必不可少的。在這篇文章中,我們將探討如何使用 JavaScript 將 PDF 檔案轉換為 Word DOC/DOCX 文件。
使用 C# 將 PDF 轉換為具有交叉引用和超鏈接的 DOCX
我們又推出了 Aspose.PDF for .NET 的主要版本 v19.12,在將 PDF 轉換為 DOCX 格式時引入了對交叉引用和超鏈接的支持。此外,我們在 PDF 文檔中添加了字體子集優化策略。不僅如此,我們還為 PDF 到 DOCX、PDF 到 HTML、PDF 到 TIFF、PDF 到 PNG、PDF 到 PPTX、SVG 到 PDF 和 PCL 到 PDF 的轉換提供了重要的錯誤修復。因此,讓我們更詳細地了解一下新功能、增強功能和錯誤修復。
在 C# 中使用交叉引用和超鏈接將 PDF 轉換為 DOCX 文檔中的交叉引用用於讓讀者參考文檔中的其他部分或對象,例如圖形、圖表或圖形。 PDF 格式允許在文檔中插入交叉引用以將用戶導航到引用的內容。同樣,超鏈接也用於將讀者帶到文檔內部或外部的特定目的地。
Aspose.PDF for .NET 支持 converting PDF to Word (DOC, DOCX) 格式,但是,以前版本的 API 缺乏支持轉換後的 Word 文檔中的超鏈接和交叉引用的能力。現在已添加此功能,並且在 PDF 到 Word 轉換中支持超鏈接和交叉引用。
使用 C# 優化 PDF 中的字體子集 Aspose.PDF for .NET 允許將字體嵌入到 PDF 文檔中。字體可以完全嵌入或作為字體的子集嵌入。但是,在某些情況下,您可能希望通過將完全嵌入的字體集減少為僅在 PDF 文檔中使用的子集來優化字體。在最新版本中,我們提供了優化選項以使用 SubsetFonts 方法調整字體子集策略。此方法接受具有以下變體的 FontSubsetStrategy:
在 C# 中以編程方式將 PDF 轉換為 Word DOC 或 DOCX
在本文中,我將演示如何準確、輕鬆地將 PDF 轉換為 Word 文檔,包括將 PDF 轉換為 DOC 以及將 PDF 轉換為 DOCX 格式。早期版本的 Microsoft Word 以二進制格式保存文檔,擴展名為 .doc。隨著 Office 2007 的發布,Microsoft 採用了 Office Open XML (OOXML),它基於將 XML 和二進製文件組合在一起作為 ZIP 檔案。 MS Word 現在使用 .docx 作為保存文檔的默認擴展名。
在各種情況下可能需要將 PDF 轉換為 DOC 以及將 PDF 轉換為 DOCX。例如,您可能希望使 PDF 可編輯,或者希望避免將 PDF 的內容重新鍵入到保留原始格式的 Word 文檔中。另一個用例可能是無需任何專門軟件的批量 PDF 到 DOC 或 DOCX 轉換。密切關注這種情況,本文介紹了以下在 C# 中以編程方式將 PDF 轉換為 Word:
在 C# 中將 PDF 轉換為 DOC 在 C# 中將 PDF 轉換為 DOCX 使用其他設置將 PDF 轉換為 DOC C# PDF 到 Word DOC 或 DOCX 轉換器 Aspose.