PDF 到 Word 的转换不仅很常见,而且对于从编辑、协作到内容提取的各种应用程序来说也是必不可少的。在这篇博文中,我们将探讨如何使用 JavaScript 将 PDF 文件转换为 Word DOC/DOCX 文档。
使用 C# 将 PDF 转换为带有交叉引用和超链接的 DOCX
我们回来了 Aspose.PDF for .NET 作为 v19.12 的主要版本,在将 PDF 转换为 DOCX 格式时引入了对交叉引用和超链接的支持。此外,我们在 PDF 文档中添加了字体子集优化策略。不仅如此,我们还为 PDF 到 DOCX、PDF 到 HTML、PDF 到 TIFF、PDF 到 PNG、PDF 到 PPTX、SVG 到 PDF 以及 PCL 到 PDF 转换提供了重要的错误修复。因此,让我们更详细地了解一下新功能、增强功能和错误修复。
PDF 到 DOCX,在 C# 中具有交叉引用和超链接 文档中的交叉引用用于将读者引用到文档中的某些其他部分或对象,例如图形、图表或图形。 PDF 格式允许在文档中插入交叉引用以将用户导航到引用的内容。同样,超链接也用于将读者带到文档内部或外部的特定目的地。
Aspose.PDF for .NET 支持 将 PDF 转换为 Word(DOC、DOCX)格式,但是,以前版本的 API 缺乏支持转换后的 Word 文档中的超链接和交叉引用的能力。现在已添加此功能,并且在 PDF 到 Word 的转换中支持超链接和交叉引用。
使用 C# 在 PDF 中优化字体子集 Aspose.PDF for .NET 允许将字体嵌入到 PDF 文档中。字体可以完全嵌入,也可以作为字体的子集嵌入。但是,在某些情况下,您可能希望通过将完全嵌入的字体集减少为仅在 PDF 文档中使用的子集来优化字体。在最新版本中,我们提供了优化选项来使用 SubsetFonts 方法调整字体子集策略。此方法接受具有以下变体的 FontSubsetStrategy:
在 C# 中以编程方式将 PDF 转换为 Word DOC 或 DOCX
在本文中,我将演示如何准确轻松地将 PDF 转换为 Word 文档,包括将 PDF 转换为 DOC 和 PDF 转换为 DOCX 格式。早期版本的 Microsoft Word 以二进制格式保存文档,扩展名为 .doc。随着 Office 2007 的发布,Microsoft 采用了 Office Open XML (OOXML),它基于将 XML 和二进制文件组合为 ZIP 档案的组合。 MS Word 现在使用 .docx 作为保存文档的默认扩展名。
在各种情况下可能需要将 PDF 转换为 DOC 和 PDF 到 DOCX。例如,您可能希望使 PDF 可编辑,或者您希望避免将 PDF 的内容重新输入到保留原始格式的 Word 文档中。另一个用例可能是批量 PDF 到 DOC 或 DOCX 的转换,无需任何专门的软件。密切关注这种情况,本文介绍了以下在 C# 中以编程方式将 PDF 转换为 Word:
在 C# 中将 PDF 转换为 DOC 在 C# 中将 PDF 转换为 DOCX 使用附加设置将 PDF 转换为 DOC C# PDF 到 Word DOC 或 DOCX 转换器 Aspose.