图像在说明 Word 文档中的关键信息方面发挥着重要作用。此外,它们使文档更具吸引力并改善其呈现方式。作为一名程序员,您可能会得到一份工作来提取嵌入在 Word DOCX 或 DOC 文档中的图像。为此,本文介绍了如何使用 C# 以编程方式从 Word 文档中提取图像。此外,您将看到如何将提取的图像保存到所需的位置。
C# API 从 Word 文档中提取图像
为了从 MS Word DOCX/DOC 文档中提取图像,我们将使用 Aspose.Words for .NET。它是用于创建和操作 Word 文档的强大且广泛使用的 API。您可以下载 API 的 DLL 并将其引用添加到您的应用程序。此外,您可以使用包管理器控制台直接从 NuGet 安装它。
PM> Install-Package Aspose.Words
从 C# 中的 Word 文档中提取图像
在 Word 文档中,图像表示为形状。因此,要提取图像,您必须处理文档中的所有形状。以下是在 C# 中以编程方式从 Word DOCX 文档中提取图像的步骤。
- 使用 Document 类加载 Word 文件。
- 将所有具有图像的形状放入 IEnumerable对象使用 Document.GetChildNodes(NodeType.Shape, Boolean) 方法。
- 循环遍历检索到的形状。
- 在每次迭代中,提取图像并使用 Shape.ImageData.Save(string) 方法保存。
以下代码示例展示了如何从 C# 中的 Word 文档中提取图像。
// 加载 Word 文档。
Document doc = new Document("Document.docx");
// 设置了“HasImage”标志的形状节点包含并显示图像。
IEnumerable<Shape> shapes = doc.GetChildNodes(NodeType.Shape, true)
.OfType<Shape>().Where(s => s.HasImage);
int imageIndex = 0;
// 循环遍历形状。
foreach (Shape shape in shapes)
{
// 保存图像。
string imageFileName =
$"Image_{imageIndex}{FileFormatUtil.ImageTypeToExtension(shape.ImageData.ImageType)}";
shape.ImageData.Save(imageFileName);
imageIndex++;
}
免费试用 Aspose.Words for .NET
您可以获得免费的临时许可证来试用 Aspose.Words for .NET,没有任何限制。 立即获取您的临时许可证。
结论
图像已成为 Word 文档不可分割的一部分,使内容更具吸引力。因此,Aspose.Words for .NET 提供了广泛的功能来在 Word 文档中添加或操作图像。
本文特别介绍了从 Word 文档中提取图像。在代码示例的帮助下,您学习了如何使用 C# 以编程方式提取 Word DOCX/DOC 文件中的每个图像。此外,您已经了解了如何将提取的图像保存到您想要的位置。您可以使用 文档 阅读更多关于 Aspose.Words for .NET 的信息。如果您有任何问题,请随时通过我们的 论坛 告诉我们。
也可以看看
提示:如果您需要从 PowerPoint 演示文稿中获取 Word 文档,您可以使用 Aspose Presentation to Word Document 转换器。