使用 C# 从 word 文档中提取图像

图像在说明 Word 文档中的关键信息方面发挥着重要作用。此外,它们使文档更具吸引力并改善其呈现方式。作为一名程序员,您可能会得到一份工作来提取嵌入在 Word DOCX 或 DOC 文档中的图像。为此,本文介绍了如何使用 C# 以编程方式从 Word 文档中提取图像。此外,您将看到如何将提取的图像保存到所需的位置。

C# API 从 Word 文档中提取图像

为了从 MS Word DOCX/DOC 文档中提取图像,我们将使用 Aspose.Words for .NET。它是用于创建和操作 Word 文档的强大且广泛使用的 API。您可以下载 API 的 DLL 并将其引用添加到您的应用程序。此外,您可以使用包管理器控制台直接从 NuGet 安装它。

PM> Install-Package Aspose.Words

从 C# 中的 Word 文档中提取图像

在 Word 文档中,图像表示为形状。因此,要提取图像,您必须处理文档中的所有形状。以下是在 C# 中以编程方式从 Word DOCX 文档中提取图像的步骤。

以下代码示例展示了如何从 C# 中的 Word 文档中提取图像。

// 加载 Word 文档。
Document doc = new Document("Document.docx");

// 设置了“HasImage”标志的形状节点包含并显示图像。
IEnumerable<Shape> shapes = doc.GetChildNodes(NodeType.Shape, true)
    .OfType<Shape>().Where(s => s.HasImage);
int imageIndex = 0;

// 循环遍历形状。
foreach (Shape shape in shapes)
{
    // 保存图像。
    string imageFileName =
        $"Image_{imageIndex}{FileFormatUtil.ImageTypeToExtension(shape.ImageData.ImageType)}";
    shape.ImageData.Save(imageFileName);
    imageIndex++;
}

免费试用 Aspose.Words for .NET

您可以获得免费的临时许可证来试用 Aspose.Words for .NET,没有任何限制。 立即获取您的临时许可证

结论

图像已成为 Word 文档不可分割的一部分,使内容更具吸引力。因此,Aspose.Words for .NET 提供了广泛的功能来在 Word 文档中添加或操作图像。

本文特别介绍了从 Word 文档中提取图像。在代码示例的帮助下,您学习了如何使用 C# 以编程方式提取 Word DOCX/DOC 文件中的每个图像。此外,您已经了解了如何将提取的图像保存到您想要的位置。您可以使用 文档 阅读更多关于 Aspose.Words for .NET 的信息。如果您有任何问题,请随时通过我们的 论坛 告诉我们。

也可以看看

提示:如果您需要从 PowerPoint 演示文稿中获取 Word 文档,您可以使用 Aspose Presentation to Word Document 转换器。