Extract images from word documents using C#

Images play an important role to illustrate the key information in Word documents. Moreover, they make the document more attractive and improve its presentation. As a programmer, you may get a job to extract the images embedded within the Word DOCX or DOC documents. To achieve that, this article covers how to extract images from Word documents programmatically using C#. Moreover, you will see how to save the extracted images to the desired location.

C# API to Extract Images from Word Documents

To extract images from MS Word DOCX/DOC documents, we will use Aspose.Words for .NET. It is a powerful and widely used API for creating and manipulating Word documents. You can download the API’s DLL and add its reference to your application. Also, you can install it directly from NuGet using the package manager console.

PM> Install-Package Aspose.Words

Extract Images from a Word Document in C#

In Word documents, images are represented as shapes. Therefore, to extract images, you will have to process all the shapes in the document. The following are the steps to extract images from a Word DOCX document programmatically in C#.

Följande kodexempel visar hur man extraherar bilder från ett Word-dokument i C#.

// Ladda Word-dokumentet.
Document doc = new Document("Document.docx");

// Formnoder som har flaggan "HasImage" innehåller och visar bilder.
IEnumerable<Shape> shapes = doc.GetChildNodes(NodeType.Shape, true)
    .OfType<Shape>().Where(s => s.HasImage);
int imageIndex = 0;

// Slinga genom former.
foreach (Shape shape in shapes)
{
    // Spara bilder.
    string imageFileName =
        $"Image_{imageIndex}{FileFormatUtil.ImageTypeToExtension(shape.ImageData.ImageType)}";
    shape.ImageData.Save(imageFileName);
    imageIndex++;
}

Prova Aspose.Words för .NET gratis

Du kan få en gratis tillfällig licens för att prova Aspose.Words för .NET utan några begränsningar. Hämta din tillfälliga licens nu.

Slutsats

Bilder har blivit en integrerad del av Word-dokument, vilket gör innehållet mer attraktivt. Därför erbjuder Aspose.Words för .NET ett brett utbud av funktioner för att lägga till eller manipulera bilder i Word-dokument.

Den här artikeln behandlade särskilt extrahering av bilder från Word-dokument. Med hjälp av ett kodexempel har du lärt dig hur du extraherar varje bild i en Word DOCX/DOC-fil programmatiskt med C#. Dessutom har du sett hur du sparar de extraherade bilderna på önskad plats. Du kan läsa mer om Aspose.Words för .NET med hjälp av dokumentationen. Om du har några frågor är du välkommen att meddela oss via vårt forum.

Se även

Tips: Om du någonsin behöver få ett Word-dokument från en PowerPoint-presentation kan du använda Aspose Presentation to Word Document-konverteraren.