Extraia imagens de documentos do Word usando C#

As imagens desempenham um papel importante para ilustrar as principais informações em documentos do Word. Além disso, tornam o documento mais atrativo e melhoram sua apresentação. Como programador, você pode conseguir um trabalho para extrair as imagens incorporadas nos documentos Word DOCX ou DOC. Para conseguir isso, este artigo aborda como extrair imagens de documentos do Word programaticamente usando C#. Além disso, você verá como salvar as imagens extraídas no local desejado.

API C# para extrair imagens de documentos do Word

Para extrair imagens de documentos MS Word DOCX/DOC, usaremos Aspose.Words for .NET. É uma API poderosa e amplamente utilizada para criar e manipular documentos do Word. Você pode baixar a DLL da API e adicionar sua referência ao seu aplicativo. Além disso, você pode instalá-lo diretamente do NuGet usando o console do gerenciador de pacotes.

PM> Install-Package Aspose.Words

Extrair imagens de um documento do Word em C#

Nos documentos do Word, as imagens são representadas como formas. Portanto, para extrair imagens, você terá que processar todas as formas do documento. A seguir estão as etapas para extrair imagens de um documento Word DOCX programaticamente em C#.

O exemplo de código a seguir mostra como extrair imagens de um documento do Word em C#.

// Carregue o documento do Word.
Document doc = new Document("Document.docx");

// Os nós de forma que têm o conjunto de sinalizadores "HasImage" contêm e exibem imagens.
IEnumerable<Shape> shapes = doc.GetChildNodes(NodeType.Shape, true)
    .OfType<Shape>().Where(s => s.HasImage);
int imageIndex = 0;

// Percorra as formas.
foreach (Shape shape in shapes)
{
    // Salve imagens.
    string imageFileName =
        $"Image_{imageIndex}{FileFormatUtil.ImageTypeToExtension(shape.ImageData.ImageType)}";
    shape.ImageData.Save(imageFileName);
    imageIndex++;
}

Experimente o Aspose.Words for .NET gratuitamente

Você pode obter uma licença temporária gratuita para experimentar o Aspose.Words for .NET sem quaisquer limitações. Obtenha sua licença temporária agora.

Conclusão

As imagens tornaram-se parte integrante dos documentos do Word, o que torna o conteúdo mais atrativo. Portanto, Aspose.Words for .NET fornece uma ampla gama de recursos para adicionar ou manipular imagens em documentos do Word.

Este artigo abordou particularmente a extração de imagens de documentos do Word. Com a ajuda de um exemplo de código, você aprendeu como extrair cada imagem em um arquivo DOCX/DOC do Word programaticamente usando C#. Além disso, você viu como salvar as imagens extraídas no local desejado. Você pode ler mais sobre o Aspose.Words for .NET usando a documentação. Caso você tenha alguma dúvida, sinta-se à vontade para nos informar através do nosso fórum.

Veja também

Dica: Se você precisar obter um documento do Word de uma apresentação do PowerPoint, poderá usar o conversor Aspose Apresentação para documento do Word.