Extrahujte obrázky z dokumentů aplikace Word pomocí Java

Obrázky se běžně používají k reprezentaci důležitých informací v dokumentech Word DOC. Zahrnutí obrázků vedle textu činí obsah atraktivnějším. V některých případech může být nutné extrahovat obrázky vložené do dokumentů DOC programově. Abychom toho dosáhli, tento článek popisuje, jak extrahovat obrázky z DOC v Javě.

Java API pro extrahování obrázků ze souborů DOC

Aspose.Words for Java je výkonné a na funkce bohaté API pro vytváření, manipulaci a konverzi dokumentů MS Word. Proto použijeme toto API k extrahování obrázků z dokumentů DOC. Můžete si stáhnout JAR API nebo jej nainstalovat do své Java aplikace pomocí následujících konfigurací Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Jak extrahovat obrázky z DOC v Javě

Obrázky v dokumentu DOC jsou reprezentovány pomocí objektů tvaru. Chcete-li tedy získat obrázky, budete muset zpracovat každý tvar v dokumentu. Následují kroky k extrahování obrázků ze souboru DOC v Javě.

Následující ukázka kódu ukazuje, jak extrahovat obrázky z dokumentu DOC v Javě.

// Načíst dokument aplikace Word
Document doc = new Document("Document.docx");

// Získejte všechny tvary
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Projděte sbírku tvarů
for (Shape shape : shapes) {
  
    // Zkontrolujte, zda má tvar obrázek
    if (shape.hasImage()) {
      
        // Extrahujte a uložte obrázek
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java DOC Image Extractor - Získejte bezplatnou licenci

Získejte bezplatnou dočasnou licenci k používání Aspose.Words for Java bez omezení hodnocení.

Závěr

V tomto článku jste se naučili, jak extrahovat obrázky z dokumentu DOC v Javě. Kromě toho ukázka kódu ukázala, jak extrahovat obrázky ze souboru DOC a uložit je na požadované místo. Kromě toho Aspose.Words pro Java poskytuje širokou škálu funkcí pro manipulaci s dokumenty. Chcete-li prozkoumat tyto funkce, můžete navštívit dokumentaci. Také můžete klást své dotazy prostřednictvím našeho fóra.

Viz také

Info: Mohlo by vás zajímat další Java API (Aspose.Slides for Java), které umožňuje konvertovat prezentace (do PDF, word dokumentů atd.) a importovat obrázky nebo jiných dokumentů do prezentací.