
Obrázky se běžně používají k reprezentaci důležitých informací v dokumentech Word DOC. Zahrnutí obrázků vedle textu činí obsah atraktivnějším. V některých případech může být nutné extrahovat obrázky vložené do dokumentů DOC programově. Abychom toho dosáhli, tento článek popisuje, jak extrahovat obrázky z DOC v Javě.
Java API pro extrahování obrázků ze souborů DOC
Aspose.Words for Java je výkonné a na funkce bohaté API pro vytváření, manipulaci a konverzi dokumentů MS Word. Proto použijeme toto API k extrahování obrázků z dokumentů DOC. Můžete si stáhnout JAR API nebo jej nainstalovat do své Java aplikace pomocí následujících konfigurací Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Jak extrahovat obrázky z DOC v Javě
Obrázky v dokumentu DOC jsou reprezentovány pomocí objektů tvaru. Chcete-li tedy získat obrázky, budete muset zpracovat každý tvar v dokumentu. Následují kroky k extrahování obrázků ze souboru DOC v Javě.
- Nejprve načtěte soubor DOC pomocí třídy Document.
- Poté získejte všechny tvary do NodeCollection objekt pomocí metody Document.getChildNodes(NodeType.SHAPE, Boolean).
- Procházejte načtené tvary.
- V každé iteraci zkontrolujte, zda má tvar obrázek pomocí metody Shape.hasImage().
- Nakonec rozbalte obrázek a uložte jej pomocí metody Shape.getImageData().save(string).
Následující ukázka kódu ukazuje, jak extrahovat obrázky z dokumentu DOC v Javě.
// Načíst dokument aplikace Word
Document doc = new Document("Document.docx");
// Získejte všechny tvary
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Projděte sbírku tvarů
for (Shape shape : shapes) {
// Zkontrolujte, zda má tvar obrázek
if (shape.hasImage()) {
// Extrahujte a uložte obrázek
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC Image Extractor - Získejte bezplatnou licenci
Získejte bezplatnou dočasnou licenci k používání Aspose.Words for Java bez omezení hodnocení.
Závěr
V tomto článku jste se naučili, jak extrahovat obrázky z dokumentu DOC v Javě. Kromě toho ukázka kódu ukázala, jak extrahovat obrázky ze souboru DOC a uložit je na požadované místo. Kromě toho Aspose.Words pro Java poskytuje širokou škálu funkcí pro manipulaci s dokumenty. Chcete-li prozkoumat tyto funkce, můžete navštívit dokumentaci. Také můžete klást své dotazy prostřednictvím našeho fóra.
Viz také
- Vytvářejte dokumenty Word od nuly v Javě
- Generujte dokumenty Word ze šablon v Javě
- Převeďte soubory Word do PDF v Javě
Info: Mohlo by vás zajímat další Java API (Aspose.Slides for Java), které umožňuje konvertovat prezentace (do PDF, word dokumentů atd.) a importovat obrázky nebo jiných dokumentů do prezentací.