Видобувайте зображення з документів Word за допомогою Java

Зображення зазвичай використовуються для представлення важливої інформації в документах Word DOC. Додавання зображень до тексту робить вміст більш привабливим. У деяких випадках вам може знадобитися програмно витягнути зображення, вбудовані в документи DOC. Щоб досягти цього, у цій статті описано, як видобувати зображення з DOC у Java.

Java API для вилучення зображень із файлів DOC

Aspose.Words for Java — це потужний і багатофункціональний API для створення, обробки та перетворення документів MS Word. Тому ми будемо використовувати цей API для видобування зображень із документів DOC. Ви можете завантажити JAR API або встановити його у свою програму Java за допомогою наступних конфігурацій Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Як витягти зображення з DOC на Java

Зображення в документі DOC представлені за допомогою фігурних об’єктів. Тому, щоб отримати зображення, вам доведеться обробити кожну фігуру в документі. Нижче наведено кроки для вилучення зображень із файлу DOC у Java.

  • Спочатку завантажте файл DOC за допомогою класу Document.
  • Потім перемістіть усі фігури в NodeCollection за допомогою методу Document.getChildNodes(NodeType.SHAPE, Boolean).
  • Перебирайте отримані фігури.
  • На кожній ітерації перевіряйте, чи фігура має зображення, використовуючи метод Shape.hasImage().
  • Нарешті, витягніть зображення та збережіть його за допомогою методу Shape.getImageData().save(string).

У наведеному нижче прикладі коду показано, як отримати зображення з документа DOC у Java.

// Завантажити документ Word
Document doc = new Document("Document.docx");

// Отримайте всі форми
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// Перегляньте колекцію форм
for (Shape shape : shapes) {
  
    // Перевірте, чи фігура має зображення
    if (shape.hasImage()) {
      
        // Розпакуйте та збережіть зображення
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java DOC Image Extractor - Отримайте безкоштовну ліцензію

Отримайте безкоштовну тимчасову ліцензію, щоб використовувати Aspose.Words for Java без оціночних обмежень.

Висновок

У цій статті ви дізналися, як видобувати зображення з документа DOC на Java. Крім того, приклад коду показав, як витягти зображення з файлу DOC і зберегти їх у потрібному місці. Крім того, Aspose.Words for Java надає широкий спектр функцій для роботи з документами. Щоб ознайомитися з цими функціями, ви можете відвідати документацію. Ви також можете поставити свої запитання через наш форум.

Дивись також

Інформація: Вас може зацікавити інший Java API (Aspose.Slides for Java), який дозволяє конвертувати презентації (у PDF-файли, документи Word тощо) та імпортувати зображення або інші документи в презентації.