Зображення зазвичай використовуються для представлення важливої інформації в документах Word DOC. Додавання зображень до тексту робить вміст більш привабливим. У деяких випадках вам може знадобитися програмно витягнути зображення, вбудовані в документи DOC. Щоб досягти цього, у цій статті описано, як видобувати зображення з DOC у Java.
Java API для вилучення зображень із файлів DOC
Aspose.Words for Java — це потужний і багатофункціональний API для створення, обробки та перетворення документів MS Word. Тому ми будемо використовувати цей API для видобування зображень із документів DOC. Ви можете завантажити JAR API або встановити його у свою програму Java за допомогою наступних конфігурацій Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Як витягти зображення з DOC на Java
Зображення в документі DOC представлені за допомогою фігурних об’єктів. Тому, щоб отримати зображення, вам доведеться обробити кожну фігуру в документі. Нижче наведено кроки для вилучення зображень із файлу DOC у Java.
- Спочатку завантажте файл DOC за допомогою класу Document.
- Потім перемістіть усі фігури в NodeCollection за допомогою методу Document.getChildNodes(NodeType.SHAPE, Boolean).
- Перебирайте отримані фігури.
- На кожній ітерації перевіряйте, чи фігура має зображення, використовуючи метод Shape.hasImage().
- Нарешті, витягніть зображення та збережіть його за допомогою методу Shape.getImageData().save(string).
У наведеному нижче прикладі коду показано, як отримати зображення з документа DOC у Java.
// Завантажити документ Word
Document doc = new Document("Document.docx");
// Отримайте всі форми
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// Перегляньте колекцію форм
for (Shape shape : shapes) {
// Перевірте, чи фігура має зображення
if (shape.hasImage()) {
// Розпакуйте та збережіть зображення
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC Image Extractor - Отримайте безкоштовну ліцензію
Отримайте безкоштовну тимчасову ліцензію, щоб використовувати Aspose.Words for Java без оціночних обмежень.
Висновок
У цій статті ви дізналися, як видобувати зображення з документа DOC на Java. Крім того, приклад коду показав, як витягти зображення з файлу DOC і зберегти їх у потрібному місці. Крім того, Aspose.Words for Java надає широкий спектр функцій для роботи з документами. Щоб ознайомитися з цими функціями, ви можете відвідати документацію. Ви також можете поставити свої запитання через наш форум.
Дивись також
- Створюйте документи Word з нуля в Java
- Створюйте документи Word із шаблонів у Java
- Перетворюйте файли Word у PDF на Java
Інформація: Вас може зацікавити інший Java API (Aspose.Slides for Java), який дозволяє конвертувати презентації (у PDF-файли, документи Word тощо) та імпортувати зображення або інші документи в презентації.