รูปภาพมักใช้เพื่อแสดงข้อมูลสำคัญในเอกสาร Word DOC การรวมรูปภาพไว้ข้างข้อความทำให้เนื้อหาน่าสนใจยิ่งขึ้น ในบางกรณี คุณอาจต้องแยกภาพที่ฝังอยู่ภายในเอกสาร DOC โดยทางโปรแกรม บทความนี้ครอบคลุมวิธีการแยกรูปภาพจาก DOC ใน Java
Java API เพื่อแยกรูปภาพออกจากไฟล์ DOC
Aspose.Words for Java เป็น API ที่ทรงประสิทธิภาพและมีคุณลักษณะมากมายสำหรับการสร้าง จัดการ และแปลงเอกสาร MS Word ดังนั้น เราจะใช้ API นี้เพื่อแยกรูปภาพจากเอกสาร DOC คุณสามารถ ดาวน์โหลด JAR ของ API หรือติดตั้งลงในแอปพลิเคชัน Java โดยใช้การกำหนดค่า Maven ต่อไปนี้
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
วิธีแยกรูปภาพจาก DOC ใน Java
รูปภาพในเอกสาร DOC แสดงโดยใช้วัตถุรูปร่าง ดังนั้นในการดึงรูปภาพ คุณจะต้องประมวลผลทุกรูปร่างในเอกสาร ต่อไปนี้เป็นขั้นตอนในการแยกรูปภาพจากไฟล์ DOC ใน Java
- ก่อนอื่น ให้โหลดไฟล์ DOC โดยใช้คลาส Document
- จากนั้น นำรูปร่างทั้งหมดไปไว้ใน NodeCollection วัตถุโดยใช้เมธอด Document.getChildNodes(NodeType.SHAPE, Boolean)
- วนซ้ำรูปร่างที่ดึงออกมา
- ในการวนซ้ำแต่ละครั้ง ให้ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่โดยใช้เมธอด Shape.hasImage()
- สุดท้าย แยกรูปภาพและบันทึกโดยใช้เมธอด Shape.getImageData().save(string)
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสาร DOC ในภาษาจาวา
// โหลดเอกสาร Word
Document doc = new Document("Document.docx");
// ได้ทุกรูปทรง
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// วนซ้ำคอลเลกชันรูปร่าง
for (Shape shape : shapes) {
// ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่
if (shape.hasImage()) {
// แยกและบันทึกภาพ
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC Image Extractor - รับใบอนุญาตฟรี
รับใบอนุญาตชั่วคราวฟรี เพื่อใช้ Aspose.Words for Java โดยไม่มีข้อจำกัดในการประเมิน
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีแยกรูปภาพจากเอกสาร DOC ในภาษา Java นอกจากนี้ ตัวอย่างโค้ดยังแสดงวิธีการแยกรูปภาพจากไฟล์ DOC และบันทึกลงในตำแหน่งที่ต้องการ นอกจากนี้ Aspose.Words for Java ยังมีคุณสมบัติที่หลากหลายสำหรับการจัดการเอกสาร หากต้องการสำรวจคุณลักษณะเหล่านั้น คุณสามารถไปที่ เอกสารประกอบ นอกจากนี้ คุณสามารถถามคำถามผ่าน ฟอรัม ของเรา
ดูสิ่งนี้ด้วย
- สร้างเอกสาร Word จาก Scratch ใน Java
- สร้างเอกสาร Word จากเทมเพลตใน Java
- แปลงไฟล์ Word เป็น PDF ใน Java
ข้อมูล: คุณอาจสนใจ Java API อื่น (Aspose.Slides for Java) ที่ให้คุณแปลงงานนำเสนอ (เป็น PDF, เอกสารคำ ฯลฯ) และ นำเข้ารูปภาพ หรือเอกสารอื่นๆ ในงานนำเสนอ