แยกรูปภาพจากเอกสารคำโดยใช้ Java

รูปภาพมักใช้เพื่อแสดงข้อมูลสำคัญในเอกสาร Word DOC การรวมรูปภาพไว้ข้างข้อความทำให้เนื้อหาน่าสนใจยิ่งขึ้น ในบางกรณี คุณอาจต้องแยกภาพที่ฝังอยู่ภายในเอกสาร DOC โดยทางโปรแกรม บทความนี้ครอบคลุมวิธีการแยกรูปภาพจาก DOC ใน Java

Java API เพื่อแยกรูปภาพออกจากไฟล์ DOC

Aspose.Words for Java เป็น API ที่ทรงประสิทธิภาพและมีคุณลักษณะมากมายสำหรับการสร้าง จัดการ และแปลงเอกสาร MS Word ดังนั้น เราจะใช้ API นี้เพื่อแยกรูปภาพจากเอกสาร DOC คุณสามารถ ดาวน์โหลด JAR ของ API หรือติดตั้งลงในแอปพลิเคชัน Java โดยใช้การกำหนดค่า Maven ต่อไปนี้

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

วิธีแยกรูปภาพจาก DOC ใน Java

รูปภาพในเอกสาร DOC แสดงโดยใช้วัตถุรูปร่าง ดังนั้นในการดึงรูปภาพ คุณจะต้องประมวลผลทุกรูปร่างในเอกสาร ต่อไปนี้เป็นขั้นตอนในการแยกรูปภาพจากไฟล์ DOC ใน Java

  • ก่อนอื่น ให้โหลดไฟล์ DOC โดยใช้คลาส Document
  • จากนั้น นำรูปร่างทั้งหมดไปไว้ใน NodeCollection วัตถุโดยใช้เมธอด Document.getChildNodes(NodeType.SHAPE, Boolean)
  • วนซ้ำรูปร่างที่ดึงออกมา
  • ในการวนซ้ำแต่ละครั้ง ให้ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่โดยใช้เมธอด Shape.hasImage()
  • สุดท้าย แยกรูปภาพและบันทึกโดยใช้เมธอด Shape.getImageData().save(string)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสาร DOC ในภาษาจาวา

// โหลดเอกสาร Word
Document doc = new Document("Document.docx");

// ได้ทุกรูปทรง
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// วนซ้ำคอลเลกชันรูปร่าง
for (Shape shape : shapes) {
  
    // ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่
    if (shape.hasImage()) {
      
        // แยกและบันทึกภาพ
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java DOC Image Extractor - รับใบอนุญาตฟรี

รับใบอนุญาตชั่วคราวฟรี เพื่อใช้ Aspose.Words for Java โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแยกรูปภาพจากเอกสาร DOC ในภาษา Java นอกจากนี้ ตัวอย่างโค้ดยังแสดงวิธีการแยกรูปภาพจากไฟล์ DOC และบันทึกลงในตำแหน่งที่ต้องการ นอกจากนี้ Aspose.Words for Java ยังมีคุณสมบัติที่หลากหลายสำหรับการจัดการเอกสาร หากต้องการสำรวจคุณลักษณะเหล่านั้น คุณสามารถไปที่ เอกสารประกอบ นอกจากนี้ คุณสามารถถามคำถามผ่าน ฟอรัม ของเรา

ดูสิ่งนี้ด้วย

ข้อมูล: คุณอาจสนใจ Java API อื่น (Aspose.Slides for Java) ที่ให้คุณแปลงงานนำเสนอ (เป็น PDF, เอกสารคำ ฯลฯ) และ นำเข้ารูปภาพ หรือเอกสารอื่นๆ ในงานนำเสนอ