
PDF เป็นหนึ่งในรูปแบบที่ใช้บ่อยที่สุดในการส่งเอกสารไปยังบุคคลที่สาม เหตุผลที่อยู่เบื้องหลังความนิยมนี้คือความเข้ากันได้ของ PDF ในหลายแพลตฟอร์มโดยไม่คำนึงถึงข้อกำหนดของฮาร์ดแวร์/ซอฟต์แวร์ อย่างไรก็ตาม ในบางกรณี คุณต้องการแปลงเอกสาร PDF เป็นรูปแบบเอกสารที่สามารถแก้ไขได้ รูปแบบ PDF เป็น DOC หรือ DOCX อาจเป็นตัวเลือกการแปลงลำดับความสำคัญในกรณีดังกล่าว เพื่อให้กระบวนการแปลงเป็นไปโดยอัตโนมัติ บทความนี้แสดงวิธีแปลง PDF เป็น Word DOC และ DOCX โดยทางโปรแกรมใน Java
ดังนั้นในบทความนี้ คุณจะได้รู้วิธีการ:
- แปลง PDF เป็น DOC โดยใช้ Java
- แปลง PDF เป็นรูปแบบ DOCX โดยใช้ Java
- ปรับแต่งการแปลง PDF เป็น Word (DOC/DOCX)
Java PDF เป็น Word DOC Converter Library
ขอบคุณ Aspose.PDF สำหรับ Java - การจัดการ PDF ของ Java API ที่มีวิธีง่ายๆ ในการแปลงไฟล์ PDF เป็นรูปแบบอื่นๆ ที่หลากหลาย รวมถึง PDF เป็น DOC และ PDF เป็น DOCX คุณสามารถ ดาวน์โหลด และเพิ่มไฟล์ JAR ของ API ในโครงการของคุณหรืออ้างอิงโดยใช้การกำหนดค่า Maven ต่อไปนี้:
พื้นที่เก็บข้อมูล:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
การพึ่งพา:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>19.12</version>
</dependency>
แปลง PDF เป็น DOC ใน Java
เมื่อคุณอ้างอิง Aspose.PDF สำหรับ Java ในแอปพลิเคชันของคุณแล้ว คุณสามารถแปลงเอกสาร PDF เป็นรูปแบบ DOC โดยใช้โค้ดสองสามบรรทัด ต่อไปนี้เป็นขั้นตอนที่จำเป็นในการดำเนินการแปลงนี้
- สร้างอินสแตนซ์ของคลาส Document และเริ่มต้นด้วยเส้นทางของไฟล์ PDF ที่ป้อนเข้า
- เรียกใช้เมธอด Document.save() ด้วยชื่อไฟล์ DOC เอาต์พุตและอาร์กิวเมนต์ SaveFormat.Doc
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลง PDF เป็น DOC ใน Java
// โหลดไฟล์ PDF ต้นทาง
Document doc = new Document("input.pdf");
// บันทึกไฟล์ DOC ที่เป็นผลลัพธ์
doc.save("output.doc", SaveFormat.Doc);
ป้อนเอกสาร PDF

เอกสาร Word ออก

แปลง PDF เป็น DOCX ใน Java
DOCX เป็นรูปแบบที่รู้จักกันดีสำหรับเอกสาร Word และตรงกันข้ามกับรูปแบบ DOC โครงสร้างของ DOCX ขึ้นอยู่กับไบนารีเช่นเดียวกับไฟล์ XML ในกรณีที่คุณต้องการแปลง PDF เป็นรูปแบบ DOCX คุณสามารถบอก API ให้ทำได้โดยใช้อาร์กิวเมนต์ SaveFormat.DocX ในเมธอด Document.save()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลง PDF เป็น DOCX ใน Java
// โหลดไฟล์ PDF ต้นทาง
Document doc = new Document("input.pdf");
// บันทึกไฟล์ DOCX ที่เป็นผลลัพธ์
doc.save("output.docx", SaveFormat.DocX);
Java PDF เป็น Word พร้อมตัวเลือกเพิ่มเติม
Aspose.PDF สำหรับ Java ยังมีตัวเลือกเพิ่มเติมบางอย่างที่คุณสามารถใช้ในการแปลง PDF เป็น Word เช่น รูปแบบเอาต์พุต ความละเอียดของภาพ ระยะห่างระหว่างบรรทัดข้อความ และอื่นๆ คลาส DocSaveOptions ใช้เพื่อวัตถุประสงค์นี้ และต่อไปนี้คือรายการตัวเลือกที่คุณสามารถใช้ได้:
- setFormat (ค่า int) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd (ค่าบูลีน) - To add the paragraph or line breaks.
- setImageResolutionX (ค่า int) - To set the X resolution for the images.
- setImageResolutionY (ค่า int) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines (ค่าทศนิยม) - To group text lines into paragraphs.
- setMode (ค่า int) - To set recognition mode.
- setRecognizeBullets (ค่าบูลีน) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity (ค่าทศนิยม) - To set the width of space between different text elements in the input PDF file.
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีใช้คลาส DocSaveOptions ในการแปลง PDF เป็น DOCX โดยใช้ Java
// โหลดไฟล์ PDF ต้นทาง
Document doc = new Document("input.pdf");
// สร้างอินสแตนซ์ของอินสแตนซ์ DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// กำหนดรูปแบบเอาต์พุต
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// ตั้งค่าโหมดการรับรู้เป็นโฟลว์
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// ตั้งค่าความใกล้เคียงแนวนอนเป็น 2.5
saveOptions.setRelativeHorizontalProximity(2.5f);
// เปิดใช้งานการจดจำสัญลักษณ์แสดงหัวข้อย่อยในระหว่างกระบวนการแปลง
saveOptions.setRecognizeBullets(true);
// บันทึกไฟล์ DOCX ที่เป็นผลลัพธ์
doc.save("resultant.docx", saveOptions);
บทสรุป
ในบทความนี้ คุณได้เรียนรู้ว่าการแปลงเอกสาร PDF เป็น Word DOC และ DOCX ใน Java นั้นง่ายเพียงใด คุณสามารถแปลง PDF เป็น DOC หรือ PDF เป็น DOCX ได้ตามความต้องการของคุณ นอกจากนี้ยังมีการกล่าวถึงคุณสมบัติเพิ่มเติมในการปรับแต่งการแปลง PDF เป็น Word DOC/DOCX คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับการแปลง PDF เป็นรูปแบบอื่นได้จาก เอกสารประกอบ