แปลง PDF เป็น Word ใน Python

PDF เป็นรูปแบบไฟล์ที่ใช้กันทั่วไปสำหรับการแบ่งปันและการพิมพ์เอกสาร อย่างไรก็ตาม ในบางกรณี ไฟล์ PDF จะถูกแปลงเป็นรูปแบบ Word DOCX เพื่อแยกวิเคราะห์ข้อความหรือทำให้สามารถแก้ไขเอกสารได้ สำหรับสถานการณ์ดังกล่าว บทความนี้ครอบคลุมวิธีการแปลง PDF เป็น DOCX ใน Python นอกจากนี้ คุณจะได้เรียนรู้วิธีระบุตัวเลือกการโหลดต่างๆ เพื่อควบคุมการโหลดไฟล์ PDF แบบไดนามิก

Python PDF เป็น DOCX Converter - ดาวน์โหลดฟรี

ในการแปลงไฟล์ PDF เป็นรูปแบบ DOCX เราจะใช้ Aspose.Words for Python เป็นไลบรารี Python ที่มีฟีเจอร์มากมายสำหรับสร้าง จัดการ และแปลงเอกสาร Word นอกจากนี้ยังให้การแปลงเอกสาร Word และ PDF กลับไปกลับมาด้วยความเที่ยงตรงสูง Aspose.Words for Python โฮสต์บน PyPI และสามารถติดตั้งได้โดยใช้คำสั่ง pip ต่อไปนี้

pip install aspose-words

แปลง PDF เป็น DOCX ใน Python

เมื่อใช้ Aspose.Words for Python คุณสามารถแปลงไฟล์ PDF เป็น DOCX ได้ภายในไม่กี่ขั้นตอน เพียงโหลดไฟล์ PDF และบันทึกเป็นเอกสาร DOCX ต่อไปนี้เป็นขั้นตอนในการแปลง PDF เป็น DOCX ใน Python

  • โหลดไฟล์ PDF โดยใช้คลาส Document
  • บันทึกไฟล์ PDF เป็นเอกสาร DOCX โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ PDF เป็นรูปแบบ DOCX

import aspose.words as aw

# โหลดไฟล์ PDF
doc = aw.Document("PDF.pdf")

# แปลง PDF เป็นรูปแบบ Word DOCX
doc.save("pdf-to-word.docx")

การแปลง Python PDF เป็น DOCX - ระบุตัวเลือกการโหลด

Aspose.Words for Python ยังให้คุณปรับแต่งการโหลดเอกสาร PDF ตามความต้องการของคุณ ตัวอย่างเช่น คุณสามารถโหลดเฉพาะช่วงของหน้าใน PDF, ข้ามภาพ, ระบุรหัสผ่านสำหรับไฟล์ที่เข้ารหัส ฯลฯ ในการตั้งค่าตัวเลือกการโหลด จะใช้คลาส PdfLoadOptions ต่อไปนี้เป็นขั้นตอนในการระบุตัวเลือกการโหลดในการแปลง Python PDF เป็น DOCX

  • สร้างอินสแตนซ์ของคลาส PdfLoadOptions
  • ระบุรูปแบบการโหลดโดยใช้คุณสมบัติ PdfLoadOptions.loadformat
  • ตั้งค่าตัวเลือกต่างๆ เช่น skippdfimages, pageindex, pagecount เป็นต้น
  • ใช้คลาส Document เพื่อโหลดไฟล์ PDF โดยส่งพาธและ PdfLoadOptions เป็นพารามิเตอร์
  • บันทึกไฟล์ PDF เป็นเอกสาร DOCX โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีระบุตัวเลือกการโหลดในการแปลง PDF เป็น DOCX ใน Python

import aspose.words as aw

# สร้างตัวเลือกการโหลด PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# กำหนดดัชนีของหน้าเริ่มต้นและจำนวนหน้า
loadOptions.page_index = 0
loadOptions.page_count = 1

# ข้ามรูปภาพเป็น PDF
loadOptions.skip_pdf_images = True

# เพื่อตั้งรหัสผ่านสำหรับไฟล์ PDF ที่เข้ารหัส
#loadOptions.password = "12345" 

# โหลดไฟล์ PDF
doc = aw.Document("PDF.pdf", loadOptions)

# แปลง PDF เป็น Word
doc.save("pdf-to-word.docx")

Python PDF เป็น DOCX Converter - รับใบอนุญาตฟรี

คุณสามารถ รับใบอนุญาตชั่วคราว เพื่อใช้ Aspose.Words for Python ได้โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF เป็น DOCX ใน Python นอกจากนี้ คุณได้เห็นวิธีระบุตัวเลือกการโหลดที่แตกต่างกันสำหรับไฟล์ PDF แบบไดนามิก Aspose.Words for Python มีคุณสมบัติอื่นๆ มากมายที่คุณสามารถสำรวจได้โดยใช้ เอกสารประกอบ นอกจากนี้ คุณสามารถถามคำถามของคุณผ่าน ฟอรัม ของเรา

ดูสิ่งนี้ด้วย