แปลง PDF เป็น Word ใน Python

PDF เป็นรูปแบบไฟล์ที่ใช้กันทั่วไปสำหรับการแบ่งปันและการพิมพ์เอกสาร อย่างไรก็ตาม ในบางกรณี ไฟล์ PDF จะถูกแปลงเป็นรูปแบบ Word DOCX หรือ DOC เพื่อแยกวิเคราะห์ข้อความหรือทำให้เอกสารสามารถแก้ไขได้ สำหรับสถานการณ์ดังกล่าว บทความนี้ครอบคลุมวิธีการแปลงรูปแบบ PDF เป็น Word ใน Python นอกจากนี้ คุณจะได้เรียนรู้วิธีระบุตัวเลือกการโหลดต่างๆ เพื่อควบคุมการแปลง PDF เป็น Word

Python PDF เป็น Word Converter - ดาวน์โหลดฟรี

ในการแปลงไฟล์ PDF เป็นรูปแบบ Word เราจะใช้ Aspose.Words for Python เป็นไลบรารี Python ที่มีฟีเจอร์มากมายสำหรับสร้าง จัดการ และแปลงเอกสาร Word นอกจากนี้ยังให้การแปลงเอกสาร Word และ PDF กลับไปกลับมาด้วยความเที่ยงตรงสูง Aspose.Words for Python โฮสต์บน PyPI และสามารถติดตั้งได้โดยใช้คำสั่ง pip ต่อไปนี้

pip install aspose-words

ขั้นตอนง่ายๆ ในการแปลง PDF เป็น Word ใน Python

เมื่อใช้ Aspose.Words for Python คุณสามารถแปลงไฟล์ PDF เป็นรูปแบบ Word ได้ภายในไม่กี่ขั้นตอน เพียงโหลดไฟล์ PDF และบันทึกเป็นเอกสาร Word ขั้นตอนต่อไปนี้สาธิตวิธีบันทึก PDF ในเอกสาร Word ใน Python

  • โหลดเอกสาร PDF จากดิสก์
  • บันทึกเอกสาร Word เป็น PDF ไปยังตำแหน่งที่ต้องการ

และนั่นแหล่ะ ส่วนต่อไปนี้จะสาธิตวิธีแปลงขั้นตอนเหล่านี้เป็นโค้ด Python เพื่อแปลง PDF เป็นรูปแบบ Word

บันทึก PDF เป็นรูปแบบ Word ใน Python

ต่อไปนี้เป็นขั้นตอนในการบันทึกไฟล์ PDF เป็นรูปแบบ Word ใน Python

  • โหลดไฟล์ PDF โดยใช้คลาส Document
  • บันทึกไฟล์ PDF เป็นเอกสาร Word โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ PDF เป็นรูปแบบ Word

import aspose.words as aw

# โหลดไฟล์ PDF
doc = aw.Document("PDF.pdf")

# แปลง PDF เป็นรูปแบบ Word DOCX
doc.save("pdf-to-word.docx")

Python แปลง PDF เป็น Word ด้วยตัวเลือกการโหลด

Aspose.Words for Python ยังให้คุณปรับแต่งการโหลดเอกสาร PDF ตามความต้องการของคุณ ตัวอย่างเช่น คุณสามารถโหลดเฉพาะช่วงของหน้าใน PDF, ข้ามภาพ, ระบุรหัสผ่านสำหรับไฟล์ที่เข้ารหัส ฯลฯ ในการตั้งค่าตัวเลือกการโหลด จะใช้คลาส PdfLoadOptions ต่อไปนี้เป็นขั้นตอนในการระบุตัวเลือกการโหลดในการแปลง PDF เป็น Word

  • สร้างอินสแตนซ์ของคลาส PdfLoadOptions
  • ระบุรูปแบบการโหลดโดยใช้คุณสมบัติ PdfLoadOptions.loadformat
  • ตั้งค่าตัวเลือกต่างๆ เช่น skippdfimages, pageindex, pagecount เป็นต้น
  • ใช้คลาส Document เพื่อโหลดไฟล์ PDF โดยส่งพาธและ PdfLoadOptions เป็นพารามิเตอร์
  • บันทึกไฟล์ PDF เป็นเอกสาร Word โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีระบุตัวเลือกการโหลดในการแปลง PDF เป็น Word ใน Python

import aspose.words as aw

# สร้างตัวเลือกการโหลด PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# กำหนดดัชนีของหน้าเริ่มต้นและจำนวนหน้า
loadOptions.page_index = 0
loadOptions.page_count = 1

# ข้ามรูปภาพเป็น PDF
loadOptions.skip_pdf_images = True

# เพื่อตั้งรหัสผ่านสำหรับไฟล์ PDF ที่เข้ารหัส
#loadOptions.password = "12345" 

# โหลดไฟล์ PDF
doc = aw.Document("PDF.pdf", loadOptions)

# แปลง PDF เป็น Word
doc.save("pdf-to-word.docx")

Python PDF เป็น Word Library - รับใบอนุญาตฟรี

คุณสามารถ รับใบอนุญาตชั่วคราว เพื่อใช้ Aspose.Words for Python ได้โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF เป็นรูปแบบ Word ใน Python นอกจากนี้ คุณได้เห็นวิธีระบุตัวเลือกการโหลดที่แตกต่างกันสำหรับไฟล์ PDF แบบไดนามิก Aspose.Words for Python มีคุณสมบัติอื่นๆ มากมายที่คุณสามารถสำรวจได้โดยใช้ เอกสารประกอบ นอกจากนี้ คุณสามารถถามคำถามของคุณผ่าน ฟอรัม ของเรา

ดูสิ่งนี้ด้วย

แปลงไฟล์ Word เป็น PDF โดยใช้ Pythonสร้างเอกสาร Word ใน Python โดยไม่ต้องใช้ MS OfficePNG เป็น Word ใน C# .NET
JPG เป็น Word ใน C# .NETรูปภาพเป็น Word ใน C#Word เป็น HTML ใน C#
Word DOCX เป็น Markdown ใน Javaแยกรูปภาพออกจาก Word DOC ใน JavaWord DOC เป็น Markdown ใน Java
Word DOC DOCX เป็น Markdown ใน C#แยกข้อความจากเอกสาร Word ในภาษา Javaผสานเอกสาร MS Word โดยใช้ C# .NET
Word DOC เป็น PNG, JPEG, BMP, GIF หรือ TIFF ใน C#Word DOC เป็น PNG, JPEG, BMP, GIF หรือ TIFF ใน Javaแปลงเอกสาร Word เป็น EPUB ใน C#
แปลงเอกสาร Word เป็น EPUB ในภาษา Javaแปลงเอกสาร Word เป็น EPUB ใน Pythonแปลง RTF เป็น PDF โดยใช้ Python
แปลงไฟล์ TXT เป็น PDF ใน C#แปลงไฟล์ TXT เป็น PDF ใน Javaแปลงไฟล์ TXT เป็น PDF ใน Python