המרת PDF ל-Word ב-Python

PDF הוא פורמט קובץ נפוץ לשיתוף והדפסת מסמכים. עם זאת, במקרים מסוימים, קובצי PDF מומרים לפורמט Word DOCX כדי לנתח את הטקסט או להפוך את המסמך לניתן לעריכה. עבור תרחישים כאלה, מאמר זה מכסה כיצד להמיר PDF ל-DOCX ב-Python. יתר על כן, תלמד כיצד לציין אפשרויות טעינה שונות כדי לשלוט בטעינת קבצי PDF באופן דינמי.

Python PDF ל-DOCX ממיר

על מנת להמיר קבצי PDF לפורמט DOCX, נשתמש ב-Aspose.Words for Python. זוהי ספריית Python עשירה בתכונות ליצירה, מניפולציה והמרת מסמכי Word. יתר על כן, הוא מספק המרה הלוך ושוב של מסמכי Word ו-PDF בנאמנות גבוהה. Aspose.Words for Python מתארח ב-PyPI וניתן להתקין אותו באמצעות הפקודה pip הבאה.

pip install aspose-words

כיצד להמיר PDF ל-DOCX ב-Python

באמצעות Aspose.Words עבור Python, אתה יכול להמיר קובץ PDF ל-DOCX תוך כמה שלבים. כל שעליך לעשות הוא לטעון את קובץ ה-PDF ולשמור אותו כמסמך DOCX. להלן השלבים להמרת PDF ל-DOCX ב-Python.

  • טען את קובץ ה-PDF באמצעות Document class.
  • שמור קובץ PDF כמסמך DOCX באמצעות שיטת Document.save().

דוגמת הקוד הבאה מראה כיצד להמיר קובץ PDF לפורמט DOCX.

import aspose.words as aw

# טען את קובץ ה-PDF
doc = aw.Document("PDF.pdf")

# המרת PDF לפורמט וורד DOCX
doc.save("pdf-to-word.docx")

שמור PDF כ-DOCX ב-Python - אפשרויות טעינה

Aspose.Words עבור Python גם מאפשר לך להתאים אישית את טעינת מסמכי PDF לפי הדרישות שלך. לדוגמה, אתה יכול לטעון רק מגוון דפים ב-PDF, לדלג על תמונות, לציין סיסמא לקבצים מוצפנים וכו’. כדי להגדיר את אפשרויות הטעינה, נעשה שימוש במחלקה PdfLoadOptions. להלן השלבים לציון אפשרויות טעינה בהמרת Python PDF ל-DOCX.

  • צור מופע של המחלקה PdfLoadOptions.
  • ציין פורמט טעינה באמצעות המאפיין PdfLoadOptions.loadformat.
  • הגדר אפשרויות כגון skippdfimages, pageindex, pagecount וכו'.
  • השתמש במחלקת Document כדי לטעון את קובץ ה-PDF על ידי העברת הנתיב שלו ו-PdfLoadOptions כפרמטרים.
  • שמור קובץ PDF כמסמך DOCX באמצעות שיטת Document.save().

דוגמת הקוד הבאה מראה כיצד לציין אפשרויות טעינה בהמרת PDF ל-DOCX ב-Python.

import aspose.words as aw

# ליצור אפשרויות טעינת PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# הגדר אינדקס של עמוד הפתיחה וספירת עמודים
loadOptions.page_index = 0
loadOptions.page_count = 1

# דלג על תמונות ב-PDF
loadOptions.skip_pdf_images = True

# כדי להגדיר סיסמה עבור קבצי PDF מוצפנים
#loadOptions.password = "12345" 

# טען קובץ PDF
doc = aw.Document("PDF.pdf", loadOptions)

# המרת PDF ל-Word
doc.save("pdf-to-word.docx")

ממיר Python PDF ל-DOCX בחינם

אתה יכול לקבל רישיון זמני בחינם להמרת קבצי PDF ל-DOCX ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד להמיר קבצי PDF ל-DOCX ב-Python. יתר על כן, ראית כיצד לציין אפשרויות טעינה שונות עבור קבצי PDF באופן דינמי. Aspose.Words for Python מספק מגוון רחב של תכונות אחרות שתוכלו לחקור באמצעות תיעוד. כמו כן, אתה יכול לשאול את השאלות שלך דרך הפורום שלנו.

ראה גם