המרת PDF ל-Word ב-Python

PDF הוא פורמט קובץ נפוץ לשיתוף והדפסת מסמכים. עם זאת, במקרים מסוימים, קובצי PDF מומרים לפורמט Word DOCX או DOC כדי לנתח את הטקסט או להפוך את המסמך לניתן לעריכה. עבור תרחישים כאלה, מאמר זה מכסה כיצד להמיר PDF לפורמט Word ב- Python. יתר על כן, תלמד כיצד לציין אפשרויות טעינה שונות כדי לשלוט בהמרת PDF ל-Word.

Python PDF to Word Converter

כדי להמיר קבצי PDF לפורמט וורד, נשתמש ב-Aspose.Words for Python. זוהי ספריית Python עשירה בתכונות ליצירה, מניפולציה והמרת מסמכי Word. יתר על כן, הוא מספק המרה הלוך ושוב של מסמכי Word ו-PDF בנאמנות גבוהה. Aspose.Words for Python מתארח ב-PyPI וניתן להתקין אותו באמצעות הפקודה pip הבאה.

pip install aspose-words

כיצד להמיר PDF ל- Word ב- Python

באמצעות Aspose.Words עבור Python, אתה יכול להמיר קובץ PDF לפורמט Word תוך כמה שלבים. כל שעליך לעשות הוא לטעון את קובץ ה-PDF ולשמור אותו כמסמך Word. השלבים הבאים מדגימים כיצד לשמור מסמך PDF במסמך Word ב- Python.

  • טען את מסמך ה-PDF מהדיסק.
  • שמור מסמך Word כ-PDF למיקום הרצוי.

וזה הכל. הסעיפים הבאים מדגימים כיצד להפוך את השלבים הללו לקוד Python כדי להמיר PDF לפורמט Word.

שמור PDF כ- Word DOC ב- Python

להלן השלבים לשמירת קובץ PDF בפורמט Word ב- Python.

  • טען את קובץ ה-PDF באמצעות Document class.
  • שמור קובץ PDF כמסמך Word באמצעות שיטת Document.save().

דוגמת הקוד הבאה מראה כיצד להמיר קובץ PDF לפורמט וורד.

import aspose.words as aw

# טען את קובץ ה-PDF
doc = aw.Document("PDF.pdf")

# המרת PDF לפורמט וורד DOCX
doc.save("pdf-to-word.docx")

Python ייצוא PDF ל-Word - אפשרויות טעינה

Aspose.Words עבור Python גם מאפשר לך להתאים אישית את טעינת מסמכי PDF לפי הדרישות שלך. לדוגמה, ניתן לטעון רק מגוון דפים ב-PDF, לדלג על תמונות, לציין סיסמה לקבצים מוצפנים וכו’. כדי להגדיר את אפשרויות הטעינה, נעשה שימוש במחלקת PdfLoadOptions. להלן השלבים לציון אפשרויות טעינה בהמרת PDF ל-Word.

  • צור מופע של המחלקה PdfLoadOptions.
  • ציין פורמט טעינה באמצעות המאפיין PdfLoadOptions.loadformat.
  • הגדר אפשרויות כגון skippdfimages, pageindex, pagecount וכו'.
  • השתמש במחלקת Document כדי לטעון את קובץ ה-PDF על ידי העברת הנתיב שלו ו-PdfLoadOptions כפרמטרים.
  • שמור קובץ PDF כמסמך Word באמצעות שיטת Document.save().

דוגמת הקוד הבאה מראה כיצד לציין אפשרויות טעינה בהמרת PDF ל-Word ב-Python.

import aspose.words as aw

# ליצור אפשרויות טעינת PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# הגדר אינדקס של עמוד הפתיחה וספירת עמודים
loadOptions.page_index = 0
loadOptions.page_count = 1

# דלג על תמונות ב-PDF
loadOptions.skip_pdf_images = True

# כדי להגדיר סיסמה עבור קבצי PDF מוצפנים
#loadOptions.password = "12345" 

# טען קובץ PDF
doc = aw.Document("PDF.pdf", loadOptions)

# המרת PDF ל-Word
doc.save("pdf-to-word.docx")

ממיר Python PDF ל-Word בחינם

אתה יכול לקבל רישיון זמני בחינם להמרת קבצי PDF לפורמט וורד ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד להמיר קבצי PDF לפורמט וורד ב-Python. יתר על כן, ראית כיצד לציין אפשרויות טעינה שונות עבור קבצי PDF באופן דינמי. Aspose.Words for Python מספק מגוון רחב של תכונות אחרות שתוכלו לחקור באמצעות תיעוד. כמו כן, אתה יכול לשאול את השאלות שלך דרך הפורום שלנו.

ראה גם

המר קבצי Word ל-PDF באמצעות Pythonצור מסמכי Word ב-Python ללא MS OfficePNG ל-Word ב-C# .NET
JPG ל-Word ב-C# .NETתמונה ל-Word ב-C#מילה ל-HTML ב-C#
Word DOCX ל-Markdown ב-Javaחלץ תמונות מ-Word DOC ב-JavaWord DOC ל-Markdown ב-Java
Word DOC DOCX ל-Markdown ב-C#חלץ טקסט ממסמכי Word ב-Javaמזג מסמכי MS Word באמצעות C# .NET
Word DOC ל-PNG, JPEG, BMP, GIF או TIFF ב-C#Word DOC ל-PNG, JPEG, BMP, GIF או TIFF ב-Javaהמר מסמך Word ל-EPUB ב-C#
המר מסמך Word ל-EPUB ב-Javaהמר מסמך Word ל-EPUB ב-Pythonהמר RTF ל-PDF באמצעות Python
המר קבצי TXT ל-PDF ב-C#המר קבצי TXT ל-PDF ב-Javaהמר קבצי TXT ל-PDF ב-Python