تبدیل PDF به Word در پایتون

PDF فرمت فایلی است که معمولاً برای اشتراک‌گذاری و چاپ اسناد استفاده می‌شود. با این حال، در موارد خاص، فایل‌های PDF به فرمت Word DOCX تبدیل می‌شوند تا متن را تجزیه کنند یا سند را قابل ویرایش کنند. برای چنین سناریوهایی، این مقاله نحوه تبدیل PDF به DOCX در پایتون را پوشش می دهد. علاوه بر این، شما یاد خواهید گرفت که چگونه گزینه های بارگذاری مختلف را برای کنترل بارگذاری فایل های PDF به صورت پویا مشخص کنید.

مبدل پایتون PDF به DOCX - دانلود رایگان

برای تبدیل فایل‌های PDF به فرمت DOCX، از Aspose.Words for Python استفاده می‌کنیم. این یک کتابخانه Python غنی برای ایجاد، دستکاری و تبدیل اسناد Word است. علاوه بر این، تبدیل به عقب و جلو اسناد Word و PDF را با وفاداری بالا فراهم می کند. Aspose.Words برای پایتون در PyPI میزبانی می شود و می توان آن را با استفاده از دستور pip زیر نصب کرد.

pip install aspose-words

تبدیل PDF به DOCX در پایتون

با استفاده از Aspose.Words برای پایتون، می توانید یک فایل PDF را در چند مرحله به DOCX تبدیل کنید. به سادگی فایل PDF را بارگیری کرده و آن را به عنوان یک سند DOCX ذخیره کنید. در زیر مراحل تبدیل PDF به DOCX در پایتون آمده است.

  • فایل PDF را با استفاده از کلاس Document بارگیری کنید.
  • با استفاده از روش ()Document.save فایل PDF را به عنوان سند DOCX ذخیره کنید.

نمونه کد زیر نحوه تبدیل یک فایل PDF به فرمت DOCX را نشان می دهد.

import aspose.words as aw

# فایل PDF را بارگذاری کنید
doc = aw.Document("PDF.pdf")

# تبدیل PDF به فرمت Word DOCX
doc.save("pdf-to-word.docx")

تبدیل Python PDF به DOCX - گزینه های بارگذاری را مشخص کنید

Aspose.Words برای Python همچنین به شما امکان می دهد بارگذاری اسناد PDF را مطابق با نیاز خود سفارشی کنید. به عنوان مثال، شما می توانید تنها محدوده ای از صفحات را در PDF بارگذاری کنید، تصاویر را رد کنید، رمز عبور را برای فایل های رمزگذاری شده مشخص کنید و غیره. برای تنظیم گزینه های بارگذاری، از کلاس PdfLoadOptions استفاده می شود. مراحل زیر برای تعیین گزینه‌های بارگذاری در تبدیل PDF به DOCX پایتون است.

  • یک نمونه از کلاس PdfLoadOptions ایجاد کنید.
  • فرمت بار را با استفاده از ویژگی PdfLoadOptions.loadformat مشخص کنید.
  • گزینه هایی مانند skippdfimages، pageindex، pagecount و غیره را تنظیم کنید.
  • از کلاس Document برای بارگذاری فایل PDF با عبور مسیر آن و PdfLoadOptions به عنوان پارامتر استفاده کنید.
  • با استفاده از روش ()Document.save فایل PDF را به عنوان سند DOCX ذخیره کنید.

نمونه کد زیر نحوه تعیین گزینه های بارگذاری در تبدیل PDF به DOCX در پایتون را نشان می دهد.

import aspose.words as aw

# گزینه های بارگذاری PDF را ایجاد کنید
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# شاخص صفحه شروع و تعداد صفحات را تنظیم کنید
loadOptions.page_index = 0
loadOptions.page_count = 1

# رد شدن از تصاویر در PDF
loadOptions.skip_pdf_images = True

# برای تنظیم رمز عبور برای فایل های PDF رمزگذاری شده
#loadOptions.password = "12345" 

# فایل PDF را بارگیری کنید
doc = aw.Document("PDF.pdf", loadOptions)

# تبدیل PDF به Word
doc.save("pdf-to-word.docx")

مبدل پایتون PDF به DOCX - مجوز رایگان دریافت کنید

برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می‌توانید یک مجوز موقت دریافت کنید.

نتیجه

در این مقاله با نحوه تبدیل فایل های PDF به DOCX در پایتون آشنا شدید. علاوه بر این، نحوه تعیین گزینه های بارگذاری مختلف برای فایل های PDF به صورت پویا را مشاهده کرده اید. Aspose.Words برای پایتون طیف گسترده ای از ویژگی های دیگر را ارائه می دهد که می توانید با استفاده از [اسناد] کاوش کنید. همچنین، می توانید سوالات خود را از طریق تالار گفتمان ما بپرسید.

همچنین ببینید