
PDF فرمت فایلی است که معمولاً برای اشتراکگذاری و چاپ اسناد استفاده میشود. با این حال، در موارد خاص، فایلهای PDF به فرمت Word DOCX تبدیل میشوند تا متن را تجزیه کنند یا سند را قابل ویرایش کنند. برای چنین سناریوهایی، این مقاله نحوه تبدیل PDF به DOCX در پایتون را پوشش می دهد. علاوه بر این، شما یاد خواهید گرفت که چگونه گزینه های بارگذاری مختلف را برای کنترل بارگذاری فایل های PDF به صورت پویا مشخص کنید.
- مبدل پایتون PDF به DOCX
- تبدیل یک فایل PDF به DOCX در پایتون
- Python PDF to DOCX - گزینه های بارگذاری را مشخص کنید
مبدل پایتون PDF به DOCX - دانلود رایگان
برای تبدیل فایلهای PDF به فرمت DOCX، از Aspose.Words for Python استفاده میکنیم. این یک کتابخانه Python غنی برای ایجاد، دستکاری و تبدیل اسناد Word است. علاوه بر این، تبدیل به عقب و جلو اسناد Word و PDF را با وفاداری بالا فراهم می کند. Aspose.Words برای پایتون در PyPI میزبانی می شود و می توان آن را با استفاده از دستور pip زیر نصب کرد.
pip install aspose-words
تبدیل PDF به DOCX در پایتون
با استفاده از Aspose.Words برای پایتون، می توانید یک فایل PDF را در چند مرحله به DOCX تبدیل کنید. به سادگی فایل PDF را بارگیری کرده و آن را به عنوان یک سند DOCX ذخیره کنید. در زیر مراحل تبدیل PDF به DOCX در پایتون آمده است.
- فایل PDF را با استفاده از کلاس Document بارگیری کنید.
- با استفاده از روش ()Document.save فایل PDF را به عنوان سند DOCX ذخیره کنید.
نمونه کد زیر نحوه تبدیل یک فایل PDF به فرمت DOCX را نشان می دهد.
import aspose.words as aw
# فایل PDF را بارگذاری کنید
doc = aw.Document("PDF.pdf")
# تبدیل PDF به فرمت Word DOCX
doc.save("pdf-to-word.docx")
تبدیل Python PDF به DOCX - گزینه های بارگذاری را مشخص کنید
Aspose.Words برای Python همچنین به شما امکان می دهد بارگذاری اسناد PDF را مطابق با نیاز خود سفارشی کنید. به عنوان مثال، شما می توانید تنها محدوده ای از صفحات را در PDF بارگذاری کنید، تصاویر را رد کنید، رمز عبور را برای فایل های رمزگذاری شده مشخص کنید و غیره. برای تنظیم گزینه های بارگذاری، از کلاس PdfLoadOptions استفاده می شود. مراحل زیر برای تعیین گزینههای بارگذاری در تبدیل PDF به DOCX پایتون است.
- یک نمونه از کلاس PdfLoadOptions ایجاد کنید.
- فرمت بار را با استفاده از ویژگی PdfLoadOptions.loadformat مشخص کنید.
- گزینه هایی مانند skippdfimages، pageindex، pagecount و غیره را تنظیم کنید.
- از کلاس Document برای بارگذاری فایل PDF با عبور مسیر آن و PdfLoadOptions به عنوان پارامتر استفاده کنید.
- با استفاده از روش ()Document.save فایل PDF را به عنوان سند DOCX ذخیره کنید.
نمونه کد زیر نحوه تعیین گزینه های بارگذاری در تبدیل PDF به DOCX در پایتون را نشان می دهد.
import aspose.words as aw
# گزینه های بارگذاری PDF را ایجاد کنید
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# شاخص صفحه شروع و تعداد صفحات را تنظیم کنید
loadOptions.page_index = 0
loadOptions.page_count = 1
# رد شدن از تصاویر در PDF
loadOptions.skip_pdf_images = True
# برای تنظیم رمز عبور برای فایل های PDF رمزگذاری شده
#loadOptions.password = "12345"
# فایل PDF را بارگیری کنید
doc = aw.Document("PDF.pdf", loadOptions)
# تبدیل PDF به Word
doc.save("pdf-to-word.docx")
مبدل پایتون PDF به DOCX - مجوز رایگان دریافت کنید
برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، میتوانید یک مجوز موقت دریافت کنید.
نتیجه
در این مقاله با نحوه تبدیل فایل های PDF به DOCX در پایتون آشنا شدید. علاوه بر این، نحوه تعیین گزینه های بارگذاری مختلف برای فایل های PDF به صورت پویا را مشاهده کرده اید. Aspose.Words برای پایتون طیف گسترده ای از ویژگی های دیگر را ارائه می دهد که می توانید با استفاده از [اسناد] کاوش کنید. همچنین، می توانید سوالات خود را از طریق تالار گفتمان ما بپرسید.