تبدیل PDF به Word در پایتون

PDF فرمت فایلی است که معمولاً برای اشتراک‌گذاری و چاپ اسناد استفاده می‌شود. با این حال، در موارد خاص، فایل‌های PDF به فرمت Word DOCX یا DOC تبدیل می‌شوند تا متن را تجزیه کنند یا سند را قابل ویرایش کنند. برای چنین سناریوهایی، این مقاله نحوه تبدیل PDF به فرمت Word در پایتون را پوشش می دهد. علاوه بر این، یاد خواهید گرفت که چگونه گزینه های بارگذاری مختلف را برای کنترل تبدیل PDF به Word مشخص کنید.

مبدل PDF به ورد پایتون - دانلود رایگان

برای تبدیل فایل‌های PDF به فرمت Word، از Aspose.Words for Python استفاده می‌کنیم. این یک کتابخانه Python غنی برای ایجاد، دستکاری و تبدیل اسناد Word است. علاوه بر این، تبدیل به عقب و جلو اسناد Word و PDF را با وفاداری بالا فراهم می کند. Aspose.Words برای پایتون در PyPI میزبانی می شود و می توان آن را با استفاده از دستور pip زیر نصب کرد.

pip install aspose-words

مراحل آسان برای تبدیل PDF به Word در پایتون

با استفاده از Aspose.Words برای پایتون، می توانید یک فایل PDF را در چند مرحله به فرمت Word تبدیل کنید. به سادگی فایل PDF را بارگیری کرده و آن را به عنوان یک سند Word ذخیره کنید. مراحل زیر نحوه ذخیره PDF در سند Word در پایتون را نشان می دهد.

  • سند PDF را از دیسک بارگیری کنید.
  • سند Word را به صورت PDF در محل مورد نظر ذخیره کنید.

و بس. بخش های زیر نحوه تبدیل این مراحل را به کد پایتون برای تبدیل PDF به فرمت Word نشان می دهد.

PDF را به صورت ورد در پایتون ذخیره کنید

در زیر مراحل ذخیره یک فایل PDF به صورت ورد در پایتون آمده است.

  • فایل PDF را با استفاده از کلاس Document بارگیری کنید.
  • با استفاده از روش ()Document.save فایل PDF را به عنوان سند Word ذخیره کنید.

نمونه کد زیر نحوه تبدیل فایل PDF به فرمت Word را نشان می دهد.

import aspose.words as aw

# فایل PDF را بارگذاری کنید
doc = aw.Document("PDF.pdf")

# تبدیل PDF به فرمت Word DOCX
doc.save("pdf-to-word.docx")

Python تبدیل PDF به Word با گزینه های بارگذاری

Aspose.Words برای Python همچنین به شما امکان می دهد بارگذاری اسناد PDF را مطابق با نیاز خود سفارشی کنید. به عنوان مثال، شما می توانید تنها محدوده ای از صفحات را در PDF بارگذاری کنید، تصاویر را رد کنید، رمز عبور را برای فایل های رمزگذاری شده مشخص کنید و غیره. برای تنظیم گزینه های بارگذاری، از کلاس PdfLoadOptions استفاده می شود. مراحل زیر برای تعیین گزینه های بارگذاری در تبدیل PDF به Word است.

  • یک نمونه از کلاس PdfLoadOptions ایجاد کنید.
  • فرمت بار را با استفاده از ویژگی PdfLoadOptions.loadformat مشخص کنید.
  • گزینه هایی مانند skippdfimages، pageindex، pagecount و غیره را تنظیم کنید.
  • از کلاس Document برای بارگذاری فایل PDF با عبور مسیر آن و PdfLoadOptions به عنوان پارامتر استفاده کنید.
  • با استفاده از روش ()Document.save فایل PDF را به عنوان سند Word ذخیره کنید.

نمونه کد زیر نحوه تعیین گزینه های بارگذاری در تبدیل PDF به Word در پایتون را نشان می دهد.

import aspose.words as aw

# گزینه های بارگذاری PDF را ایجاد کنید
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# شاخص صفحه شروع و تعداد صفحات را تنظیم کنید
loadOptions.page_index = 0
loadOptions.page_count = 1

# رد شدن از تصاویر در PDF
loadOptions.skip_pdf_images = True

# برای تنظیم رمز عبور برای فایل های PDF رمزگذاری شده
#loadOptions.password = "12345" 

# فایل PDF را بارگیری کنید
doc = aw.Document("PDF.pdf", loadOptions)

# تبدیل PDF به Word
doc.save("pdf-to-word.docx")

Python PDF to Word Library - مجوز رایگان دریافت کنید

برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می توانید یک مجوز موقت دریافت کنید.

نتیجه

در این مقاله با نحوه تبدیل فایل های PDF به فرمت ورد در پایتون آشنا شدید. علاوه بر این، نحوه تعیین گزینه های بارگذاری مختلف برای فایل های PDF به صورت پویا را مشاهده کرده اید. Aspose.Words برای پایتون طیف گسترده ای از ویژگی های دیگر را ارائه می دهد که می توانید با استفاده از [اسناد] کاوش کنید. همچنین، می توانید سوالات خود را از طریق تالار گفتمان ما بپرسید.

همچنین ببینید

تبدیل فایل های Word به PDF با استفاده از پایتونایجاد اسناد ورد در پایتون بدون MS OfficePNG به Word در C#.NET
JPG به Word در C#.NETتصویر به ورد در سی شارپورد به HTML در سی شارپ
Word DOCX به Markdown در جاواExtract Images from Word DOC in JavaWord DOC به Markdown در جاوا
Word DOC DOCX به Markdown در سی شارپExtract Text from Word Documents in Javaادغام اسناد MS Word با استفاده از C#.NET
Word DOC به PNG، JPEG، BMP، GIF، یا TIFF در C#Word DOC به PNG، JPEG، BMP، GIF، یا TIFF در جاواتبدیل یک سند Word به EPUB در سی شارپ
تبدیل یک سند Word به EPUB در جاواتبدیل یک سند Word به EPUB در پایتونتبدیل RTF به PDF با استفاده از پایتون
تبدیل فایل های TXT به PDF در سی شارپتبدیل فایل های TXT به PDF در جاواتبدیل فایل های TXT به PDF در پایتون