Перетворюйте PDF у Word на Python

PDF – це формат файлів, який зазвичай використовується для спільного використання та друку документів. Однак у деяких випадках PDF-файли перетворюються у формат Word DOCX, щоб проаналізувати текст або зробити документ доступним для редагування. Для таких сценаріїв у цій статті описано, як конвертувати PDF у DOCX на Python. Крім того, ви навчитеся вказувати різні параметри завантаження, щоб динамічно контролювати завантаження файлів PDF.

Конвертер Python PDF в DOCX

Щоб конвертувати файли PDF у формат DOCX, ми будемо використовувати Aspose.Words for Python. Це багатофункціональна бібліотека Python для створення, обробки та конвертації документів Word. Крім того, він забезпечує перетворення документів Word і PDF із високою точністю. Aspose.Words for Python розміщено на PyPI і може бути встановлено за допомогою такої команди pip.

pip install aspose-words

Як конвертувати PDF у DOCX на Python

Використовуючи Aspose.Words for Python, ви можете конвертувати PDF-файл у DOCX за кілька кроків. Просто завантажте PDF-файл і збережіть його як документ DOCX. Нижче наведено кроки для перетворення PDF-файлу на DOCX на Python.

  • Завантажте PDF-файл за допомогою класу Document.
  • Збережіть файл PDF як документ DOCX за допомогою методу Document.save().

У наведеному нижче прикладі коду показано, як конвертувати файл PDF у формат DOCX.

import aspose.words as aw

# завантажити файл PDF
doc = aw.Document("PDF.pdf")

# конвертувати PDF у формат Word DOCX
doc.save("pdf-to-word.docx")

Зберегти PDF як DOCX у Python — параметри завантаження

Aspose.Words for Python також дозволяє налаштувати завантаження PDF-документів відповідно до ваших вимог. Наприклад, ви можете завантажувати лише діапазон сторінок у PDF, пропускати зображення, вказувати пароль для зашифрованих файлів тощо. Для встановлення параметрів завантаження використовується клас PdfLoadOptions. Нижче наведено кроки для вказівки параметрів завантаження в конвертації Python PDF у DOCX.

  • Створіть екземпляр класу PdfLoadOptions.
  • Укажіть формат завантаження за допомогою властивості PdfLoadOptions.loadformat.
  • Встановіть такі параметри, як skippdfimages, pageindex, pagecount тощо.
  • Використовуйте клас Document, щоб завантажити PDF-файл, передавши його шлях і PdfLoadOptions як параметри.
  • Збережіть файл PDF як документ DOCX за допомогою методу Document.save().

У наведеному нижче прикладі коду показано, як у Python указати параметри завантаження в конвертації PDF у DOCX.

import aspose.words as aw

# створити параметри завантаження PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# встановити індекс початкової сторінки та кількість сторінок
loadOptions.page_index = 0
loadOptions.page_count = 1

# пропускати зображення в PDF
loadOptions.skip_pdf_images = True

# щоб встановити пароль для зашифрованих файлів PDF
#loadOptions.password = "12345" 

# завантажити файл PDF
doc = aw.Document("PDF.pdf", loadOptions)

# конвертувати PDF у Word
doc.save("pdf-to-word.docx")

Безкоштовний конвертер Python PDF у DOCX

Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати файли PDF у формат DOCX без обмежень оцінювання.

Висновок

У цій статті ви дізналися, як конвертувати PDF-файли в DOCX за допомогою Python. Крім того, ви бачили, як динамічно вказувати різні параметри завантаження PDF-файлів. Aspose.Words for Python надає широкий спектр інших функцій, які ви можете дослідити за допомогою документації. Також ви можете поставити свої запитання через наш форум.

Дивись також