PDF – це формат файлів, який зазвичай використовується для спільного використання та друку документів. Однак у деяких випадках PDF-файли перетворюються у формат Word DOCX, щоб проаналізувати текст або зробити документ доступним для редагування. Для таких сценаріїв у цій статті описано, як конвертувати PDF у DOCX на Python. Крім того, ви навчитеся вказувати різні параметри завантаження, щоб динамічно контролювати завантаження файлів PDF.
- Конвертер Python PDF в DOCX
- Перетворіть PDF-файл у DOCX на Python
- Python PDF до DOCX – укажіть параметри завантаження
Конвертер Python PDF в DOCX
Щоб конвертувати файли PDF у формат DOCX, ми будемо використовувати Aspose.Words for Python. Це багатофункціональна бібліотека Python для створення, обробки та конвертації документів Word. Крім того, він забезпечує перетворення документів Word і PDF із високою точністю. Aspose.Words for Python розміщено на PyPI і може бути встановлено за допомогою такої команди pip.
pip install aspose-words
Як конвертувати PDF у DOCX на Python
Використовуючи Aspose.Words for Python, ви можете конвертувати PDF-файл у DOCX за кілька кроків. Просто завантажте PDF-файл і збережіть його як документ DOCX. Нижче наведено кроки для перетворення PDF-файлу на DOCX на Python.
- Завантажте PDF-файл за допомогою класу Document.
- Збережіть файл PDF як документ DOCX за допомогою методу Document.save().
У наведеному нижче прикладі коду показано, як конвертувати файл PDF у формат DOCX.
import aspose.words as aw
# завантажити файл PDF
doc = aw.Document("PDF.pdf")
# конвертувати PDF у формат Word DOCX
doc.save("pdf-to-word.docx")
Зберегти PDF як DOCX у Python — параметри завантаження
Aspose.Words for Python також дозволяє налаштувати завантаження PDF-документів відповідно до ваших вимог. Наприклад, ви можете завантажувати лише діапазон сторінок у PDF, пропускати зображення, вказувати пароль для зашифрованих файлів тощо. Для встановлення параметрів завантаження використовується клас PdfLoadOptions. Нижче наведено кроки для вказівки параметрів завантаження в конвертації Python PDF у DOCX.
- Створіть екземпляр класу PdfLoadOptions.
- Укажіть формат завантаження за допомогою властивості PdfLoadOptions.loadformat.
- Встановіть такі параметри, як skippdfimages, pageindex, pagecount тощо.
- Використовуйте клас Document, щоб завантажити PDF-файл, передавши його шлях і PdfLoadOptions як параметри.
- Збережіть файл PDF як документ DOCX за допомогою методу Document.save().
У наведеному нижче прикладі коду показано, як у Python указати параметри завантаження в конвертації PDF у DOCX.
import aspose.words as aw
# створити параметри завантаження PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# встановити індекс початкової сторінки та кількість сторінок
loadOptions.page_index = 0
loadOptions.page_count = 1
# пропускати зображення в PDF
loadOptions.skip_pdf_images = True
# щоб встановити пароль для зашифрованих файлів PDF
#loadOptions.password = "12345"
# завантажити файл PDF
doc = aw.Document("PDF.pdf", loadOptions)
# конвертувати PDF у Word
doc.save("pdf-to-word.docx")
Безкоштовний конвертер Python PDF у DOCX
Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати файли PDF у формат DOCX без обмежень оцінювання.
Висновок
У цій статті ви дізналися, як конвертувати PDF-файли в DOCX за допомогою Python. Крім того, ви бачили, як динамічно вказувати різні параметри завантаження PDF-файлів. Aspose.Words for Python надає широкий спектр інших функцій, які ви можете дослідити за допомогою документації. Також ви можете поставити свої запитання через наш форум.