PDF – це формат файлів, який зазвичай використовується для спільного використання та друку документів. Однак у деяких випадках PDF-файли перетворюються у формат Word DOCX або DOC, щоб проаналізувати текст або зробити документ доступним для редагування. Для таких сценаріїв у цій статті описано, як конвертувати PDF у формат Word у Python. Крім того, ви дізнаєтеся, як вказати різні параметри завантаження для керування перетворенням PDF у Word.
- Конвертер Python PDF у Word — безкоштовно завантажити
- Кроки для перетворення PDF у Word на Python
- Збережіть PDF-файл у форматі Word
- Укажіть параметри завантаження в PDF для перетворення Word
Конвертер Python PDF у Word
Щоб конвертувати файли PDF у формат Word, ми використаємо Aspose.Words for Python. Це багатофункціональна бібліотека Python для створення, обробки та конвертації документів Word. Крім того, він забезпечує зворотне перетворення документів Word і PDF з високою точністю. Aspose.Words for Python розміщено на PyPI і може бути встановлено за допомогою такої команди pip.
pip install aspose-words
Як конвертувати PDF у Word на Python
Використовуючи Aspose.Words for Python, ви можете конвертувати файл PDF у формат Word за кілька кроків. Просто завантажте PDF-файл і збережіть його як документ Word. Наступні кроки демонструють, як зберегти PDF-файл у документі Word на Python.
- Завантажте документ PDF з диска.
- Збережіть документ Word як PDF у потрібному місці.
І це все. У наступних розділах показано, як перетворити ці кроки в код Python для перетворення PDF у формат Word.
Збережіть PDF як Word DOC у Python
Нижче наведено кроки, щоб зберегти PDF-файл у форматі Word у Python.
- Завантажте PDF-файл за допомогою класу Document.
- Збережіть файл PDF як документ Word за допомогою методу Document.save().
У наведеному нижче прикладі коду показано, як конвертувати файл PDF у формат Word.
import aspose.words as aw
# завантажити файл PDF
doc = aw.Document("PDF.pdf")
# конвертувати PDF у формат Word DOCX
doc.save("pdf-to-word.docx")
Експорт PDF з Python у Word – параметри завантаження
Aspose.Words for Python також дозволяє налаштувати завантаження PDF-документів відповідно до ваших вимог. Наприклад, ви можете завантажувати лише діапазон сторінок у PDF, пропускати зображення, вказувати пароль для зашифрованих файлів тощо. Для встановлення параметрів завантаження використовується клас PdfLoadOptions. Нижче наведено кроки для визначення параметрів завантаження під час перетворення PDF у Word.
- Створіть екземпляр класу PdfLoadOptions.
- Укажіть формат завантаження за допомогою властивості PdfLoadOptions.loadformat.
- Встановіть такі параметри, як skippdfimages, pageindex, pagecount тощо.
- Використовуйте клас Document, щоб завантажити PDF-файл, передавши його шлях і PdfLoadOptions як параметри.
- Збережіть файл PDF як документ Word за допомогою методу Document.save().
У наведеному нижче прикладі коду показано, як у Python указати параметри завантаження в перетворенні PDF у Word.
import aspose.words as aw
# створити параметри завантаження PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# встановити індекс початкової сторінки та кількість сторінок
loadOptions.page_index = 0
loadOptions.page_count = 1
# пропускати зображення в PDF
loadOptions.skip_pdf_images = True
# щоб встановити пароль для зашифрованих файлів PDF
#loadOptions.password = "12345"
# завантажити файл PDF
doc = aw.Document("PDF.pdf", loadOptions)
# конвертувати PDF у Word
doc.save("pdf-to-word.docx")
Безкоштовний конвертер Python PDF у Word
Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати PDF-файли у формат Word без оціночних обмежень.
Висновок
У цій статті ви дізналися, як конвертувати файли PDF у формат Word на Python. Крім того, ви бачили, як динамічно вказувати різні параметри завантаження файлів PDF. Aspose.Words for Python надає широкий спектр інших функцій, які ви можете дослідити за допомогою документації. Також ви можете поставити свої запитання через наш форум.