Перетворюйте PDF у Word на Python

PDF – це формат файлів, який зазвичай використовується для спільного використання та друку документів. Однак у деяких випадках PDF-файли перетворюються у формат Word DOCX або DOC, щоб проаналізувати текст або зробити документ доступним для редагування. Для таких сценаріїв у цій статті описано, як конвертувати PDF у формат Word у Python. Крім того, ви дізнаєтеся, як вказати різні параметри завантаження для керування перетворенням PDF у Word.

Конвертер Python PDF у Word

Щоб конвертувати файли PDF у формат Word, ми використаємо Aspose.Words for Python. Це багатофункціональна бібліотека Python для створення, обробки та конвертації документів Word. Крім того, він забезпечує зворотне перетворення документів Word і PDF з високою точністю. Aspose.Words for Python розміщено на PyPI і може бути встановлено за допомогою такої команди pip.

pip install aspose-words

Як конвертувати PDF у Word на Python

Використовуючи Aspose.Words for Python, ви можете конвертувати файл PDF у формат Word за кілька кроків. Просто завантажте PDF-файл і збережіть його як документ Word. Наступні кроки демонструють, як зберегти PDF-файл у документі Word на Python.

  • Завантажте документ PDF з диска.
  • Збережіть документ Word як PDF у потрібному місці.

І це все. У наступних розділах показано, як перетворити ці кроки в код Python для перетворення PDF у формат Word.

Збережіть PDF як Word DOC у Python

Нижче наведено кроки, щоб зберегти PDF-файл у форматі Word у Python.

  • Завантажте PDF-файл за допомогою класу Document.
  • Збережіть файл PDF як документ Word за допомогою методу Document.save().

У наведеному нижче прикладі коду показано, як конвертувати файл PDF у формат Word.

import aspose.words as aw

# завантажити файл PDF
doc = aw.Document("PDF.pdf")

# конвертувати PDF у формат Word DOCX
doc.save("pdf-to-word.docx")

Експорт PDF з Python у Word – параметри завантаження

Aspose.Words for Python також дозволяє налаштувати завантаження PDF-документів відповідно до ваших вимог. Наприклад, ви можете завантажувати лише діапазон сторінок у PDF, пропускати зображення, вказувати пароль для зашифрованих файлів тощо. Для встановлення параметрів завантаження використовується клас PdfLoadOptions. Нижче наведено кроки для визначення параметрів завантаження під час перетворення PDF у Word.

  • Створіть екземпляр класу PdfLoadOptions.
  • Укажіть формат завантаження за допомогою властивості PdfLoadOptions.loadformat.
  • Встановіть такі параметри, як skippdfimages, pageindex, pagecount тощо.
  • Використовуйте клас Document, щоб завантажити PDF-файл, передавши його шлях і PdfLoadOptions як параметри.
  • Збережіть файл PDF як документ Word за допомогою методу Document.save().

У наведеному нижче прикладі коду показано, як у Python указати параметри завантаження в перетворенні PDF у Word.

import aspose.words as aw

# створити параметри завантаження PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# встановити індекс початкової сторінки та кількість сторінок
loadOptions.page_index = 0
loadOptions.page_count = 1

# пропускати зображення в PDF
loadOptions.skip_pdf_images = True

# щоб встановити пароль для зашифрованих файлів PDF
#loadOptions.password = "12345" 

# завантажити файл PDF
doc = aw.Document("PDF.pdf", loadOptions)

# конвертувати PDF у Word
doc.save("pdf-to-word.docx")

Безкоштовний конвертер Python PDF у Word

Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати PDF-файли у формат Word без оціночних обмежень.

Висновок

У цій статті ви дізналися, як конвертувати файли PDF у формат Word на Python. Крім того, ви бачили, як динамічно вказувати різні параметри завантаження файлів PDF. Aspose.Words for Python надає широкий спектр інших функцій, які ви можете дослідити за допомогою документації. Також ви можете поставити свої запитання через наш форум.

Дивись також

Перетворіть файли Word на PDF за допомогою PythonСтворюйте документи Word на Python без MS OfficePNG у Word у C# .NET
JPG у Word у C# .NETЗображення в Word у C#Слово в HTML у C#
Word DOCX у Markdown у JavaВидобути зображення з Word DOC на JavaWord DOC у Markdown у Java
Word DOC DOCX у Markdown у C#Вилучення тексту з документів Word на JavaОб’єднання документів MS Word за допомогою C# .NET
Word DOC у PNG, JPEG, BMP, GIF або TIFF у C#Word DOC у PNG, JPEG, BMP, GIF або TIFF у JavaПеретворіть документ Word на EPUB у C#
Перетворіть документ Word на EPUB у JavaПеретворіть документ Word на EPUB у PythonПеретворіть RTF на PDF за допомогою Python
Перетворення файлів TXT на PDF на C#Перетворення файлів TXT на PDF у JavaПеретворення файлів TXT на PDF у Python