Konwertuj PDF na Word w Python

PDF to powszechnie używany format plików do udostępniania i drukowania dokumentów. Jednak w niektórych przypadkach pliki PDF są konwertowane do formatu Word DOCX lub DOC w celu przeanalizowania tekstu lub udostępnienia dokumentu do edycji. W przypadku takich scenariuszy w tym artykule opisano, jak przekonwertować plik PDF na format Word w Python. Ponadto dowiesz się, jak określić różne opcje ładowania, aby kontrolować konwersję PDF do Word.

Konwerter plików PDF na Word w języku Python — bezpłatne pobieranie

Do konwersji plików PDF do formatu Word użyjemy Aspose.Words for Python. Jest to bogata w funkcje biblioteka Python do tworzenia, manipulowania i konwertowania dokumentów Worda. Ponadto zapewnia konwersję tam iz powrotem dokumentów Word i PDF z wysoką wiernością. Aspose.Words for Python jest hostowany na PyPI i można go zainstalować za pomocą następującego polecenia pip.

pip install aspose-words

Proste kroki do konwersji plików PDF na Word w Python

Używając Aspose.Words for Python, możesz przekonwertować plik PDF do formatu Word w kilku krokach. Po prostu załaduj plik PDF i zapisz go jako dokument Word. Poniższe kroki pokazują, jak zapisać plik PDF w dokumencie Word w Python.

  • Załaduj dokument PDF z dysku.
  • Zapisz dokument programu Word jako plik PDF w żądanej lokalizacji.

I to wszystko. W poniższych sekcjach pokazano, jak przekształcić te kroki w kod Python, aby przekonwertować plik PDF na format programu Word.

Zapisz PDF jako format Word w Python

Poniżej przedstawiono kroki, aby zapisać plik PDF w formacie Word w Python.

  • Załaduj plik PDF za pomocą klasy Document.
  • Zapisz plik PDF jako dokument programu Word za pomocą metody Document.save().

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format programu Word.

import aspose.words as aw

# załaduj plik PDF
doc = aw.Document("PDF.pdf")

# konwertować PDF do formatu Word DOCX
doc.save("pdf-to-word.docx")

Python Konwertuj pliki PDF na Word z opcjami ładowania

Aspose.Words for Python pozwala również dostosować ładowanie dokumentów PDF zgodnie z własnymi wymaganiami. Na przykład możesz załadować tylko zakres stron w formacie PDF, pominąć obrazy, określić hasło dla zaszyfrowanych plików itp. Do ustawienia opcji ładowania używana jest klasa PdfLoadOptions. Poniżej przedstawiono kroki, aby określić opcje ładowania w konwersji PDF na Word.

  • Utwórz instancję klasy PdfLoadOptions.
  • Określ format ładowania za pomocą właściwości PdfLoadOptions.loadformat.
  • Ustaw opcje, takie jak skippdfimages, pageindex, pagecount itp.
  • Użyj klasy Document, aby załadować plik PDF, przekazując jego ścieżkę i PdfLoadOptions jako parametry.
  • Zapisz plik PDF jako dokument programu Word za pomocą metody Document.save().

Poniższy przykładowy kod pokazuje, jak określić opcje ładowania w konwersji plików PDF na Word w języku Python.

import aspose.words as aw

# utwórz opcje ładowania plików PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# ustawić indeks strony początkowej i liczbę stron
loadOptions.page_index = 0
loadOptions.page_count = 1

# pomiń obrazy w formacie PDF
loadOptions.skip_pdf_images = True

# ustawić hasło dla zaszyfrowanych plików PDF
#loadOptions.password = "12345" 

# załaduj plik PDF
doc = aw.Document("PDF.pdf", loadOptions)

# konwertować plik PDF do worda
doc.save("pdf-to-word.docx")

Python PDF do biblioteki Word — Uzyskaj bezpłatną licencję

Możesz uzyskać tymczasową licencję, aby używać Aspose.Words for Python bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule nauczyłeś się, jak konwertować pliki PDF do formatu Word w Python. Ponadto widziałeś, jak dynamicznie określać różne opcje ładowania plików PDF. Aspose.Words for Python zapewnia szeroki zakres innych funkcji, które możesz eksplorować za pomocą dokumentacji. Możesz także zadawać pytania za pośrednictwem naszego forum.

Zobacz też

Konwertuj pliki Worda na PDF przy użyciu PythonTworzenie dokumentów Worda w Python bez MS OfficePNG do programu Word w języku C# .NET
JPG do programu Word w języku C# .NETObraz do programu Word w języku C#Word do HTML w C#
Word DOCX do Markdown w JavieWyodrębnij obrazy z Word DOC w JavieWord DOC do Markdown w Javie
Word DOC DOCX do Markdown w C#Wyodrębnij tekst z dokumentów programu Word w JavieScal dokumenty MS Word przy użyciu C# .NET
Word DOC do PNG, JPEG, BMP, GIF lub TIFF w C#Word DOC do formatu PNG, JPEG, BMP, GIF lub TIFF w JavieKonwertuj dokument programu Word na format EPUB w języku C#
Konwertuj dokument programu Word na format EPUB w JavieKonwertuj dokument programu Word na format EPUB w PythonKonwertuj RTF na PDF za pomocą Python
Konwertuj pliki TXT na PDF w C#Konwertuj pliki TXT na PDF w JavieKonwertuj pliki TXT na PDF w Python