PDF to powszechnie używany format plików do udostępniania i drukowania dokumentów. Jednak w niektórych przypadkach pliki PDF są konwertowane do formatu Word DOCX lub DOC w celu przeanalizowania tekstu lub udostępnienia dokumentu do edycji. W przypadku takich scenariuszy w tym artykule opisano, jak przekonwertować plik PDF na format Word w Python. Ponadto dowiesz się, jak określić różne opcje ładowania, aby kontrolować konwersję PDF do Word.
- Konwerter plików PDF na Word w języku Python — bezpłatne pobieranie
- Kroki, aby przekonwertować plik PDF na Word w Python
- Zapisz plik PDF w formacie Word
- Określ opcje ładowania w konwersji PDF na Word
Konwerter plików PDF na Word w języku Python — bezpłatne pobieranie
Do konwersji plików PDF do formatu Word użyjemy Aspose.Words for Python. Jest to bogata w funkcje biblioteka Python do tworzenia, manipulowania i konwertowania dokumentów Worda. Ponadto zapewnia konwersję tam iz powrotem dokumentów Word i PDF z wysoką wiernością. Aspose.Words for Python jest hostowany na PyPI i można go zainstalować za pomocą następującego polecenia pip.
pip install aspose-words
Proste kroki do konwersji plików PDF na Word w Python
Używając Aspose.Words for Python, możesz przekonwertować plik PDF do formatu Word w kilku krokach. Po prostu załaduj plik PDF i zapisz go jako dokument Word. Poniższe kroki pokazują, jak zapisać plik PDF w dokumencie Word w Python.
- Załaduj dokument PDF z dysku.
- Zapisz dokument programu Word jako plik PDF w żądanej lokalizacji.
I to wszystko. W poniższych sekcjach pokazano, jak przekształcić te kroki w kod Python, aby przekonwertować plik PDF na format programu Word.
Zapisz PDF jako format Word w Python
Poniżej przedstawiono kroki, aby zapisać plik PDF w formacie Word w Python.
- Załaduj plik PDF za pomocą klasy Document.
- Zapisz plik PDF jako dokument programu Word za pomocą metody Document.save().
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format programu Word.
import aspose.words as aw
# załaduj plik PDF
doc = aw.Document("PDF.pdf")
# konwertować PDF do formatu Word DOCX
doc.save("pdf-to-word.docx")
Python Konwertuj pliki PDF na Word z opcjami ładowania
Aspose.Words for Python pozwala również dostosować ładowanie dokumentów PDF zgodnie z własnymi wymaganiami. Na przykład możesz załadować tylko zakres stron w formacie PDF, pominąć obrazy, określić hasło dla zaszyfrowanych plików itp. Do ustawienia opcji ładowania używana jest klasa PdfLoadOptions. Poniżej przedstawiono kroki, aby określić opcje ładowania w konwersji PDF na Word.
- Utwórz instancję klasy PdfLoadOptions.
- Określ format ładowania za pomocą właściwości PdfLoadOptions.loadformat.
- Ustaw opcje, takie jak skippdfimages, pageindex, pagecount itp.
- Użyj klasy Document, aby załadować plik PDF, przekazując jego ścieżkę i PdfLoadOptions jako parametry.
- Zapisz plik PDF jako dokument programu Word za pomocą metody Document.save().
Poniższy przykładowy kod pokazuje, jak określić opcje ładowania w konwersji plików PDF na Word w języku Python.
import aspose.words as aw
# utwórz opcje ładowania plików PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# ustawić indeks strony początkowej i liczbę stron
loadOptions.page_index = 0
loadOptions.page_count = 1
# pomiń obrazy w formacie PDF
loadOptions.skip_pdf_images = True
# ustawić hasło dla zaszyfrowanych plików PDF
#loadOptions.password = "12345"
# załaduj plik PDF
doc = aw.Document("PDF.pdf", loadOptions)
# konwertować plik PDF do worda
doc.save("pdf-to-word.docx")
Python PDF do biblioteki Word — Uzyskaj bezpłatną licencję
Możesz uzyskać tymczasową licencję, aby używać Aspose.Words for Python bez ograniczeń ewaluacyjnych.
Wniosek
W tym artykule nauczyłeś się, jak konwertować pliki PDF do formatu Word w Python. Ponadto widziałeś, jak dynamicznie określać różne opcje ładowania plików PDF. Aspose.Words for Python zapewnia szeroki zakres innych funkcji, które możesz eksplorować za pomocą dokumentacji. Możesz także zadawać pytania za pośrednictwem naszego forum.