Převeďte PDF do Wordu v Python

PDF je běžně používaný formát souboru pro sdílení a tisk dokumentů. V určitých případech jsou však soubory PDF převedeny do formátu Word DOCX nebo DOC, aby bylo možné text analyzovat nebo upravit dokument. Pro takové scénáře tento článek popisuje, jak převést PDF do formátu Word v Python. Navíc se naučíte, jak určit různé možnosti načítání pro řízení převodu PDF do Wordu.

Python PDF to Word Converter

Pro převod souborů PDF do formátu Word použijeme Aspose.Words for Python. Jedná se o knihovnu Python s bohatými funkcemi pro vytváření, manipulaci a převod dokumentů aplikace Word. Navíc poskytuje zpětný převod dokumentů Word a PDF s vysokou věrností. Aspose.Words for Python je hostován na PyPI a lze jej nainstalovat pomocí následujícího příkazu pip.

pip install aspose-words

Jak převést PDF do Wordu v Python

Pomocí Aspose.Words for Python můžete převést soubor PDF do formátu Word během několika kroků. Jednoduše načtěte soubor PDF a uložte jej jako dokument aplikace Word. Následující kroky ukazují, jak uložit PDF v dokumentu Word v Python.

  • Načtěte dokument PDF z disku.
  • Uložte dokument aplikace Word jako PDF do požadovaného umístění.

A to je vše. Následující části ukazují, jak převést tyto kroky do kódu Python pro převod PDF do formátu Word.

Uložit PDF jako Word DOC v Python

Níže jsou uvedeny kroky k uložení souboru PDF ve formátu Word v Python.

  • Načtěte soubor PDF pomocí třídy Document.
  • Uložte soubor PDF jako dokument aplikace Word pomocí metody Document.save().

Následující ukázka kódu ukazuje, jak převést soubor PDF do formátu Word.

import aspose.words as aw

# načíst soubor PDF
doc = aw.Document("PDF.pdf")

# převést PDF do formátu Word DOCX
doc.save("pdf-to-word.docx")

Python Export PDF do Wordu - Možnosti načtení

Aspose.Words for Python vám také umožňuje přizpůsobit načítání dokumentů PDF podle vašich požadavků. Můžete například načíst pouze rozsah stránek v PDF, přeskakovat obrázky, zadat heslo pro šifrované soubory atd. Pro nastavení možností načítání se používá třída PdfLoadOptions. Níže jsou uvedeny kroky k určení možností načtení při převodu PDF do Wordu.

  • Vytvořte instanci třídy PdfLoadOptions.
  • Zadejte formát načtení pomocí vlastnosti PdfLoadOptions.loadformat.
  • Nastavte možnosti, jako jsou skippdfimages, index stránek, počet stránek atd.
  • Použijte třídu Document k načtení souboru PDF předáním jeho cesty a parametrů PdfLoadOptions.
  • Uložte soubor PDF jako dokument aplikace Word pomocí metody Document.save().

Následující ukázka kódu ukazuje, jak určit možnosti načtení v převodu PDF do Wordu v Python.

import aspose.words as aw

# vytvořit možnosti načítání PDF
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# nastavit index úvodní stránky a počet stránek
loadOptions.page_index = 0
loadOptions.page_count = 1

# přeskočit obrázky v PDF
loadOptions.skip_pdf_images = True

# pro nastavení hesla pro šifrované soubory PDF
#loadOptions.password = "12345" 

# načíst soubor PDF
doc = aw.Document("PDF.pdf", loadOptions)

# převést PDF do Wordu
doc.save("pdf-to-word.docx")

Zdarma Python PDF to Word Converter

Můžete získat bezplatnou dočasnou licenci pro převod souborů PDF do formátu Word bez omezení hodnocení.

Závěr

V tomto článku jste se naučili, jak převést soubory PDF do formátu Word v Python. Navíc jste viděli, jak dynamicky specifikovat různé možnosti načítání pro soubory PDF. Aspose.Words for Python poskytuje širokou škálu dalších funkcí, které můžete prozkoumat pomocí dokumentace. Také se můžete ptát na naše fórum.

Viz také

Převést soubory Wordu do PDF pomocí PythonVytvářejte dokumenty Word v Python bez MS OfficePNG do Wordu v C# .NET
JPG do Wordu v C# .NETObrázek do Wordu v C#Word to HTML v C#
Word DOCX to Markdown v JavěExtrahovat obrázky z Word DOC v JavěWord DOC to Markdown v Javě
Word DOC DOCX to Markdown v C#Extrahovat text z dokumentů aplikace Word v JavěSloučit dokumenty MS Word pomocí C# .NET
Word DOC do PNG, JPEG, BMP, GIF nebo TIFF v C#Word DOC do PNG, JPEG, BMP, GIF nebo TIFF v JavěPřevést dokument Wordu na EPUB v C#
Převést dokument Word na EPUB v JavěPřevést dokument Word na EPUB v PythonPřevést RTF do PDF pomocí Python
Převést soubory TXT do PDF v C#Převést soubory TXT do PDF v JavěPřevést soubory TXT do PDF v Python