Konvertera PDF till Word i Python

PDF-filer är ett vanligt format för att dela dokument eftersom de bevarar formateringen och layouten för originaldokumentet. Men det finns tillfällen då du behöver redigera eller ändra innehållet i en PDF-fil, och det är där det är praktiskt att konvertera den till ett Word-dokument. I det här blogginlägget kommer vi att utforska hur man konverterar PDF-filer till Word-dokument i Python.

Python Library för att konvertera PDF till Word DOC

Aspose.Words for Python är ett kraftfullt och mångsidigt bibliotek för att arbeta med Word-dokument i Python-applikationer. Det låter dig manipulera Word-dokument på många sätt, inklusive att skapa, ändra och konvertera dem till andra format. Aspose.Words för Python finns på PyPI och kan installeras med följande pip-kommando.

pip install aspose-words

Konvertera en PDF-fil till Word-fil i Python

Med Aspose.Words för Python kan du konvertera en PDF-fil till DOCX inom ett par steg. Ladda helt enkelt PDF-filen och spara den som ett DOCX-dokument. Följande är stegen för att konvertera en PDF till DOCX i Python.

  • Ladda PDF-filen med Document class.
  • Spara PDF-fil som DOCX-dokument med metoden Document.save().

Följande kodexempel visar hur man konverterar en PDF-fil till DOCX-format.

import aspose.words as aw

# ladda PDF-filen
doc = aw.Document("PDF.pdf")

# konvertera PDF till Word DOCX-format
doc.save("pdf-to-word.docx")

Python PDF till Word-konvertering - Ladda alternativ

Aspose.Words för Python låter dig också anpassa laddningen av PDF-dokument enligt dina krav. Du kan till exempel bara ladda en rad sidor i PDF, hoppa över bilder, ange lösenord för krypterade filer etc. För att ställa in laddningsalternativen används klassen PdfLoadOptions. Följande är stegen för att specificera laddningsalternativ i Python PDF till DOCX-konvertering.

  • Skapa en instans av klassen PdfLoadOptions.
  • Ange laddningsformat med egenskapen PdfLoadOptions.loadformat.
  • Ställ in alternativ som skippdfimages, pageindex, pagecount etc.
  • Använd klassen Document för att ladda PDF-filen genom att skicka dess sökväg och PdfLoadOptions som parametrar.
  • Spara PDF-fil som DOCX-dokument med metoden Document.save().

Följande kodexempel visar hur man anger laddningsalternativ i PDF till DOCX-konvertering i Python.

import aspose.words as aw

# skapa PDF-laddningsalternativ
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# ställ in index för startsidan och antal sidor
loadOptions.page_index = 0
loadOptions.page_count = 1

# hoppa över bilder i PDF
loadOptions.skip_pdf_images = True

# för att ställa in lösenord för krypterade PDF-filer
#loadOptions.password = "12345" 

# ladda PDF-fil
doc = aw.Document("PDF.pdf", loadOptions)

# konvertera PDF till Word
doc.save("pdf-to-word.docx")

Skaffa en gratis licens

Du kan få en gratis tillfällig licens för att konvertera PDF-filer till DOCX utan utvärderingsbegränsningar.

Slutsats

Att konvertera PDF-filer till Word-dokument i Python kan vara en värdefull färdighet, särskilt när du behöver redigera eller modifiera innehållet i en PDF. Aspose.Words för Python gör denna uppgift relativt enkel, så att du kan utföra konverteringen med bara några rader kod.

Genom att följa stegen som beskrivs i det här blogginlägget kan du utnyttja kraften i Aspose.Words för att konvertera dina PDF-filer till Word-dokument och låsa upp potentialen för ytterligare redigering och anpassning.

Aspose.Words för Python tillhandahåller ett brett utbud av andra funktioner som du kan utforska med hjälp av dokumentationen. Du kan också ställa dina frågor via vårt forum.

Se även