Konvertera PDF till Word i Python

PDF är ett vanligt använt filformat för att dela och skriva ut dokument. Men i vissa fall konverteras PDF-filer till formatet Word DOCX eller DOC för att tolka texten eller göra dokumentet redigerbart. För sådana scenarier täcker den här artikeln hur man konverterar en PDF till Word-format i Python. Dessutom kommer du att lära dig hur du anger olika laddningsalternativ för att kontrollera PDF till Word-konvertering.

Python PDF till Word Converter

För att konvertera PDF-filer till Word-format kommer vi att använda Aspose.Words for Python. Det är ett funktionsrikt Python-bibliotek för att skapa, manipulera och konvertera Word-dokument. Dessutom ger den fram och tillbaka konvertering av Word- och PDF-dokument med hög kvalitet. Aspose.Words för Python finns på PyPI och kan installeras med följande pip-kommando.

pip install aspose-words

Hur man konverterar PDF till Word i Python

Med Aspose.Words för Python kan du konvertera en PDF-fil till Word-format inom ett par steg. Ladda helt enkelt PDF-filen och spara den som ett Word-dokument. Följande steg visar hur man sparar en PDF i Word-dokument i Python.

  • Ladda PDF-dokumentet från disken.
  • Spara Word-dokument som PDF till önskad plats.

Och det är allt. Följande avsnitt visar hur man omvandlar dessa steg till Python-kod för att konvertera PDF till Word-format.

Spara PDF som Word DOC i Python

Följande är stegen för att spara en PDF-fil i Word-format i Python.

  • Ladda PDF-filen med Document class.
  • Spara PDF-fil som Word-dokument med metoden Document.save().

Följande kodexempel visar hur man konverterar en PDF-fil till Word-format.

import aspose.words as aw

# ladda PDF-filen
doc = aw.Document("PDF.pdf")

# konvertera PDF till Word DOCX-format
doc.save("pdf-to-word.docx")

Python Exportera PDF till Word - Ladda alternativ

Aspose.Words för Python låter dig också anpassa laddningen av PDF-dokument enligt dina krav. Du kan till exempel bara ladda en rad sidor i PDF, hoppa över bilder, ange ett lösenord för krypterade filer etc. För att ställa in laddningsalternativen används klassen PdfLoadOptions. Följande är stegen för att ange laddningsalternativ i PDF till Word-konvertering.

  • Skapa en instans av klassen PdfLoadOptions.
  • Ange laddningsformat med egenskapen PdfLoadOptions.loadformat.
  • Ställ in alternativ som skippdfimages, pageindex, pagecount etc.
  • Använd klassen Document för att ladda PDF-filen genom att skicka dess sökväg och PdfLoadOptions som parametrar.
  • Spara PDF-fil som Word-dokument med metoden Document.save().

Följande kodexempel visar hur man anger laddningsalternativ i PDF till Word-konvertering i Python.

import aspose.words as aw

# skapa PDF-laddningsalternativ
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# ställ in index för startsidan och antal sidor
loadOptions.page_index = 0
loadOptions.page_count = 1

# hoppa över bilder i PDF
loadOptions.skip_pdf_images = True

# för att ställa in lösenord för krypterade PDF-filer
#loadOptions.password = "12345" 

# ladda PDF-fil
doc = aw.Document("PDF.pdf", loadOptions)

# konvertera PDF till Word
doc.save("pdf-to-word.docx")

Gratis Python PDF till Word Converter

Du kan få en gratis tillfällig licens för att konvertera PDF-filer till Word-format utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har du lärt dig hur du konverterar PDF-filer till Word-format i Python. Dessutom har du sett hur du anger olika laddningsalternativ för PDF-filer dynamiskt. Aspose.Words för Python tillhandahåller ett brett utbud av andra funktioner som du kan utforska med hjälp av dokumentationen. Du kan också ställa dina frågor via vårt forum.

Se även

Konvertera Word-filer till PDF med PythonSkapa Word-dokument i Python utan MS OfficePNG till Word i C# .NET
JPG till Word i C# .NETBild till Word i C#Ord till HTML i C#
Word DOCX till Markdown i JavaExtrahera bilder från Word DOC i JavaWord DOC till Markdown i Java
Word DOC DOCX till Markdown i C#Extrahera text från Word-dokument i JavaSlå samman MS Word-dokument med C# .NET
Word DOC till PNG, JPEG, BMP, GIF eller TIFF i C#Word DOC till PNG, JPEG, BMP, GIF eller TIFF i JavaKonvertera ett Word-dokument till EPUB i C#
Konvertera ett Word-dokument till EPUB i JavaKonvertera ett Word-dokument till EPUB i PythonKonvertera RTF till PDF med Python
Konvertera TXT-filer till PDF i C#Konvertera TXT-filer till PDF i JavaKonvertera TXT-filer till PDF i Python