Som programmerare kan du behöva bearbeta ett gäng Word DOC/DOCX-filer för att extrahera vanlig text från dina Python-applikationer. Den här artikeln ger en kraftfull, högkvalitativ och enkel lösning för att extrahera vanlig text från Word DOCX- eller DOC-filer i Python. I slutändan kommer du att lära dig hur du konverterar en DOCX- eller DOC-fil till TXT i Python.
MS Word är ett populärt ordbehandlingsprogram som låter dig skapa rika textdokument. Ett brett utbud av dokument skapas i MS Word inklusive fakturor, tekniska dokument, rapporter och så vidare. Så låt oss se hur man utför Word till TXT-konvertering i Python.
- Python DOCX till TXT Converter - Gratis nedladdning
- Steg för att konvertera DOCX till TXT i Python
- Spara DOC som TXT-fil i Python
Python DOCX till TXT Converter
För konvertering av Word till TXT kommer vi att använda Aspose.Words for Python. Det är ett fantastiskt bibliotek med ett brett utbud av funktioner för att manipulera populära textdokument inklusive DOC och DOCX. Biblioteket gör det enklare att bearbeta och hämta text från Word-dokument. Du kan också använda det här biblioteket och konvertera Word till TXT gratis.
Du kan använda följande pip-kommando för att installera Aspose.Words för Python i din applikation.
pip install aspose-words
Hur man konverterar DOCX till TXT i Python
Aspose.Words för Python förenklar konverteringen från DOCX till TXT som du kan utföra inom ett par steg, som nämns nedan:
- Ladda DOCX-filen från disken.
- Spara DOCX som TXT-format till önskad plats.
Du behöver inte tolka hela Word-dokumentet sida för sida eller rad för rad för att extrahera texten från det. Låt oss nu ta en titt på hur man utför dessa steg i Python för att konvertera en DOCX-fil till TXT-format.
Spara Word DOC som TXT i Python
Följande är stegen för att spara en DOC- eller DOCX-fil som TXT i Python.
- Ladda DOC-filen med Document class.
- Spara DOC som TXT med metoden Document.save(filePath) och skicka filens sökväg som en parameter.
Följande kodexempel visar hur man konverterar en DOC till TXT i Python.
import aspose.words as aw
# Ladda DOC-fil
doc = aw.Document("document.doc")
# Spara DOC som TXT
doc.save("doc-to-text.txt")
Gratis Python DOC till TXT Converter
Du kan använda en gratis temporär licens för att konvertera DOC-filer till TXT-format utan utvärderingsbegränsningar.
Utforska Word to TXT Converter
Du kan besöka dokumentationen i Python Word-biblioteket för att utforska andra funktioner. Om du har några frågor är du välkommen att meddela oss via vårt forum.
Slutsats
I den här artikeln har du lärt dig hur du konverterar DOC- eller DOCX-filer till TXT-format i Python. Med hjälp av ett kodexempel har du sett hur du laddar och sparar DOCX-filer som TXT till önskad plats i Python.