Konvertera Word till TXT i Java | DOCX till TXT | Java Word till Text

I vissa fall kan vi behöva exportera data från ett format till ett annat. Ett vanligt krav är att konvertera Word-dokument (DOC eller DOCX) till rena text (TXT) filer. I den här artikeln kommer vi att lära oss hur man konverterar Word till TXT med hjälp av Java Word till Text Converter-biblioteket.

Denna artikel täcker följande ämnen:

Java Word till Text Converter-bibliotek

Aspose.Words för Java är ett kraftfullt bibliotek för utvecklare som behöver arbeta med dokument i sina Java-program. Det gör det möjligt för utvecklare att skapa, redigera och konvertera dokument programmatisk i Java-applikationer. Du kan tänka på det som en verktygslåda för att arbeta med dokument utan att behöva Microsoft Word. Vi kommer att använda detta bibliotek för att konvertera Word-dokument till rena textfiler. Genom att använda Aspose.Words för Java-biblioteket kan vi enkelt konvertera DOC eller DOCX-filer till TXT-format, vilket gör att vi kan extrahera text från ett Word-dokument och spara det som en enkel textfil.

Vänligen ladda ner JAR av API:et eller lägg till följande pom.xml-konfiguration i en Maven-baserad Java-applikation.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Steg för att konvertera Word DOC till TXT

Vi kan exportera text från Word-dokument och spara det i TXT-format genom att följa de enkla stegen nedan:

  • Ladda Word DOC/DOCX-filen.
  • Konvertera den till TXT-format.
  • Spara filen på önskad plats.

Vi behöver inte manuellt bearbeta hela Word-dokumentet rad för rad eller sida för sida; vi kan utnyttja Java-bibliotek för att effektivt extrahera textinnehållet. Låt oss utforska hur vi kan uppnå detta i Java.

Konvertera ett Word DOC till TXT i Java

Vi kan enkelt konvertera ett Word (DOC eller DOCX) dokument till en TXT-fil i Java genom att följa stegen nedan:

  • Först, ladda Word DOC/DOCX med hjälp av Document-klassen.
  • Sedan, spara dokumentet som en TXT-fil med hjälp av Document.save(filePath)-metoden.

Följande kodexempel visar hur man konverterar ett Word-dokument till TXT-format i Java.

// This code example demontrates how to save a DOCX file as TXT
// Load Word file
Document doc = new Document("D:\\Files\\document.docx");
// Save document as TXT file
doc.save("D:\\Files\\doc-to-text.txt");
Konvertera ett Word DOC till TXT i Java

Konvertera ett Word DOC till TXT i Java

Få en gratis licens

Du kan få en gratis tillfällig licens för att konvertera Word-filer till TXT-format utan utvärderingsbegränsningar.

Konvertera Word till TXT Online

Du kan också använda denna gratis Word till Text-konverterare för att konvertera DOCX till TXT online. Exportera ditt textinnehåll från Word-dokument till ett rent textformat snabbt och med hög kvalitet och noggrannhet.

DOCX till TXT – Gratis resurser

Förutom att konvertera dina DOC eller DOCX-filer till TXT-format, lås upp hela potentialen av Aspose.Words för Java. Utforska avancerade funktioner som att skapa, redigera, hantera eller konvertera dokument och mer med hjälp av följande resurser:

Slutsats

I det här blogginlägget har vi lärt oss hur man konverterar Word till text genom att extrahera textinnehållet från ett Word-dokument och spara det som en ren textfil. Att konvertera Word till TXT i Java är en enkel uppgift som kan utföras med hjälp av Aspose.Words för Java-biblioteket. Så nästa gång du behöver konvertera ett Word-dokument till ren text kan du använda kodexemplet ovan som en startapplikation. Vid eventuella oklarheter, tveka inte att kontakta oss på vårt gratis supportforum.

Se även