I vissa fall kan vi behöva exportera data från ett format till ett annat. Ett vanligt krav är att konvertera Word-dokument (DOC eller DOCX) till rena text (TXT) filer. I den här artikeln kommer vi att lära oss hur man konverterar Word till TXT med hjälp av Java Word till Text Converter-biblioteket.
Denna artikel täcker följande ämnen:
- Java Word till Text Converter
- Steg för att konvertera DOCX till TXT
- Konvertera Word till TXT i Java
- Konvertera Word till TXT Online
- Gratis resurser
Java Word till Text Converter-bibliotek
Aspose.Words för Java är ett kraftfullt bibliotek för utvecklare som behöver arbeta med dokument i sina Java-program. Det gör det möjligt för utvecklare att skapa, redigera och konvertera dokument programmatisk i Java-applikationer. Du kan tänka på det som en verktygslåda för att arbeta med dokument utan att behöva Microsoft Word. Vi kommer att använda detta bibliotek för att konvertera Word-dokument till rena textfiler. Genom att använda Aspose.Words för Java-biblioteket kan vi enkelt konvertera DOC eller DOCX-filer till TXT-format, vilket gör att vi kan extrahera text från ett Word-dokument och spara det som en enkel textfil.
Vänligen ladda ner JAR av API:et eller lägg till följande pom.xml-konfiguration i en Maven-baserad Java-applikation.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>24.3</version>
<classifier>jdk17</classifier>
</dependency>
<dependencies>
Steg för att konvertera Word DOC till TXT
Vi kan exportera text från Word-dokument och spara det i TXT-format genom att följa de enkla stegen nedan:
- Ladda Word DOC/DOCX-filen.
- Konvertera den till TXT-format.
- Spara filen på önskad plats.
Vi behöver inte manuellt bearbeta hela Word-dokumentet rad för rad eller sida för sida; vi kan utnyttja Java-bibliotek för att effektivt extrahera textinnehållet. Låt oss utforska hur vi kan uppnå detta i Java.
Konvertera ett Word DOC till TXT i Java
Vi kan enkelt konvertera ett Word (DOC eller DOCX) dokument till en TXT-fil i Java genom att följa stegen nedan:
- Först, ladda Word DOC/DOCX med hjälp av Document-klassen.
- Sedan, spara dokumentet som en TXT-fil med hjälp av Document.save(filePath)-metoden.
Följande kodexempel visar hur man konverterar ett Word-dokument till TXT-format i Java.
// This code example demontrates how to save a DOCX file as TXT | |
// Load Word file | |
Document doc = new Document("D:\\Files\\document.docx"); | |
// Save document as TXT file | |
doc.save("D:\\Files\\doc-to-text.txt"); |
Få en gratis licens
Du kan få en gratis tillfällig licens för att konvertera Word-filer till TXT-format utan utvärderingsbegränsningar.
Konvertera Word till TXT Online
Du kan också använda denna gratis Word till Text-konverterare för att konvertera DOCX till TXT online. Exportera ditt textinnehåll från Word-dokument till ett rent textformat snabbt och med hög kvalitet och noggrannhet.
DOCX till TXT – Gratis resurser
Förutom att konvertera dina DOC eller DOCX-filer till TXT-format, lås upp hela potentialen av Aspose.Words för Java. Utforska avancerade funktioner som att skapa, redigera, hantera eller konvertera dokument och mer med hjälp av följande resurser:
Slutsats
I det här blogginlägget har vi lärt oss hur man konverterar Word till text genom att extrahera textinnehållet från ett Word-dokument och spara det som en ren textfil. Att konvertera Word till TXT i Java är en enkel uppgift som kan utföras med hjälp av Aspose.Words för Java-biblioteket. Så nästa gång du behöver konvertera ett Word-dokument till ren text kan du använda kodexemplet ovan som en startapplikation. Vid eventuella oklarheter, tveka inte att kontakta oss på vårt gratis supportforum.