Konwertuj Word na TXT w Javie | DOCX do TXT | Słowo Java na tekst

W niektórych przypadkach może być konieczne wyeksportowanie danych z jednego formatu do innego. Jednym z typowych wymagań jest konwersja dokumentów Word (DOC lub DOCX) na pliki zwykłego tekstu (TXT).W tym artykule dowiemy się, jak przekonwertować Word na TXT za pomocą biblioteki Java Word to Text Converter.

W tym artykule poruszono następujące tematy:

Biblioteka konwertera słów na tekst Java

Aspose.Words for Java to potężna biblioteka dla programistów, którzy muszą pracować z dokumentami w swoich programach Java. Umożliwia programistom tworzenie, edytowanie i konwertowanie dokumentów programowo w aplikacjach Java. Można o nim myśleć jak o zestawie narzędzi do pracy z dokumentami bez konieczności używania programu Microsoft Word. Będziemy używać tej biblioteki do konwersji dokumentów Worda na zwykłe pliki tekstowe. Wykorzystując bibliotekę Aspose.Words for Java, możemy bez wysiłku konwertować pliki DOC lub DOCX do formatu TXT, co pozwala nam wyodrębnić tekst z dokumentu Word i zapisać go jako prosty plik tekstowy.

Proszę pobierz plik JAR interfejsu API lub dodaj następującą konfigurację pom.xml w aplikacji Java opartej na Maven.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Kroki, aby przekonwertować Word DOC na TXT

Możemy wyeksportować tekst z dokumentów Word i zapisać go w formacie TXT, wykonując proste kroki podane poniżej:

  • Załaduj plik Word DOC/DOCX.
  • Przekonwertuj go na format TXT.
  • Zapisz plik w wybranej lokalizacji.

Nie musimy ręcznie przetwarzać całego dokumentu programu Word wiersz po wierszu lub strona po stronie; możemy wykorzystać biblioteki Java do wydajnego wyodrębniania zawartości tekstowej. Przyjrzyjmy się, jak to osiągnąć w Javie.

Konwertuj plik Word DOC na TXT w Javie

Możemy łatwo przekonwertować dokument Word (DOC lub DOCX) na plik TXT w Javie, wykonując poniższe kroki:

  • Najpierw załaduj Word DOC/DOCX przy użyciu klasy Document.
  • Następnie zapisz dokument jako plik TXT przy użyciu metody Document.save(filePath).

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument programu Word na format TXT w języku Java.

// Ten przykład kodu demonstruje, jak zapisać plik DOCX jako TXT
// Załaduj plik Worda
Document doc = new Document("D:\\Files\\document.docx");

// Zapisz dokument jako plik TXT
doc.save("D:\\Files\\doc-to-text.txt");
Konwertuj plik Word DOC na TXT w Javie

Konwertuj plik Word DOC na TXT w Javie

Zdobądź bezpłatną licencję

Możesz uzyskać bezpłatną licencję tymczasową na konwersję plików Word do formatu TXT bez ograniczeń ewaluacyjnych.

Konwertuj Word na TXT online

Możesz także skorzystać z bezpłatnego Konwertera słowa na tekst, aby przekonwertować DOCX na TXT online. Eksportuj zawartość tekstową z dokumentów programu Word do formatu zwykłego tekstu szybko, z wysoką jakością i dokładnością.

DOCX do TXT – bezpłatne zasoby

Oprócz konwersji plików DOC lub DOCX do formatu TXT, odblokuj pełny potencjał Aspose.Words for Java. Poznaj zaawansowane funkcje, takie jak tworzenie, edytowanie, zarządzanie i konwertowanie dokumentów i nie tylko, korzystając z następujących zasobów:

Wniosek

W tym poście na blogu nauczyliśmy się konwertować program Word na tekst, wyodrębniając zawartość tekstową z dokumentu programu Word i zapisując ją jako zwykły plik tekstowy. Konwersja Worda na TXT w Javie to proste zadanie, które można wykonać za pomocą biblioteki Aspose.Words for Java. Zatem następnym razem, gdy będziesz musiał przekonwertować dokument programu Word na zwykły tekst, możesz użyć przykładowego kodu podanego powyżej jako aplikacji startowej. W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym bezpłatnym forum pomocy technicznej.

Zobacz też