Konwertuj Word DOC na TXT w C#

W dziedzinie przetwarzania dokumentów często pojawia się potrzeba konwersji dokumentów programu Word na prostsze formaty zwykłego tekstu. Niezależnie od tego, czy chodzi o ekstrakcję danych, analizę zawartości czy kompatybilność, możliwość konwertowania plików programu Word (.doc, .docx) na zwykły tekst (.txt) jest cenną umiejętnością dla programistów. W tym poście na blogu przyjrzymy się, jak przekonwertować dokument programu Word do formatu TXT w aplikacji C#.

Biblioteka C# do konwersji Worda na TXT

Aspose.Words for .NET to bogata w funkcje biblioteka do przetwarzania dokumentów, która umożliwia programistom pracę z dokumentami programu Word w różnych formatach. Zapewnia zestaw interfejsów API do tworzenia, manipulacji, konwersji i renderowania dokumentów. Będziemy używać tej biblioteki do wyodrębniania treści z dokumentów programu Word w postaci zwykłego tekstu.

Aby zainstalować bibliotekę z NuGet, możesz użyć następującego polecenia. Możesz też pobrać go z sekcji Wydania.

PM> Install-Package Aspose.Words 

Kroki, aby przekonwertować Word DOC na TXT

Możesz wyodrębnić tekst z dokumentów Worda i zapisać go w formacie TXT w kilku krokach, ponieważ Aspose.Words for .NET bardzo to ułatwił. Poniżej znajdują się kroki, które musimy wykonać, aby przekonwertować Word na TXT.

  • Załaduj plik Word DOC/DOCX.
  • Przekonwertuj go na format TXT i zapisz plik w wybranej lokalizacji.

Nie musisz więc analizować całego dokumentu programu Word i wyodrębniać tekstu wiersz po wierszu lub strona po stronie. Napiszmy teraz kod C#, aby wyodrębnić tekst z dokumentu programu Word.

Konwertuj dokument Word DOC na TXT w języku C#

Poniżej przedstawiono kroki, aby zapisać dokument Word DOC lub DOCX jako plik TXT w języku C#.

  • Najpierw załaduj Word DOC/DOCX przy użyciu klasy Document.
  • Następnie zapisz dokument jako plik TXT przy użyciu metody Document.Save(filePath).

Poniższy fragment kodu C# konwertuje dokument programu Word do formatu TXT.

// Załaduj plik Worda
Document doc = new Document("document.docx");

// Zapisz dokument jako plik TXT
doc.Save("doc-to-text.txt");

Skorzystaj z darmowego konwertera C# Word na TXT

Możesz uzyskać bezpłatną licencję tymczasową na konwersję plików Word do formatu TXT bez ograniczeń ewaluacyjnych.

Poznaj bibliotekę słów C#

Możesz odwiedzić dokumentację biblioteki C# Word, aby poznać inne funkcje. Jeśli masz jakieś pytania, daj nam znać za pośrednictwem naszego forum.

Wniosek

W tym poście na blogu omówiliśmy, jak konwertować dokumenty programu Word na pliki TXT w języku C# przy użyciu Aspose.Words for .NET. Nie ma potrzeby analizowania całych dokumentów programu Word, wystarczy w kilku krokach wyodrębnić zwykły tekst z dokumentu. Aspose.Words upraszcza proces programowej pracy z dokumentami Word, zapewniając niezawodne i wydajne rozwiązanie do zadań konwersji dokumentów. Integracja tej biblioteki z projektami C# umożliwia łatwą obsługę przetwarzania dokumentów, otwierając świat możliwości dla Twoich aplikacji.

Zobacz też