W tym artykule opisano, jak konwertować dokumenty programu Word DOC DOCX na HTML lub MHTML przy użyciu języka C# lub VB.NET. Aspose.Words for .NET API może być użyte do wykonania tej konwersji w dość łatwy sposób. Konwersja dokumentów programu Microsoft Word jest popularnym przypadkiem użycia, dlatego interfejs API obsługuje różne opcje. Możesz rzucić okiem na nagłówki omówione w tym artykule:
- API C# Word (DOC/DOCX) do HTML lub MHTML Converter
- Konwertuj Word DOC lub DOCX na stronę HTML w C#
- Word do HTML z informacjami w obie strony w C#
- Konwertuj Word DOC lub DOCX na MHTML w C#
C# Word to HTML lub interfejs API konwertera MHTML
Aspose.Words for .NET API jest specjalnie zaprojektowany do pracy z formatami plików obsługiwanymi przez Microsoft Word. Możesz przekonwertować plik DOCX lub DOC do formatu pliku HTML lub MHTML, pobierając API z sekcji New Releases lub instalując go z NuGet za pomocą poniższego polecenia:
Install-Package Aspose.Words -Version 20.9.0
Konwertuj Word DOC lub DOCX na HTML w C#
Możesz wydajnie przekonwertować dokument Word (DOC/DOCX) na stronę internetową HTML programowo w aplikacjach .NET przy użyciu C# lub VB.NET. Aby przeprowadzić konwersję, wykonaj poniższe czynności:
- Załaduj wejściowy dokument tekstowy DOCX
- Zainicjuj instancję HtmlSaveOptions
- Zapisz wyjściowy plik HTML
Poniższy fragment kodu wykonuje te kroki i pokazuje, jak przekonwertować DOC/DOCX na HTML przy użyciu C# lub VB.NET:
// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File.docx");
// Ustaw HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;
// Zapisz dokument w formacie HTML
doc.Save(dataDir + "Document.html", options);
Konwertuj Word DOC lub DOCX na HTML z informacjami w obie strony w C#
Niektóre dodatkowe informacje są zapisywane podczas konwersji programu Word na format HTML. Jest to znane jako informacja zwrotna i jest przydatna w scenariuszach, w których przekonwertowany plik HTML jest ponownie renderowany jako dokument Word. Możesz wykonać następujące kroki, aby przekonwertować DOC/DOCX na HTML przy użyciu C#:
- Załaduj dokument słowa wejściowego
- Ustaw ExportRoundtripInformation na true
- Zapisz wyjściowy plik HTML
Poniższy fragment kodu wyjaśnia, jak przekonwertować plik Word DOC/DOCX do formatu HTML z informacjami w obie strony przy użyciu języka C# lub VB.NET:
// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File (doc).docx");
HtmlSaveOptions options = new HtmlSaveOptions();
// HtmlSaveOptions.ExportRoundtripInformation określa właściwość
// Czy zapisywać informacje o obie strony podczas zapisywania w formacie HTML, MHTML lub EPUB.
// Wartość domyślna to prawda dla HTML i fałsz dla MHTML i EPUB.
options.ExportRoundtripInformation = true;
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
Konwertuj Word DOC lub DOCX na MHTML w C#
Warto wspomnieć o formacie pliku MHTML, gdy potrzebny jest pojedynczy plik HTML z osadzonymi obrazami i czcionkami. Możesz przekonwertować dokument Word (DOC/DOCX) na MHTML, wykonując poniższe czynności:
- Załaduj źródłowy plik DOC/DOCX
- Ustaw ZapiszFormat na MHTML
Poniższy fragment kodu pokazuje, jak przekonwertować dokument tekstowy (DOC/DOCX) na MHML przy użyciu języka C# lub VB.NET:
// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File.docx");
// Ustaw HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;
// Zapisz dokument w formacie MHTML
doc.Save(dataDir + "Document.mhtml", options);
Wniosek
W tym artykule omówiliśmy, jak konwertować dokumenty Word do plików HTML lub MHTML w języku C# bez konieczności instalowania aplikacji Microsoft Word. Ponadto nauczyłeś się na przykładach i szczegółowych krokach, aby wywołać wywołania API w celu eksportowania dokumentów Word do wymaganych formatów plików. Dodatkowo możesz zajrzeć do API references i Documentation. Co więcej, możesz do nas odpisać i zapytać o wszystko na Free Support Forum.