Konwertuj Word DOC DOCX na HTML MHTML

W tym artykule opisano, jak konwertować dokumenty programu Word DOC DOCX na HTML lub MHTML przy użyciu języka C# lub VB.NET. Aspose.Words for .NET API może być użyte do wykonania tej konwersji w dość łatwy sposób. Konwersja dokumentów programu Microsoft Word jest popularnym przypadkiem użycia, dlatego interfejs API obsługuje różne opcje. Możesz rzucić okiem na nagłówki omówione w tym artykule:

C# Word to HTML lub interfejs API konwertera MHTML

Aspose.Words for .NET API jest specjalnie zaprojektowany do pracy z formatami plików obsługiwanymi przez Microsoft Word. Możesz przekonwertować plik DOCX lub DOC do formatu pliku HTML lub MHTML, pobierając API z sekcji New Releases lub instalując go z NuGet za pomocą poniższego polecenia:

Install-Package Aspose.Words -Version 20.9.0

Konwertuj Word DOC lub DOCX na HTML w C#

Możesz wydajnie przekonwertować dokument Word (DOC/DOCX) na stronę internetową HTML programowo w aplikacjach .NET przy użyciu C# lub VB.NET. Aby przeprowadzić konwersję, wykonaj poniższe czynności:

  1. Załaduj wejściowy dokument tekstowy DOCX
  2. Zainicjuj instancję HtmlSaveOptions
  3. Zapisz wyjściowy plik HTML

Poniższy fragment kodu wykonuje te kroki i pokazuje, jak przekonwertować DOC/DOCX na HTML przy użyciu C# lub VB.NET:

// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File.docx");

// Ustaw HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Zapisz dokument w formacie HTML
doc.Save(dataDir + "Document.html", options);

Konwertuj Word DOC lub DOCX na HTML z informacjami w obie strony w C#

Niektóre dodatkowe informacje są zapisywane podczas konwersji programu Word na format HTML. Jest to znane jako informacja zwrotna i jest przydatna w scenariuszach, w których przekonwertowany plik HTML jest ponownie renderowany jako dokument Word. Możesz wykonać następujące kroki, aby przekonwertować DOC/DOCX na HTML przy użyciu C#:

  1. Załaduj dokument słowa wejściowego
  2. Ustaw ExportRoundtripInformation na true
  3. Zapisz wyjściowy plik HTML

Poniższy fragment kodu wyjaśnia, jak przekonwertować plik Word DOC/DOCX do formatu HTML z informacjami w obie strony przy użyciu języka C# lub VB.NET:

// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// HtmlSaveOptions.ExportRoundtripInformation określa właściwość
// Czy zapisywać informacje o obie strony podczas zapisywania w formacie HTML, MHTML lub EPUB.
// Wartość domyślna to prawda dla HTML i fałsz dla MHTML i EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Konwertuj Word DOC lub DOCX na MHTML w C#

Warto wspomnieć o formacie pliku MHTML, gdy potrzebny jest pojedynczy plik HTML z osadzonymi obrazami i czcionkami. Możesz przekonwertować dokument Word (DOC/DOCX) na MHTML, wykonując poniższe czynności:

  1. Załaduj źródłowy plik DOC/DOCX
  2. Ustaw ZapiszFormat na MHTML

Poniższy fragment kodu pokazuje, jak przekonwertować dokument tekstowy (DOC/DOCX) na MHML przy użyciu języka C# lub VB.NET:

// Załaduj dokument z dysku.
Document doc = new Document(dataDir + "Test File.docx");

// Ustaw HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Zapisz dokument w formacie MHTML
doc.Save(dataDir + "Document.mhtml", options);

Wniosek

W tym artykule omówiliśmy, jak konwertować dokumenty Word do plików HTML lub MHTML w języku C# bez konieczności instalowania aplikacji Microsoft Word. Ponadto nauczyłeś się na przykładach i szczegółowych krokach, aby wywołać wywołania API w celu eksportowania dokumentów Word do wymaganych formatów plików. Dodatkowo możesz zajrzeć do API references i Documentation. Co więcej, możesz do nas odpisać i zapytać o wszystko na Free Support Forum.

Zobacz też