Format HTML jest popularny, ponieważ jest obsługiwany w prawie wszystkich środowiskach komputerowych. Konwersja WORD do HTML lub MHTML jest pomocna w sytuacjach, gdy trzeba wyświetlić taki plik w aplikacji internetowej używającej C++. Aspose.Words for C++ API to najlepszy wybór ze względu na swoje funkcje i wydajność. Możesz wzbogacić swoje aplikacje C++ o możliwość konwersji plików Microsoft Word (DOC/DOCX) do formatu HTML lub MHTML. Poniżej znajduje się zarys tego artykułu, w którym szczegółowo omówimy konwersję programu Word:

C++ Microsoft Word Files Converter API – instalacja

Musimy zainstalować Aspose.Words for C++ API do konwersji plików Microsoft Word (DOCX/DOC). Możesz łatwo zainstalować interfejs API z galerii NuGet lub zainstalować go za pomocą następującego polecenia w konsoli.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Konwertuj Word (DOCX/DOC) na HTML przy użyciu C++

Konwersja Worda na HTML jest pomocna, gdy chcesz renderować zawartość w celu wyświetlenia jej w przeglądarce. Twoje aplikacje C++ mogą szybko przeprowadzić konwersję, wykonując następujące czynności:

  1. Załaduj źródłowy plik tekstowy
  2. Zapisz dokument w formacie HTML

Poniższy kod pokazuje, jak przekonwertować słowo na HTML za pomocą C++:

// Załaduj dokument z
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Zapisz dokument Word w formacie HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Konwertuj Word na HTML z osadzonymi czcionkami przy użyciu C++

Plik tekstowy (DOCX/DOC) może zawierać niestandardową czcionkę, która może nie być obsługiwana na niektórych platformach. W takich przypadkach czcionka w wynikach wyjściowych może wyglądać na zniekształconą. Jednak Aspose.Words for C++ API umożliwia osadzenie zasobów czcionek w HTML przy użyciu kodowania Base64. Możesz ustawić właściwość ExportFontsAsBase64, która osadza czcionki w wyjściowym pliku HTML. Aby spełnić te wymagania, wykonaj poniższe czynności:

  1. Załaduj źródłowy plik DOCX
  2. Ustaw właściwość ExportFontsAsBase64.
  3. Zapisz wyjściowy plik HTML

Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format HTML z czcionkami osadzonymi przy użyciu języka C++:

// Załaduj źródłowy plik DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Zainicjuj obiekt HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Zapisz wyjściowy kod HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Co więcej, jeśli edytujesz plik HTML za pomocą Notatnika lub widzisz kod źródłowy w przeglądarce, możesz zauważyć osadzone w pliku czcionki Base64. Poniższy zrzut ekranu pokazuje przykład z wyjściowego pliku HTML:

Konwertuj Worda na HTML

Konwertuj Word na HTML z informacjami w obie strony w C++

Dokumenty programu Microsoft Word mogą zawierać wiele informacji i funkcji, które w innym przypadku nie są obsługiwane w formacie pliku HTML. Czasami trzeba przekonwertować Word na HTML, a następnie z powrotem na format Word. Aby zapewnić maksymalną wierność między tymi konwersjami, niektóre informacje, zwane „informacjami w obie strony”, mogą być dodatkowo zapisywane przez API Aspose.Words for C++. Wykonajmy następujące kroki, aby przetestować taką konwersję:

  1. Załaduj źródłowy plik DOCX
  2. Ustaw ExportRoundtripInformation na true
  3. Zapisz wyjściowy plik HTML

Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format HTML z informacjami w obie strony przy użyciu języka C++:

// Załaduj wejściowy plik DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Ustaw HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Zapisz wyjściowy plik HTML        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Konwertuj Worda na MHTML w C++

Format pliku MHTML jest popularny, ponieważ zawiera całą zawartość w jednym pliku wyjściowym. Możesz przekonwertować plik Word (DOCX/DOC) do formatu MHTML za pomocą C++, wykonując następujące czynności:

  1. Załaduj źródłowy plik DOCX
  2. Zapisz dane wyjściowe w formacie MHTML

Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format MHTML przy użyciu języka C++:

// Załaduj dokument do Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Zapisz dane wyjściowe w formacie MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Wniosek

Nauczyliśmy się konwertować Word (DOCX/DOC) do HTML lub MHTML z różnymi opcjami. Szczegółowo omówiono również kilka funkcji, takich jak zapisywanie informacji o podróży w obie strony lub osadzanie czcionek jako zasobów Base64. Jednak w przypadku jakichkolwiek pytań prosimy o kontakt za pośrednictwem Bezpłatne forum pomocy.

Zobacz też