Format HTML jest popularny, ponieważ jest obsługiwany w prawie wszystkich środowiskach komputerowych. Konwersja WORD do HTML lub MHTML jest pomocna w sytuacjach, gdy trzeba wyświetlić taki plik w aplikacji internetowej używającej C++. Aspose.Words for C++ API to najlepszy wybór ze względu na swoje funkcje i wydajność. Możesz wzbogacić swoje aplikacje C++ o możliwość konwersji plików Microsoft Word (DOC/DOCX) do formatu HTML lub MHTML. Poniżej znajduje się zarys tego artykułu, w którym szczegółowo omówimy konwersję programu Word:
- C++ Microsoft Word Files Converter API – instalacja
- Konwertuj Word na HTML za pomocą C++
- Konwertuj Word na HTML z osadzonymi czcionkami przy użyciu C++
- Konwertuj Word na HTML z informacjami w obie strony w C++
- Konwertuj Worda na MHTML w C++
C++ Microsoft Word Files Converter API – instalacja
Musimy zainstalować Aspose.Words for C++ API do konwersji plików Microsoft Word (DOCX/DOC). Możesz łatwo zainstalować interfejs API z galerii NuGet lub zainstalować go za pomocą następującego polecenia w konsoli.
Install-Package Aspose.Words.Cpp -Version 20.8.0
Konwertuj Word (DOCX/DOC) na HTML przy użyciu C++
Konwersja Worda na HTML jest pomocna, gdy chcesz renderować zawartość w celu wyświetlenia jej w przeglądarce. Twoje aplikacje C++ mogą szybko przeprowadzić konwersję, wykonując następujące czynności:
- Załaduj źródłowy plik tekstowy
- Zapisz dokument w formacie HTML
Poniższy kod pokazuje, jak przekonwertować słowo na HTML za pomocą C++:
// Załaduj dokument z
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Zapisz dokument Word w formacie HTML
doc->Save(u"Document_out.html", SaveFormat::Html);
Konwertuj Word na HTML z osadzonymi czcionkami przy użyciu C++
Plik tekstowy (DOCX/DOC) może zawierać niestandardową czcionkę, która może nie być obsługiwana na niektórych platformach. W takich przypadkach czcionka w wynikach wyjściowych może wyglądać na zniekształconą. Jednak Aspose.Words for C++ API umożliwia osadzenie zasobów czcionek w HTML przy użyciu kodowania Base64. Możesz ustawić właściwość ExportFontsAsBase64, która osadza czcionki w wyjściowym pliku HTML. Aby spełnić te wymagania, wykonaj poniższe czynności:
- Załaduj źródłowy plik DOCX
- Ustaw właściwość ExportFontsAsBase64.
- Zapisz wyjściowy plik HTML
Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format HTML z czcionkami osadzonymi przy użyciu języka C++:
// Załaduj źródłowy plik DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");
// Zainicjuj obiekt HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Zapisz wyjściowy kod HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Co więcej, jeśli edytujesz plik HTML za pomocą Notatnika lub widzisz kod źródłowy w przeglądarce, możesz zauważyć osadzone w pliku czcionki Base64. Poniższy zrzut ekranu pokazuje przykład z wyjściowego pliku HTML:
Konwertuj Word na HTML z informacjami w obie strony w C++
Dokumenty programu Microsoft Word mogą zawierać wiele informacji i funkcji, które w innym przypadku nie są obsługiwane w formacie pliku HTML. Czasami trzeba przekonwertować Word na HTML, a następnie z powrotem na format Word. Aby zapewnić maksymalną wierność między tymi konwersjami, niektóre informacje, zwane „informacjami w obie strony”, mogą być dodatkowo zapisywane przez API Aspose.Words for C++. Wykonajmy następujące kroki, aby przetestować taką konwersję:
- Załaduj źródłowy plik DOCX
- Ustaw ExportRoundtripInformation na true
- Zapisz wyjściowy plik HTML
Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format HTML z informacjami w obie strony przy użyciu języka C++:
// Załaduj wejściowy plik DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");
// Ustaw HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Zapisz wyjściowy plik HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Konwertuj Worda na MHTML w C++
Format pliku MHTML jest popularny, ponieważ zawiera całą zawartość w jednym pliku wyjściowym. Możesz przekonwertować plik Word (DOCX/DOC) do formatu MHTML za pomocą C++, wykonując następujące czynności:
- Załaduj źródłowy plik DOCX
- Zapisz dane wyjściowe w formacie MHTML
Poniższy fragment kodu pokazuje, jak przekonwertować program Word na format MHTML przy użyciu języka C++:
// Załaduj dokument do Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Zapisz dane wyjściowe w formacie MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);
Wniosek
Nauczyliśmy się konwertować Word (DOCX/DOC) do HTML lub MHTML z różnymi opcjami. Szczegółowo omówiono również kilka funkcji, takich jak zapisywanie informacji o podróży w obie strony lub osadzanie czcionek jako zasobów Base64. Jednak w przypadku jakichkolwiek pytań prosimy o kontakt za pośrednictwem Bezpłatne forum pomocy.