Das HTML Format ist beliebt, da es von fast allen Computerumgebungen unterstützt wird. Die WORD zu HTML oder MHTML-Konvertierung ist in Szenarien hilfreich, z. B. wenn Sie eine solche Datei in einer Webanwendung mit C++ anzeigen müssen. Aspose.Words for C++ API ist aufgrund seiner Funktionen und Effizienz die beste Wahl. Sie können Ihre C++ Anwendungen um die Möglichkeit erweitern, Microsoft Word Dateien (DOC/DOCX) in das HTML oder MHTML Format zu konvertieren. Im Folgenden finden Sie einen Überblick über diesen Artikel, in dem wir die Word-Konvertierung im Detail untersuchen werden:

C++ Microsoft Word Files Converter API – Installation

Wir müssen Aspose.Words für die C++-API zum Konvertieren von Microsoft Word Dateien (DOCX/DOC) installieren. Sie können die API ganz einfach aus der NuGet-Galerie oder mit dem folgenden Befehl in der Konsole installieren.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Konvertieren Sie Word (DOCX/DOC) mit C++ in HTML

Die Word zu HTML-Konvertierung ist hilfreich, wenn Sie Inhalte rendern möchten, um sie in einem Browser anzuzeigen. Ihre C++ Anwendungen können die Konvertierung schnell mit den folgenden Schritten durchführen:

  1. Quellwortdatei laden
  2. Speichern Sie das Dokument im HTML-Format

Der folgende Code zeigt, wie Word mit C++ in HTML konvertiert wird:

// Laden Sie das Dokument aus
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Speichern Sie das Word Dokument im HTML-Format
doc->Save(u"Document_out.html", SaveFormat::Html);

Konvertieren Sie Word in HTML mit eingebetteten Schriftarten mit C++

Eine Word Datei (DOCX/DOC) kann einige benutzerdefinierte Schriftarten enthalten, die möglicherweise auf einigen Plattformen nicht unterstützt werden. In solchen Fällen kann die Schriftart in den Ausgabeergebnissen verstümmelt erscheinen. Mit Aspose.Words for C++ API können Sie die Schriftartressourcen jedoch mithilfe der Base64-Codierung in HTML einbetten. Sie können die ExportFontsAsBase64-Eigenschaft festlegen, die Schriftarten in die Ausgabe HTML Datei einbettet. Sie müssen die folgenden Schritte ausführen, um diese Anforderungen zu erfüllen:

  1. Quell-DOCX Datei laden
  2. Legen Sie die Eigenschaft ExportFontsAsBase64 fest
  3. Speichern Sie die ausgegebene HTML Datei

Das folgende code snippet zeigt, wie Sie Word mit eingebetteten Schriftarten mit C++ in HTML konvertieren:

// Quell-DOCX Datei laden
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Initialisiert das HtmlSaveOptions objekt
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Ausgabe HTML speichern
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Wenn Sie die HTML Datei mit Notepad bearbeiten oder den Quellcode in einem Browser anzeigen, können Sie außerdem die in die Datei eingebetteten Base64-Schriftarten bemerken. Der folgende Screenshot zeigt ein Beispiel aus der ausgegebenen HTML Datei:

Konvertieren Sie Word in HTML

Konvertieren Sie Word in HTML mit Round-Trip-Informationen in C++

Microsoft Word Dokumente können viele Informationen und Funktionen enthalten, die ansonsten im HTML Dateiformat nicht unterstützt werden. Manchmal müssen Sie Word in HTML und dann wieder zurück in das Word Format konvertieren. Um eine maximale Genauigkeit zwischen diesen Konvertierungen zu gewährleisten, können einige Informationen, die als „Roundtrip-Informationen“ bekannt sind, zusätzlich von Aspose.Words für die C++-API gespeichert werden. Lassen Sie uns die folgenden Schritte ausführen, um eine solche Konvertierung zu testen:

  1. Quell-DOCX Datei laden
  2. Setzen Sie ExportRoundtripInformation auf true.
  3. Speichern Sie die ausgegebene HTML Datei

Das folgende code snippet zeigt, wie Sie Word mit Round-Trip-Informationen mithilfe von C++ in HTML konvertieren:

// Eingabe-DOCX Datei laden
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Legen Sie HtmlSaveOptions fest
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Ausgabe HTML Datei speichern        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Konvertieren Sie Word in C++ in MHTML

Das MHTML Dateiformat ist beliebt, da es alle Inhalte in einer einzigen Ausgabedatei enthält. Sie können Word Dateien (DOCX/DOC) mithilfe von C++ mit den folgenden Schritten in das MHTML Format konvertieren:

  1. Quell-DOCX Datei laden
  2. Ausgabe im MHTML Format speichern

Das folgende code snippet zeigt, wie Sie Word mit C++ in MHTML konvertieren:

// Laden Sie das Dokument in Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Ausgabe im MHTML Format speichern.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Fazit

Wir haben gelernt, wie man Word (DOCX/DOC) mit verschiedenen Optionen in HTML oder MHTML konvertiert. Einige Funktionen wie das Speichern von Roundtrip-Informationen oder das Einbetten von Schriftarten als Base64-Ressourcen werden ebenfalls ausführlich besprochen. Bei Fragen können Sie sich jedoch gerne über das kostenlose Support-Forum an uns wenden.

Siehe auch