HTML-format är populärt eftersom det stöds i nästan alla datormiljöer. WORD till HTML- eller MHTML-konvertering är användbart i scenarier som när du behöver visa en sådan fil i en webbapplikation med C++. Aspose.Words för C++ API är det bästa valet på grund av dess funktioner och effektivitet. Du kan berika dina C++-applikationer med möjligheten att konvertera Microsoft Word-filer (DOC/DOCX) till HTML- eller MHTML-format. Följande är en översikt över den här artikeln där vi kommer att utforska Word-konvertering i detalj:

C++ Microsoft Word Files Converter API – Installation

Vi måste installera Aspose.Words för C++ API för att konvertera Microsoft Word-filer (DOCX/DOC). Du kan enkelt installera API:t från galleriet NuGet eller installera det med följande kommando på konsolen.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Konvertera Word (DOCX/DOC) till HTML med C++

Word till HTML-konvertering är användbart när du vill rendera innehåll för att visa det i en webbläsare. Dina C++-applikationer kan snabbt utföra konverteringen med följande steg:

  1. Ladda källordsfilen
  2. Spara dokumentet i HTML-format

Koden nedan visar hur man konverterar word till HTML med C++:

// Ladda dokumentet från
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Spara Word-dokumentet i HTML-format
doc->Save(u"Document_out.html", SaveFormat::Html);

Konvertera Word till HTML med inbäddade teckensnitt med C++

En word-fil (DOCX/DOC) kan innehålla något anpassat teckensnitt som kanske inte stöds på vissa plattformar. I sådana fall kan teckensnittet verka förvanskat i utdataresultat. Men Aspose.Words för C++ API låter dig bädda in teckensnittsresurserna i HTML med Base64-kodning. Du kan ställa in egenskapen ExportFontsAsBase64 som kommer att bädda in typsnitt i HTML-utdatafilen. Du måste följa stegen nedan för att uppfylla dessa krav:

  1. Ladda käll DOCX-fil
  2. Ställ in egenskapen ExportFontsAsBase64
  3. Spara den utgående HTML-filen

Följande kodavsnitt visar hur man konverterar Word till HTML med inbäddade teckensnitt med C++:

// Ladda käll DOCX-fil
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Initiera HtmlSaveOptions-objektet
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Spara utdata-HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Dessutom, om du redigerar HTML-filen med Notepad, eller ser källkoden i en webbläsare, kan du lägga märke till Base64-teckensnitten inbäddade i filen. Följande skärmdump visar ett exempel från HTML-utdatafilen:

Konvertera Word till HTML

Konvertera Word till HTML med information om tur och retur i C++

Microsoft Word-dokument kan innehålla mycket information och funktioner som annars inte stöds i HTML-filformat. Ibland behöver du konvertera Word till HTML och sedan tillbaka till Word-format. För att säkerställa maximal trohet mellan dessa omvandlingar kan viss information, känd som “rundtursinformation” sparas ytterligare av Aspose.Words för C++ API. Låt oss följa följande steg för att testa en sådan konvertering:

  1. Ladda käll DOCX-fil
  2. Ställ in ExportRoundtripInformation till true
  3. Spara den utgående HTML-filen

Kodavsnittet nedan visar hur man konverterar Word till HTML med information om tur och retur med C++:

// Ladda indata DOCX-fil
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Ställ in HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Spara utdata HTML-fil        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Konvertera Word till MHTML i C++

MHTML-filformat är populärt eftersom det innehåller allt innehåll i en enda utdatafil. Du kan konvertera Word-fil (DOCX/DOC) till MHTML-format med C++ med följande steg:

  1. Ladda käll DOCX-fil
  2. Spara utdata i MHTML-format

Kodavsnittet nedan visar hur man konverterar Word till MHTML med C++:

// Ladda dokumentet i Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Spara utdata i MHTML-format.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Slutsats

Vi har lärt oss hur man konverterar Word (DOCX/DOC) till HTML eller MHTML med olika alternativ. Flera funktioner som att spara information om tur och retur eller bädda in typsnitt som Base64-resurser diskuteras också i detalj. Men om du har några frågor är du välkommen att kontakta oss via Free Support Forum.

Se även